[MLOps] LifeCycle
MLOps는 머신러닝 모델의 전체 생애주기를 체계적으로 관리하는 프레임워크입니다. 이를 통해 복잡한 ML 프로젝트를 효율화하고 지속적인 성능 개선을 지원합니다.
개요
머신러닝 프로젝트를 간소화하고 최적화하는 MLOps 라이프사이클을 정리하였습니다. 이를 통해 ML 모델을 반복적으로 개선하고 유지 관리할 수 있도록 구조화된 프레임워크를 제공할 수 있습니다.
MLOps Life cycle
MLOps의 생애주기는 머신러닝 프로세스를 조직하고 효율적으로 운영하는 방법. 즉 머신러닝 모델 구축/배포/유지 뿐만 아니라 데이터 수집, 개발, 배포, 테스트, 모니터링의 파이프라인까지 각 단계를 효율적으로 반복할 수 있도록 구성합니다.
Data Exploration(데이터 탐색)
데이터 큐레이션, 수집, 변환, 검증훈련을 위한 준비 과정입니다.
고품질의 데이터는 성공적인 모델 학습 및 성능의 기반이되는 핵심적인 구성으로 머신러닝 프로젝트의 약 30~40%의 구성을 차지합니다.
ML 모델 구축 단계
데이터가 정제되었다면 머신러닝 모델을 구축합니다
알고리즘을 선택하는 것 뿐만 아니라 , 모델으 훈련하고 최적화를 수행합니다.
ML 테스트 및 개발
프로덕션을 위해 ML 모델을 테스트하고 지속적으로 개선합니다.
교차 검증이나 홀드아웃 테스트같은 방법을 사용하여 모델을 검증합니다. 이를 통해 보이지 않는 데이터에 대한 신뢰성을 확보하며, 프로덕션에 들어가기전 철저한 테스트 수행을 통해 혹시 모를 치명적인 오류를 파악합니다.
ML 모델 운영 및 평가
모델의 정확도, 재현율, 정밀도같은 중요한 지표 수집할 수 있도록 ML 서비스 모니터링을 구성합니다.
원하는 기준을 충족한다면 프로덕션 환경에 배포하여 일관된 성능과 꾸준한 업데이트를 유지할 수 있도록 구성합니다.
