지난 뉴스레터 인사말에서는 곧 장마가 다가온다고 전해드렸던 것 같은데, 이제 장마의 정중앙에 와있는 것 같습니다😂
하반기의 시작은 어떠셨나요? 저는 동료들과 상반기를 회고하고, 하반기에 달성하고자 하는 OKR을 정해 보는 시간을 가졌는데요🎯 저희 슈퍼브에이아이는 OKR 진행 상황에 따라 점수를 매겨 달성 여부에 대해 함께 논의합니다. OKR 달성이라는 것이 정확한 수치로 계산하기는 힘든 지표지만, 큰 목표 안에서 세부적인 계획을 세우고 하나씩 해결해 나가며 점수를 올린답니다🥸
그리고 OKR의 달성 기여 요인과 방해 요인에 대해 논의하면서 지속적으로 OKR에 대한 데이터를 축적해 나가고 있어요. 이러한 과정을 거치며, 쌓아진 데이터로 다음 OKR을 어떻게 재조정해야 할지, 어떤 점을 보완해 나가야 할지 알 수 있죠! 마치 Data-Centric AI 같지 않나요? 데이터 중심 OKR! 🤷조금 억지이지만^^; 저는 그렇다고 생각하고! 제품을 위한 유익한 소식을 더 잘 전달해 드리기 위해 오늘도 정진해 보려고 합니다😋
MLOps는 어떠한 점에서 중요하고, 무슨 이점이 있을까요? MLOps는 ML 모델의 개발, 테스트, 배포, 운영을 효율적으로 관리하는 방법을 제공하며, 개발자들에게 신속하고 안정적인 모델 배포를 가능하게 할 수 있게 합니다. 이 아티클은 MLOps를 마스터하는 방법과 ML 모델 배포를 혁신하기 위한 전체적인 가이드를 제시하는데요.
더 나은 MLOps를 구축하기 위해서는, 아래와 같이 세 가지 단계로 구성하여 핵심 원칙과 구성 요소가 필요하다고 설명합니다.
ML 애플리케이션 설계 : 이 단계에서는 데이터의 수집, 분석, 준비를 진행하고 모델 개발, 학습에 집중이 필요합니다. 이를 통해 ML 기반 애플리케이션을 설계하는 프로세스가 더욱 체계적으로 구조화되고, 데이터에 대한 통찰력 및 요구 사항과 모델 설계 고려 사항을 식별할 수 있습니다. 또한 ML 기능을 애플리케이션 아키텍처에 효과적으로 통합할 수 있습니다.
ML 실험 및 개발 : ML 애플리케이션의 유효성을 확인하는데 집중하기 위해서는 모델의 서빙, 모니터링 그리고 재학습의 과정이 필요합니다. 이를 통해 해결해야 할 문제에 가장 적합한 알고리즘을 찾을 수 있게 되는데요. 모델 검증, 제공 인프라 설정, 성능 모니터링, 재학습 메커니즘의 통합으로 ML 실무자는 개발된 모델이 원하는 표준을 충족하고 실제 시나리오에 배포할 준비가 잘 되었는지 확인하는 과정을 거치게 됩니다.
ML 운영 : ML 운영 단계에서는 제품에서 모델의 테스트, 버전 관리 및 모니터링에 초점을 맞춥니다. CI/CD 파이프라인, 모델 버전 관리, 자동화된 테스트와 같은 요소들을 통해 MLOps를 구현하게 됩니다. 이를 통해 모델 개발과 배포 사이의 간극을 줄이고, 개발 생산성을 향상시킬 수 있습니다.
MLOps를 처음 도입하는 조직에서는 위의 과정들을 통한 여러 ML 모델의 개발 및 프로덕션 환경 배포가 어려울 수 있습니다. 원하는 모델의 성능을 위해 수많은 데이터를 수집하는 과정에서 조직의 요구 사항이 바뀌거나, 현실 데이터가 예측과 일치하지 않아 비즈니스에 대한 정의를 다시 세워야 할 수도 있죠. 그리고 또한 비즈니스 팀, 데이터 사이언티스트, ML 엔지니어가 모두 동일한 툴을 사용하지 않을 수도 있고, 같은 의견을 가지고 있지 않을 수도 있어요.
하지만 위에서 설명한 3가지 단계에서 신뢰할 수 있는 데이터가 준비되었는지, 어떤 비즈니스 프로세스에 어떤 모델이 사용되었는지와 같은 사항을 체계적으로 확인하는 과정들을 거침으로써 MLOps를 지속적으로 개선하고 혁신하여 ML 모델 배포의 효율성과 신뢰성을 높일 수 있을 것이라고 제시합니다. 원문의 더 자세한 가이드 내용을 꼭 한번 읽어보시기 바랍니다🙂
슈퍼브에이아이도 데이터 분석 및 선별과 라벨링 툴을 제공하는 것에서 한 발짝 더 나아가, 모델 분석 및 배포까지 한 플랫폼 안에서 사용하실 수 있도록 Superb Model이라는 제품의 출시를 앞두고 있답니다! 곧 더 발전한 슈퍼브에이아이의 제품 소식을 들고 찾아오겠습니다🙌
Learning & Other Insights🌟
CVPR 2023 Winners🏆
CVPR 2023 Winners 논문이 공개되었습니다! 구독자 여러분도 확인해 보셨나요? 아래 링크에서 함께 보시죠!
JAVA, JSP, SQL을 아는 것만으로 백엔드 개발자가 될 수 있던 시절은 지났습니다! 오늘날 IT 기업에서 백엔드 개발자가 되기 위해서는 알아야 하는 지식들이 굉장히 많은데요! 백엔드 개발을 하시고 싶은 분들이라면 도움이 될 아티클인 것 같습니다👍(저도 미리 알았더라면...!)
총 67개의 스탠포드 AI 관련 강의를 한눈에 확인할 수 있는 링크가 있다?! 일부 AI 강좌에는 비디오도 함께 제공된다고 하는데요. ML, 자연어 처리, 로봇 공학 등 다양한 주제의 강의를 확인할 수 있다고 합니다. 최고의 전문가들이 알려주는 최신 AI 동향! 궁금하지 않으신가요?
MLOps 툴에 대한 포괄적인 가이드를 확인해 보세요! 이 글에서는 오픈 소스를 포함하여 거의 모든 MLOps 및 FMOps(또는 LLMOps) 에코시스템의 핵심 플레이어를 살펴볼 수 있는데요. 또한 주요 기능까지 한눈에 살펴볼 수 있습니다! (저희 슈퍼브에이아이가 빠진 것 같은데요😂)
OpenAI는 API 프로그램에 등록한 모든 사용자에게 GPT-4 API를 공식적으로 출시했습니다. 이 릴리스에는 GPT 3.4 Turbo, DALL-E 및 Whisper도 포함된다고 하는데요. 이제 개발자가 대화형 경험을 만들 수 있도록, 보다 구조화된 프롬프트 인터페이스를 제공하는 Chat Completions API로 이동할 예정이라고 합니다!
지난 5월, 저희 슈퍼브에이아이의 이정권 CTO가 AWS Summit Seoul 2023에서 "스타트업의 빠른 성장, 안정적인 서비스 운영 노하우는?"을 주제로 발표를 했는데요! 드디어 다시 보기 영상으로 확인하실 수 있게 되었습니다! 기계학습 (ML)을 위한 대규모 데이터의 효율적인 관리와 AI 서비스 개발을 도와주는 슈퍼브에이아이의 클라우드 네이티브 노하우를 함께 확인해 보시죠!
수십만 장의 데이터를 분석, 정제하여 학습용 데이터를 선별해야 하는 작업이 주어졌을 때, 여러분은 어떻게 하시나요? Superb Curate에서 원본 데이터의 경향성을 먼저 파악한다면, 의미 있는 데이터만 선별하여 가공할 수 있습니다! 리소스 절감을 위해 슈퍼브 플랫폼에서 Auto-Curate "What to Label"을 실행할 수 있는 간단한 레시피를 지금 바로 살펴보세요!
이번 달 MLOps Insight 어떠셨나요? 여러분의 솔직한 피드백이 필요합니다! 이번호 소감 남기러 가기