슈퍼브에이아이가 전하는 MLOps와 DataOps 소식을 놓치지 마세요.
브라우저에서 보기
newsletter_230110_hk

구독자 여러분 안녕하세요! MLOps Insight 21호로 인사드려요💌

벌써 2023년도 절반이나 지나고, 이제는 장마가 코앞으로 다가왔네요..🌧저는 올해 장마가 유난히 길다는 소식을 듣고 레인부츠를 장만했답니다..😂

 

여러분의 상반기는 어떠셨나요? 저희 슈퍼브에이아이는 지난 5월 2023 AI Expo와 6월 1일-2일 진행된 NextRise 2023에 참가하여, 오프라인으로 여러분을 만나기 위해 모든 팀이 동분서주했었는데요! 하반기에도 새롭고 유용한 제품들로 인사드릴 수 있도록 더욱 힘내보겠습니다! 

구독자 여러분도 올해 상반기 목표하셨던 일이 있으시다면 원활히 마무리하실 수 있길 바랄게요🙏 그럼 오늘도, 다양한 소식들로 채워본 MLOps Insight 시작해 보겠습니다!👍

 

혹시 MLOps Insight를 포워딩 받으셨다면 👉 여기 👈에서 구독하실 수 있습니다! 

*MLOps Insight는 PC버전에 최적화되어 있습니다.

Spotlight🌟

MLOps에서 데이터 버전 관리의 중요성

본 글은 "Data Versioning and its Importance in MLOps: A Comprehensive Guide!"와 "Managing Dataset Versions in Long-Term ML Projects"를 번역 및 편집한 것으로 자세한 내용은 원글을 참고해 주세요.

 

데이터 버전 관리는 MLOps 분야에서 중요한 역할을 합니다. 개발팀이 협업할 때, 코드에 대한 버전 관리를 중요시 생각하는 것처럼 말이죠. 코드 버전 관리와 유사하게 데이터 버전 관리는 서로 다른 시점에서 생성되었거나, 라벨링 된 데이터의 버전을 저장하고 적용하는 작업을 포함할 수 있습니다. 데이터에 대한 버전 관리는 데이터셋의 변화를 추적하고 실험의 재현성을 보장할 수 있는 이점이 있고, 또한 모델의 성능 변화를 이해하는데 도움이 됩니다.

 

프로젝트 진행 도중에 언제든 데이터셋이 추가되거나 수정될 수 있고, 이러한 변경 사항을 효과적으로 관리한다면 어떻게 데이터셋이 진전되어 왔는지, 앞으로는 어떻게 변경/추가하면 더 좋은 성능의 모델을 만들 수 있을지 예측할 수도 있겠죠. 이를 통해 프로젝트의 안정성과 효율성을 향상시킬 수 있습니다.

 

정리해 보자면, 데이터 버전 관리는 다음과 같은 이점을 제공합니다.

  • 추적 가능성(Traceability) : 데이터 버전 관리는 각 실험을 해당 데이터 세트 버전과 연결하여 명확한 감사 추적을 가능하게 합니다. 이 추적성은 데이터 사이언티스트와 이해 관계자가 데이터의 진화와 모델 및 결과에 미치는 영향을 이해하는 데 도움이 됩니다.
  • 공동 작업(Collaboration) : 버전이 지정된 데이터는 팀 간의 공동 작업을 위한 공통 참조 지점을 제공할 뿐만 아니라, MLOps 팀 내에서 원활한 공유와 재현성 및 지식 이전을 가능하게 합니다.
  • 실험(Experimentation) : 데이터 버전 관리는 연구자가 데이터의 이전 버전으로 롤백하여 오류를 조사하고, 여러 반복을 비교하고, 변경 사항이 모델에 미치는 영향을 분석할 수 있도록 하여 효과적인 실험을 용이하게 합니다.

Data-Centric AI를 지향하는 MLOps 팀이라면, 데이터에 대한 유동적인 변동 사항을 보다 효율적으로 추적하여 더 나은 데이터셋 구축하기 위한 데이터 버전 관리를 중요하게 살펴보시기 바랄게요! 저희 슈퍼브에이아이도 데이터 선별/구축/가공에 걸친 전 과정에서 효율적으로 데이터셋을 구축하실 수 있도록 새로운 제품들을 계속 준비하고 있습니다! 곧 유용한 소식을 들고 찾아올게요!

Learning & Other Insights🌟

MLOps - A Comprehensive Guide

이 레포지토리는 MLOps의 필수 요소와 오늘날의 기술 환경에서 MLOps가 중요한 이유를 잘 정리해 놓았는데요! MLOps 분야의 권장 과정, 서적, 논문, 주목할 만한 도구 및 활성 커뮤니티를 비롯한 귀중한 리소스가 가득하답니다?! 지금 바로 확인해 보세요!

Learn More

CVPR 2023과 컴퓨터 비전의 현황 

이 아티클에서는 CVPR 2023에 대한 주요 통계 및 정보와 함께, 컴퓨터 비전의 최신 동향과 함께 상위 10개 논문 목록을 엄선하여 공유합니다! 링크를 통해 확인하세요!

Learn More

OpenML의 최고 등급 언어 모델이 Hugging Face에 등장?!

지난 한 달 동안 관심을 끌었던 중동에서 만들어진 모델이 Hugging Face에 방금 상륙했습니다. Abu Dhabi Tech Innovation Institute의 모델은 한동안 OpenLM 리더보드에서 1위를 차지했다고 하는데요. Apache 2.0 라이선스에서 완전히 오픈소스화되었다고 합니다!

Learn More

한국의 네이버, 최신 ChatGPT와 같은 AI 모델로 외국 정부를 겨냥

마이크로소프트와 구글이 만능 AI 게임을 하는 동안, 네이버는 다른 길을 가려고 하는 것 같습니다! 네이버가 ChatGPT와 유사한 시스템을 외국 정부에게 서비스할 수 있도록 준비 중인데요. 아랍처럼 세계에서 정치적으로 민감한 국가와 스페인 및 멕시코와 같은 비영어권 국가에 초점을 맞춘 현지화된 AI 모델의 맞춤형 버전을 제공할 예정이라고 하네요!

Learn More

Computer Vision: Algorithms and Applications ✨

Richard Szeliski이 쓴 이 책의 2판은, 40년간의 Computer Vision 연구를 통해 얻은 적용 가능한 기술과 실용적인 내용들로 꽉 채워져 있다고 하는데요! 무료 도서로 제공된다고 하니 확인해 보세요!

Learn More

Colab을 통한 무료 AI 기반 코딩💻

Colab에 코드의 완성 및 코드 생성을 위한 자연어와, 심지어 코드 지원 챗봇과 같은 AI 코딩 기능을 추가될 예정이라고 합니다. "Democratizing machine learning for everyone"을 제시하는 점이 흥미롭네요!

Learn More

Superb Insight🌟

컴퓨터 비전에서 데이터 큐레이션을 위해 임베딩을 활용하는 방법

CV 모델이 최상의 성능을 발휘하고 다양한 시나리오에서 일반화되도록 하려면, 관련성 있고 다양하며 대표적인 데이터셋을 신중하게 선별해야 합니다. 하지만 방대한 양의 이미지 데이터를 어떻게 걸러낼 수 있을까요? 슈퍼브에이아이의 Support Engineer인 Samuel Mardirosian의 발표가 궁금하시다면, 지금 바로 웨비나를 신청해 보세요!

Superb AI webinar

컴퓨터 비전 데이터 관리를 위한 임베딩의 미래

컴퓨터 비전 분야에서 일하는 개발자분들에게 임베딩 기술의 미래와 데이터 관리에 대한 인사이트를 제공하기 위해 준비했습니다! 컴퓨터 비전 데이터의 효율적인 관리와 응용을 위해 임베딩 활용 가능성을 탐구하고자 하신다면, 지금 바로 확인해 보세요!

Embeding Store-1
KR-company-news-product-update-bottom-image-02

 이번 달 MLOps Insight 어떠셨나요? 여러분의 솔직한 피드백이 필요합니다!
이번호 소감 남기러 가기

Author: Hyeonji Jeong

Product Advocate at Superb AI 

Let's connect 🤗

image2
Naver Logo1 복사본
LinkedIn
Facebook
Twitter

Copyright © 2023 Superb AI, All rights reserved.

Superb AI Co., Ltd., 13F, 14, Teheran-ro, Gangnam-gu, Seoul 06232, Korea

Superb AI, Inc., 400 Concar Drive, San Mateo, CA 94402, United States

구독 취소