프로덕션을 위한 MLOps를 위한 글로벌 기업들의 시행착오를 한 데 모았어요!
글로벌 기업의 CTO, 엔지니어 등의 전문가가 목차별로 모아둔 '프로덕션을 위한 ML시스템 설계 Must Read' 리스트가 공개되었습니다. MLOps 와 관련하여 한국의 많은 실무자들이 참고로 하는 기업인 Uber, Airbnb, Netflix, Twitter 등이 대거 포함되었네요! 📑보러가기
틱톡 추천 알고리즘의 비밀 🤐
내부 알고리즘 팀이 작성한 TikTok Algo 101 문서를 뉴욕타임즈가 입수하여 일부 공개했습니다. 틱톡은 짧은 영상을 매개로 하기에 단기간에 더 많은 데이터를 쌓을 수 있는데 이는 비즈니스의 목표인 'DAU 높이기'에 사용됩니다. 이 목표에 가장 중요하게 여겨지는 요소가 앱 사용시간과 리텐션이었죠. 머신러닝 예측과 사용자의 세 가지 행동데이터(좋아요, 댓글, 재생 시간)를 합산하여, 가장 높은 점수를 받은 비디오를 사용자에게 보여주고 이미 보여준 비디오에는 패널티를 주는 식의 알고리즘이 작동하고 있었습니다. 틱톡에 대한 여러 우려가 많지만, 이 문서를 검토한 교수는 그들의 알고리즘이 totally reasonable, but traditional한 공식이라고 답했습니다. 📑전문읽기
PyTorch vs TensorFlow in 2022
모델의 가용성, 배포 인프라, 그리고 생태계의 크기를 중점으로 PyTorch 와 TensorFlow를 집중 비교분석 했습니다. 📑전문읽기
Mislabeled 데이터셋 가려내기🔎
PR12 논문읽기 모임에서 올려주신 귀한 한글로 된 자료입니다. 벤치마크 데이터셋에서 어떻게 잘못 라벨링된 데이터셋을 찾을 수 있는지에 대한 방법론을 연구한 논문을 읽어주셨는데요. the Area Under the Margin Ranking를 이용해서 데이터셋을 좀 더 정교화할 수 있었다고 합니다. 👀함께 보러가기
CS224n NLP with Deep Learning 2021 winter☃️강의 오픈 소식!
외부인원의 청강은 어렵지만 자료는 모두 공개되었으니 한 번 살펴보세요. 📑보러가기