April 2022 | Issue 10
*MLOps Insight๋ฅผ ํน์ ํฌ์๋ฉ ๋ฐ์ผ์ จ๋ค๋ฉด ์ฌ๊ธฐ์์ ๊ตฌ๋ ํ์ค ์ ์์ต๋๋ค.
Superb AI์ ์ฌ๋ฆฌ๋น์์ ๋๋ค. ๐ธ '๋น๋นํ ๋์์ธ ๊ฒฐ์ ์ ์ํ 9๊ฐ์ง ๋ฐฉ๋ฒ'๐์ด๋ผ๋ ์ฑ ์์ ๊ด์ฐฎ์ ๋์์ด๋์ ํ๋ฅญํ ๋์์ด๋์ ์ฐจ์ด๋ ๋ค๋ฅธ ์ฌ๋์ด ํ์ ์ ๊ฐ๊ณ , ๋์ํ๋ฉฐ, ๋ค์ ์ ์ฐจ๋ก ๋์๊ฐ๊ฒ๋ ์ง์งํ๋๋ก, ๋์์ธ์ด ์ด๋ป๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋์ง ์ ํํํ๋ ๋ฅ๋ ฅ์์ ์จ๋ค๊ณ ํ๋๋ฐ์. ์ด๋ค ์ง๋ฌด์ ์๋ ์ด๋ฐ ์์ฌ์ํต ๋ฅ๋ ฅ์ ์ค์ํ๋ค๋ ์๊ฐ์ด ๋ญ๋๋ค. ๐ฌ ์ดํด๊ด๊ณ์๋ค์ด ์ด๋ค ์๊ฐ์ ํ๊ณ , ์ ๊ทธ๋ ๊ฒ ํ๋ํ๋์ง ํ์ ํ๋ฉฐ, ์์งํ ์ ๋ณด๋ค์ ๋ชจ๋์๊ฒ ์ ์ฉํ ํํ๋ก ํ์ฉํ ์ ์์ด์ผ ํ์ฃ . ์ ๊ฐ ๋ง๋ฌ๋ ์ด๋ค ML ์ค๋ฌด์๋, ๊ฐ๋์ ๋ด๊ฐ ์์ง๋์ด์ธ์ง ์๋๋ฉด ์ค๋ํ๋ ์ผ์ด ์ฃผ ์ ๋ฌด์ธ์ง ํท๊ฐ๋ฆฌ๊ธฐ๋ ํ๋ค๊ณ ํ์ จ๋๋ฐ์. ํญ์ ํจ๊ป ์ผํ๋ ์๋๊ฐ '์ฌ๋' ์์ ์์ง๋ง๊ณ , ์๋ก ๋ค๋ฅธ ์ ์ฅ์ ์กด์คํ๋ฉฐ ๊ณต๋์ ๋ชฉํ๋ฅผ ํฅํด ๋ฌ๋ ค๊ฐ๊ณ ์์์ ์ค๊ฐ ์ค๊ฐ ์๊ธฐํ๋ ๊ฒ์ด ์ค์ํ ๊ฒ ๊ฐ์ต๋๋ค. ์ด๋ฒ ํ ์ฃผ๋ ๋๋ฃ์์ ๊ธ์ ์ ์ธ ํ์ ๊ฒฝํ์ด ๊ฐ๋ํ๊ธธ ๋ฐ๋๋๋ค.๐ช ๋ง์ ๋ด์ฉ์ ๋๋๊ณ ์ถ์ด ๋๋ฌด ๊ธธ์ด์ง ๋ด์ค๋ ํฐ๊ฐ ๋ ์ ์ฉ์ํ์ธ์ ํํ ๐ฅ ํ ๋ฌ์ ํ ๋ฒ, Superb AI๋ MLOps Insight๋ฅผ ํตํด Global MLOps, Data-centric AI, DataOps ํธ๋ ๋์ ์ ์ตํ ์์์ ๋ณด๋ด๋๋ฆฌ๊ณ ์์ต๋๋ค. MLOps Insight๋ PC๋ฒ์ ์ ์ต์ ํ ๋์ด ์์ต๋๋ค.
๋จธ์ ๋ฌ๋์ ์์ด ๋ฐ์ดํฐ๊ฐ ์ค์ํจ์๋, ๋ฐ์ดํฐ์ ์ ๋ฌธ์ํํ๊ธฐ ์ํ ํ์คํ๋ ํ๋ก์ธ์ค๋ฅผ ๊ฐ์ถ ์กฐ์ง์ ๋๋ญ ๋๋ค. ๋ฐ์ดํฐ์ ์ ์ํ ๋ฐ์ดํฐ์ํธ๋ฅผ ๋ง๋ค์๋ ์ด๋์ ํฐ๋ธ๋, ํฌ๋ช ์ฑ๊ณผ ์ฑ ์๊ฐ์ ๋์ด๊ณ ์ฌํ์ ํธ๊ฒฌ์ ์ํํ๊ธฐ ์ํ ๋ชฉ์ ๋ฟ ์๋๋ผ, ์ฐ๊ตฌ์์ ์ค๋ฌด์ ์ฌ์ด์ ๋ฐ์ดํฐ ๊ด๋ จ ์ปค๋ฎค๋์ผ์ด์ ์ ๋ ์ํํ๊ฒ ํ๊ธฐ ์ํด ์๋๋์์ต๋๋ค. ๋ฐ์ดํฐ์ํธ์ ๋ค์ด๊ฐ๋ ํญ๋ชฉ์ ๋ฐ์ดํฐ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ง๋ง ๊ธฐ๋ณธ์ ์ผ๋ก ๋ค์์ 7๊ฐ์ง ์นดํ ๊ณ ๋ฆฌ (๋๊ธฐ, ๊ตฌ์ฑ, ์์ง ํ๋ก์ธ์ค, ์ ์ฒ๋ฆฌ/์ ์ /๋ผ๋ฒจ๋ง, ์ฐ์, ๋ฐฐํฌ, ์ ์ง)๋ก ๋๋ ์ง๋ฌธ์ ํตํด ์ค๋ฌด์๊ฐ ๋ฐ์ดํฐ์ํธ์ ํ์ํ ๋ด์ฉ์ ์ฑ์ธ ์ ์๋๋ก ์ ์ํฉ๋๋ค.
๊ทธ๋ฌํ ์ง๋ฌธ๋ค์ ์ผ๋ถ๋ฅผ ์๊ฐํฉ๋๋ค.
์ด๋ฐ ์ง๋ฌธ์ ๋์ง๊ณ ๋ตํ๋ ๊ณผ์ ์ ๊ฐ๋จํ์ง ์์ ๊ฒ์ ๋๋ค. ํ์ง๋ง ์ด ๋น์ฉ์, ๋ฐ์ดํฐ์ ๋ํ ์จ์ ํ ์ดํด์์ ๋น๋กฏ๋ ์ด์ ์ ๋นํ๋ฉด ๊ฒฐ์ฝ ํฌ์ง ์์ต๋๋ค. ์ด๋ ๋ถ์ ์ ํ ๋ฐ์ดํฐ ์ฌ์ฉ๊ณผ ์ ์ฒ๋ฆฌ์์ ๋น๋กฏ๋ ์ผ๋ จ์ ์ฌ๊ฑด์ ํตํด ์ด๋ฏธ ์๋ ค์ง ๋ฐ์ฃ . ์์ ์ง๋ฌธ์ ๋์ ธ๋ณด์ง ์์ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๊ณ ์๋ค๋ฉด Datasheets for Datasets ๋ฅผ ์ฐธ๊ณ ํด๋ณด์ค ๊ฒ์ ๊ฐ๋ ฅ ์ถ์ฒํฉ๋๋คโ
Superb AI Insight โจ
๐ฃ Superb AI์ ์ปค๋ฎค๋ํฐ ๋ฐ์ , ์จ๋ผ์ธ ๋ฐ์ดํฐ๋ผ์ด๋ ํ ์ด๋ธ 2ํ !๋ฆฌ์์น์ ํ๋ก๋์ ์ ๋ฌด๊ฐ ๊ณต์กดํ๋ ํ์์ ์ด๋ป๊ฒ ๊ท ํ์ ์ก์์ผ ํ๋์ง, ๋น ๋ฅด๊ฒ ๋ณํํ๋ ๊ธฐ์ ํ ํ์ฅ์ผ๋ก ์ผํ๋ฉด์ ์ด๋ค ๊ณ ๋ฏผ๋ค์ ํ๋์ง ๋๋๋ ์๋ฆฌ์ ํจ๊ป ํด์ฃผ์ธ์.
๋ฐ์ดํฐ ๋ผ์ด๋ ํ ์ด๋ธ์ ์ปค๋ฎค๋ํฐ๋ฅผ ์ํด ๋ฐํํด์ฃผ์๋ ์ฐ์ฌ๋๋ค์ ๋ฐํ์ ์ฐธ์ฌํ๋ ๋ค์ํ ์ค๋ฌด์์์ ๋คํธ์ํน์ผ๋ก ์ด๋ฃจ์ด์ง ์ปค๋ฎค๋ํฐ ๋ฐ์ ์ ๋๋ค.
๊ทธ ์ธ ํฅ๋ฏธ๋ก์ด ์ด์ผ๊ธฐ๋ค
Backbone ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ ๊ฐ์ ์ ํ๊ธฐ ์ํ ํ๋์ ํ์ต ๊ธฐ๋ฒ์ธ Multitask Learning ๋ํด ์ ์ ๋ฆฌ๋ ์์์ ์ถ์ฒํฉ๋๋ค. ์ค์ ๋ก๋ ์ด์ ์ ์ฌํ Transfer Learning์ด ๋ ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋๋ฐ์. ๋ ๊ธฐ๋ฒ์ ์ฐจ์ด ๊ทธ๋ฆฌ๊ณ Multitask Learning์ ์ฅ๋จ์ ์ ๋ฐฐ์๋ณด์ธ์.
PaLM(Pathways Language Model)
Pathways ๋ก ํ๋ จ๋ 5,400์ต๊ฐ์ ๋งค๊ฐ๋ณ์(GPT3์ 1,750์ต๊ฐ์ ๋น๊ตํ๋ฉด ํจ์ฌ ๋ง์ฃ )๋ฅผ ์ง๋ ๊ณ ๋ฐ๋ ๋์ฝ๋ ์ ์ฉ transformer ๋ชจ๋ธ, PaLM์ด ๋ฐํ๋์๋๋ฐ์. ํ์กดํ๋ ๋ชจ๋ ์ด๊ฑฐ๋ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋ฅ๊ฐํ๋ค๊ณ ํด์ ์ฃผ๋ชฉ์ ๋ฐ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ด๋ฐ ์ด๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ์ ๋ํ ์ฐ๋ ค๋ ์ฌ์ ํฉ๋๋ค. ํ์ต๋ฐ์ดํฐ๊ฐ ๋๋ฌด ์ปค์ ๋ฌธ์ํํ ์ ์๋ค๋ฉด, ๊ทธ ํน์ฑ์ ์ดํดํ๊ธฐ ๋์ฑ ์ด๋ ค์์ง๊ธฐ ๋๋ฌธ์ด์ฃ .Global Tracking Transformers (GTR)๋์์์ ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ์ถ์ ํ๋ Transformer๊ธฐ๋ฐ์ ๋ฌผ์ฒด ์ถ์ ๊ธฐ์ ๋ก, ๋์์์์ ์์ฑ๋ ํ๋ ์ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด์ ํน์ง์ ์ธ์ฝ๋ฉํ๊ณ trajectory queries๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ ๊ฐ์ฒด๋ฅผ ์ถ์ ํฉ๋๋ค. ์ผ๋ฐ ์ถ์ ๋ฐฉ๋ฒ๋ค์ด ์ ์๋๋ ์ ํ์์ ๊ฐ๋ ฅํ ๊ฒ ๊ฐ์๋ฐ์!
DINO ์ต์ด ์ธ๋ถ ๋ฐ๋ชจ ๊ณต๊ฐ
Meta AI๋ ์๋ ์ ์ปดํจํฐ ๋น์ ์ ์ํ SSL(Self-Supervised Learning, ์๊ธฐ ์ง๋ ํ์ต)๊ธฐ๋ฐ์ ๋ชจ๋ธ์ธ DINO๋ฅผ ๋ฐํํ๋๋ฐ์. ์ต๊ทผ, momentum teacher์ multicrop training์ด๋ผ๋ ๋ ๊ฐ์ง SSL์ ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ๋ฐ์ผ๋ก ํ DINO์ ๋ฐ๋ชจ๋ฅผ ์ธ๋ถ๋ก ์ฒ์ ๊ณต๊ฐํ์ต๋๋ค. ๊ด์ฌ์์ผ์๋ค๋ฉด ์ง๊ธ ์ฒดํํด๋ณด์ธ์!
Superb AI, Inc., 04-127, 400 Concar Dr, San Mateo, California 94402, United States
๊ตฌ๋ ์ทจ์