- Turing Post Korea
- Posts
- ๐FOD#103: แแ ฉแแแ ตแแ ต แแ กแแ ฆแแ ญ - 1แแ งแซ แแ ฎแแ ฆ แแ กแแ ต แแ กแฝแแ กแแ ฉแแ ฆ แแ ฌแฏ แแ ฉแซแแ ฎแซ, แแ ฎแแ ณแฏแแ ด 'ATLAS'
๐FOD#103: แแ ฉแแแ ตแแ ต แแ กแแ ฆแแ ญ - 1แแ งแซ แแ ฎแแ ฆ แแ กแแ ต แแ กแฝแแ กแแ ฉแแ ฆ แแ ฌแฏ แแ ฉแซแแ ฎแซ, แแ ฎแแ ณแฏแแ ด 'ATLAS'
'AIแแ ด แแ ตแแ ฅแจ'แแ ด แแ กแซแแ จแ แ ณแฏ แแ ณแจแแ ฉแจแแ กแแ ต แแ ฑแแ กแซ แแ ฎแแ ณแฏแแ ด แแ ฆแแ ฉแ แ ต แแ กแแ ตแแ ฆแจแแ ฅ 'ATLAS' + แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
AI ๋ชจ๋ธ๊ณผ ๊ด๋ จ ์ธํ๋ผ์คํธ๋ญ์ณ, ๊ทธ๋ฆฌ๊ณ AI ๊ธฐ๋ฐ์ ์ดํ๋ฆฌ์ผ์ด์ ์ Landscape๋ ๊ณ์ํด์ ๋น ๋ฅด๊ฒ ๋ณํํ๊ณ ์์ต๋๋ค - ์ ๋ง ์ ์ ์ด ์์ ์ ๋์ฃ .
๊ฑฐ์ ๊ฒฉ์ฃผ๋ง๋ค, โ์ฐ๋ฆฌ๊ฐ ์ฐจ์ธ๋์ ํธ๋์คํฌ๋จธ ํฌ๋ฌ (Transformer-Killer)๋คโ๋ผ๊ณ ์ฃผ์ฅํ๋ ์๋ก์ด ๋ชจ๋ธ, ์๋๋ฉด โ๋ํ์ ๋ชจ๋ธ๋ค๋ ์ด๋ ค์ํ๋ Long-Context ๋ฌธ์ ๋ฅผ ์ฐ๋ฆฌ๋ ์ด๋ฌ์ด๋ฌํ๊ฒ ํด๊ฒฐํ๋คโ๊ณ ์ฝ์ํ๋, ์๋กญ๊ณ ๋ ํจ์จ์ ์ธ ์ํคํ ์ฒ์ ๋ํ ์์์ด ๊ณ์ ๋ค๋ ค์ต๋๋ค.
์ด๋ฐ ๊ฒ๋ค ๋๋ถ๋ถ์ ๋ฌผ๋ก ์๋ฆฌ์์ด ์ฌ๋ผ์ง๊ธฐ๋ ํ์ง๋ง, ๊ฐ๋์ โ๋จ์ํ ๊ฐ์ โ์ ๋์ด์ โ๊ทผ๋ณธ์ ์ธ ๋ณํโ๋ฅผ ๋ง๋ค์ด๋ผ ๊ฑธ๋ก ๋ณด์ด๋ ๊ทธ๋ฐ ์ฐ๊ตฌ ๋ ผ๋ฌธ๋ค์ด ๋ํ๋๊ธฐ๋ ํฉ๋๋ค.
์ง๋ 5์ 29์ผ arXiv์ ์กฐ์ฉํ ์ฌ๋ผ์จ, ๊ทธ๋ฆฌ๊ณ ๋ง์ดํฌ๋ก์ํํธ Build, ๊ตฌ๊ธ I/O ๋ฑ์ ๊ฑฐ๋ํ ํ์ฌ์ ๋ฌปํ, huggingface/papers์์ ์ถ์ฒ ์๊ฐ ๊ฒจ์ฐ 18๊ฐ์ ๋ถ๊ณผํ ๋ ผ๋ฌธ, ๋ฐ๋ก ๊ตฌ๊ธ ๋ฆฌ์์น์์ ์ด "Atlas: Learning to Optimally Memorize the Context at Test Time"์ด ๋ฐ๋ก ๊ทธ๋ฐ ์ฐ๊ตฌ ๋ ผ๋ฌธ ์ค ํ๋์ผ์ง๋ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค. ์ฌ์ค, ๊ตฌ๊ธ์ ์ฐ๊ตฌ๊ฐ ์ฒ์์๋ ์ฃผ๋ชฉ๋ฐ์ง ๋ชปํ๊ณ ๊ฐ๊ณผ๋๋ ๊ฑด, ์ด๋ฒ์ด ์ฒ์์ ์๋์ฃ .
๋ชจ๋ ์์๋ค์ํผ, โํธ๋์คํฌ๋จธโ ์ํคํ ์ฒ๋ ์์ฒญ๋ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๋๋ผ์ด ์ํคํ ์ฒ์ง๋ง, ๊ธฐ๋ณธ์ ์ผ๋ก โ๋ชจ๋ ํ ํฐ ์ (Token Pair)์ ์ดํด๋ณด๋ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์์ฑ ๋๋ฌธ์, ๊ทธ ํ๋ จ ๋น์ฉ์ด ์ฌ์ด์ฆ์ ํจ๊ป ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํฉ๋๋ค. ๋ฌผ๋ก , RetNet, RWKV, Mamba, ์ฌ์ง์ด ๊ตฌ๊ธ์ด ์์ฒด์ ์ผ๋ก ๋ง๋ Titans ๊ฐ์ ๋ง์ ๋์๋ค์ด ์ํ๊ณต๊ฐ ๊ธฐ๋ฒ ๋ฑ์ ๋ค์ํ ๋ฐฉ๋ฒ์ผ๋ก ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ์๋ํ๊ณ ์์ต๋๋ค. ์ด๋ฐ ๋์๋ค์ ๋ ๋น ๋ฅด๊ฒ ๋ ์ ์ ๋น์ฉ์ผ๋ก ์ฒ๋ฆฌ๋ฅผ ํ๊ฒ ํด ์ฃผ๊ธฐ๋ ํ์ง๋ง, โ์ ๋ง ๊ธด ์ํ์ค์์ ์ ๋ณด๋ฅผ ์ง์ ์ผ๋ก ์ดํดํ๊ณ ๊ธฐ์ตํ๋๋ฐ ์์ด์๋ ์ฌ์ ํ ๋ง์ ๋ชจ๋ธ๋ค์ด ๋ฒฝ์ ๋ถ๋ชํ๊ณ โ ์๋ ๊ฒ๋ ์ฌ์ค์ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด, โAtlas ๋ ผ๋ฌธโ์ด ์ ์ํ๋ ๊ฑด ๋ญ๊น์?
์ด์ง ๊ธฐ์ ์ ์ผ๋ก ์ดํด๋ฅผ ํด ๋ณด์๋ฉด, ์ ๊ฐ ๋ณด๊ธฐ์๋, ํต์ฌ์ ์ธ ์์ด๋์ด๋ ๋ชจ๋ธ์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋จ์ํ ์ ๋ณด๋ฅผ ์ง์ด๋ฃ๋ ์๋์ ์ ์ฅ์๋ก ๋ณด๊ธฐ๋ณด๋ค๋ ํนํ ์ถ๋ก ๊ณผ์ ์์ ๋ฅ๋์ ์ผ๋ก ์ต์ ํ๋ฅผ ์คํํ๋ ๊ตฌ์ฑ ์์๋ก ๋ณด๊ณ ๋ค๋ฃจ๋ ๊ฒ๋๋ค. ๋ค์ ๋งํด์, โ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ง์ง๋ง์ ๋ณธ ํ ํฐ์๋ง ๋ฐ์ํ๋๊ฒ ์๋๋ผ, ๋ฉ๋ชจ๋ฆฌ๊ฐ ์ต๊ทผ ํ ํฐ๋ค์ ์๋์ฐ๋ฅผ ๋๋์๋ณด๋ฉด์ ๋ญ๊ฐ ์ค์ํ์ง, ์ด๋ป๊ฒ ๋ณด๊ดํ ์ง๋ฅผ ์ค์ค๋ก ์ง๋ฅ์ ์ผ๋ก ๊ฒฐ์ ํ๋ ๋ฐฉ๋ฒโ์ ์ ์ํ๊ณ ์์ด์.

Image Credit: โAtlas: Learning to Optimally Memorize the Context at Test Timeโ ๋ ผ๋ฌธ
์ฌ๊ธฐ์ โ์ค๋ฉ๊ฐ ๊ท์นโ์ด๋ผ๋ ๊ฒ ๋ฑ์ฅํฉ๋๋ค. ์ค๋ฉ๊ฐ ๊ท์น์ด ๋ญ๊น์?
๋๋ถ๋ถ์ ์ํ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ โํ์ฌ์ ์ ๋ ฅโ์ ๋ฐํ์ผ๋ก ํด์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ๋ฐ์ดํธํ๋๋ฐ, ์ค๋ฉ๊ฐ ๊ท์น์, โ์ ๊น๋ง, ์ต๊ทผ 'c'๊ฐ์ ํ ํฐ๋ค(์๋ฅผ ๋ค์ด ์ต๊ทผ 50๊ฐ)์ ์ดํด๋ณด๊ณ ์ด๊ฒ๋ค์ ๋ชจ๋ ํจ๊ป ํ์ฉํด์ ๋ฉ๋ชจ๋ฆฌ ์ํ๋ฅผ ์ต์ ํํ์"๊ณ ํ๋ ๊ฒ๋๋ค. ์ด๋ ๊ฒ ํด์, ๋ชจ๋ธ์ด ๋จ์ํ โ๊ณ ๋ฆฝ๋ ์ฌ์ค๋คโ์ด ์๋ โ๋งฅ๋ฝโ์ ๊ธฐ์ตํ๋ ๋ฒ์ ๋ฐฐ์ธ ์ ์๋ค๋ ๊ฒ๋๋ค - ์ฆ, ๋ง์ง๋ง์ ์ผ์ด๋ ๋ ๋ฆฝ์ ์ธ ์ผ ๋ฟ ์๋๋ผ ์ต๊ทผ์ ๋ ๋์ ๊ฒฝํ์ ๋ฐํ์ผ๋ก ์ดํด๋ฅผ ์ ๋ฐ์ดํธํ๋ ๊ฐ๋ ์ด์ฃ .
๋ ผ๋ฌธ์ ๋ณด๋ฉด, ์ด๋ฐ ์ ๊ทผ๋ฒ์ด ํนํ BABILong ๊ฐ์ด โ์์ฃผ ๊ธด ๋ฌธ์์ ํฉ์ด์ ธ ์๋ ์ฌ์ค์ ๋ฐํ์ผ๋ก ์ธ์ด ๋ชจ๋ธ์ด ์ผ๋ง๋ ์ฅ๊ธฐ ์ถ๋ก ์ด๋ ์ ๋ณด ๊ฒ์์ ์ ํ๋์ง ํ๊ฐํ๋ ํ ์คํธโ์์ ์ค์ ๋ก ์ข์ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๋๋ฐ, ๋ฌด๋ ค 1์ฒ๋ง ํ ํฐ๊น์ง ์ด์ด์ง๋ ์ํ์ค์์ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค๊ณ ํด์.

Image Credit: โAtlas: Learning to Optimally Memorize the Context at Test Timeโ ๋ ผ๋ฌธ
๊ทธ๋ฐ๋ฐ, Atlas๊ฐ ์ด๋ฐ ํ๋์ ํต์ฌ ์์ด๋์ด๋ก๋ง ๊ตฌ์ฑ๋ ๊ฑด ์๋๋๋ค - ์ฌ๋ฌ ๊ฐ์ ๋ณด์์ ์ธ ๋๊ตฌ ์ ์ ์๊ฐํ๊ณ ์์ด์:
๋ฉ๋ชจ๋ฆฌ ์ฉ๋์ ํฅ์
Atlas๋ ํค(Key)์ ์ฟผ๋ฆฌ(Query)์ ๋คํญ์ ๋ฐ ์ง์ ํน์ฑ ๋งคํ์ ์ ์ฉํด์, โ์ด์ฉํ ์ ์๋โ ๋ฉ๋ชจ๋ฆฌ์ ์ฉ๋์ ์ฆ๊ฐ์ํต๋๋ค. ๋ง์ด ์ข ์ด๋ ค์ด๋ฐ, ์ค์ ๋ฉ๋ชจ๋ฆฌ ์ ์ฅ์๋ ์๋ ํฌ๊ธฐ ๊ทธ๋๋ก ์ ์งํ๋ฉด์, ์ ๋ณด๋ฅผ ์ฐพ๊ณ ๋น๊ตํ ๋๋ง ํค์ ์ฟผ๋ฆฌ๋ฅผ ๋ ๋ณต์กํ ํํ(๋คํญ์, ์ง์ ๋ฑ)๋ก ์์ ๋ณํํฉ๋๋ค. ๋ง์น ์๋์ฅ ๊ฐ์๋ ๊ทธ๋๋ก ๋๊ณ ๋ฌผ๊ฑด์ ์ฐพ์ ๋๋ง ๋ ์ ๊ตํ ์ธ๋ฑ์ค ์์คํ ์ ์ฌ์ฉํ๋ ๊ฒ์ฒ๋ผ, ํต์ฌ์ ์ธ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๋๋ฆฌ์ง ์๊ณ ๋ ๋ ๋ง์ ํจํด์ ๊ตฌ๋ณํ๊ณ ๊ธฐ์ตํ ์ ์๊ฒ ๋ง๋ค์ด ์ค๋๋ค.
์ด ์ ๊ทผ๋ฒ์ PolySketchFormer์ Hopfield ๋คํธ์ํฌ ํ์ฅ์ ํฌํจํ ์ด์ ์ฌ๋ฌ ๊ฐ์ง ์ฐ๊ตฌ์ ์์ด๋์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก๋ค๊ณ ํ๊ตฌ์.๋ ํจ๊ณผ์ ์ธ ๋ฉ๋ชจ๋ฆฌ์ ์กฐ์
๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ๋ฐ์ดํธํ ๋, ๊ธฐ๋ณธ์ ์ธ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์ฌ์ฉํ๋ ๋์ , Atlas๋ 2์ฐจ ์ ๋ณด๋ฅผ ํ์ฉํ๋ Muon ์ต์ ํ๊ธฐ๋ฅผ ํตํฉํฉ๋๋ค. ์ด๊ฒ๋ ์กฐ๊ธ ํ์ด์ ๋ง์๋๋ฆฌ์๋ฉด, ๊ธฐ๋ณธ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ผ๋ก ๋จ์ํ ์ ์ ๋ณด๋ฅผ ๋ํ๊ฑฐ๋ ํ๊ท ๋ด๋๊ฒ ์๋๋ผ, Muon์ด๋ผ๋ ๊ณ ๊ธ ์ต์ ํ๊ธฐ๋ฅผ ์ฌ์ฉํด์ "์ด๋ป๊ฒ ํ๋ฉด ์ด ๋ฉ๋ชจ๋ฆฌ๊ฐ ๊ฐ์ฅ ์ ์ฉํ๊ฒ ์ฐ์ผ๊น?"๋ผ๋ ์ต์ ํ ๋ฌธ์ ๋ฅผ ์ค์๊ฐ์ผ๋ก ํธ๋ ๊ฒ๋๋ค - ๋ง์น ์ฐ์ ์ค๋ฅผ ๋, โ๋ฐ ๋ฐ์ ๊ธฐ์ธ๊ธฐโ๋ง ๋ณด๋๊ฒ ์๋๋ผ โ์ฃผ๋ณ ์งํ์ ๊ณก๋ฅ โ๊น์ง ํ์ ํ๋ฉด ๋ ๋์ ์ต์ ๊ฒฝ๋ก๋ฅผ ์ฐพ์ ์ ์๋, ์ฆ 1์ฐจ ์ ๋ณด(๊ธฐ์ธ๊ธฐ)์ 2์ฐจ ์ ๋ณด(๊ณก๋ฅ )๋ฅผ ๋ชจ๋ ํ์ฉํด์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ ์์ ์ ์ด๊ณ ํจ๊ณผ์ ์ผ๋ก ์ค์ํ ๋งฅ๋ฝ์ ๊ธฐ์ตํ๋๋ก ํด ์ฃผ๋ ๊ธฐ๋ฒ์ ๋๋ค.
์ด ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ฉด, ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋์ ๋ ํจ๊ณผ์ ์ผ๋ก ์ ๋ฐ์ดํธํด์ ์ผ๋ฐ์ ์ธ ์ต์ ํ์ ๋ฐ๋ฅด๋ ํจ์ ์ ํผํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. ์ด ์์ด๋์ด๋ ํ๋ จ ์ค์ ๋ ๊ณ ๊ธ์ ์ต์ ํ๊ธฐ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ๋น์ทํ์ง๋ง, ์ฌ๊ธฐ์๋ โ์ถ๋ก ๊ณผ์ ์์์ ๋ฉ๋ชจ๋ฆฌ ๋ฉ์ปค๋์ฆโ์ ์ ์ฉํ๋ ๊ฑฐ์ฃ .ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ์ ์ฌ๊ฒํ
๋๋ถ์ด, ์ด ๋ ผ๋ฌธ์์๋ โ๊ณ ์ ๋ ์ดํ ์ โ์ โ์ค๋ฉ๊ฐ ๊ท์น์ผ๋ก ๊ด๋ฆฌํ๋ ํ์ต ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋โ๋ก ๋์ฒดํด์ ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ๋ฅผ ํ์ฅํ DeepTransformers์ DoT(Deep Omega Transformers)๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ฐ ์๋ก์ด ๋ชจ๋ธ๋ค์ ์คํ๋ ค โ์ค๋ฆฌ์ง๋ ํธ๋์คํฌ๋จธ์ ์ผ๋ฐํ๋ ํํโ๋ก ๋ฐ๋ผ๋ณธ๋ค๋ฉด, ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ์ดํ ์ ์ ๋ ๋์ ๋ฉ๋ชจ๋ฆฌ ๊ตฌ์ฑ ๋ฐฉ์์ ํ ๊ฐ์ง ๊ฒฝ์ฐ๋ผ๊ณ ํด์ํ ์๋ ์์ ๊ฒ๋๋ค.
์ด ๋ ผ๋ฌธ์ ์๋นํ โ๋ฐ๋๊ฐ ๋์โ ๋ ผ๋ฌธ์ ๋๋ค. ์ฐ๊ด ๋ฉ๋ชจ๋ฆฌ (Associative Memory) ์ด๋ก , ์ต์ ํ, ์ํคํ ์ฒ ์ค๊ณ ๋ฑ ๋ค์ํ ์์ญ์์ ์ฌ๋ฌ ๊ฐ์ง์ ์๋ก์ด ์ค๋ง๋ฆฌ๋ฅผ ์ ์ฎ์ด๋ธ, ์ผ์ข ์ โ์ํโ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. ์ ํต์ ์ธ RNN ์ํคํ ์ฒ์ โ์จ๋ผ์ธ ์ ๋ฐ์ดํธโ ํน์ฑ, ์ฆ ํ ํฐ์ด ํ๋์ฉ ๋ค์ด์ฌ ๋๋ง๋ค ๋ฏธ๋ฆฌ ์ ํด์ง ๊ท์น์ผ๋ก ์์ฐจ์ ์ผ๋ก ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ์์ ์๋ฌธ์ ์ ๊ธฐํด ์๋ ์ฌ๋ฌ ๊ฐ์ง ์ฐ๊ตฌ์ ๊ณ๋ณด๋ฅผ ๋ฐ๋ฅด๊ณ ์๊ธฐ๋ ํฉ๋๋ค - ์ฆ, ๋์ค์ ๋ค์ด์จ ๋งฅ๋ฝ์ด ์ด์ ์ ๋ณด์ ์ค์๋๋ฅผ ๋ฐ๊ฟ ์ ์์์๋ ๋ถ๊ตฌํ๊ณ , ์ด๋ฏธ ์ ๋ฐ์ดํธ๋ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋๋์ ์ฌ์กฐ์ ํ ์ ์๋ค๋ ๊ทผ๋ณธ์ ์ธ ํ๊ณ์ ๋์ ํ๋ค๋ ๊ฒ์ด์ฃ .

โ์จ๋ผ์ธโ ๋ฐฉ์๊ณผ โAtlasโ ๋ฐฉ์์ ์ฐจ์ด
Atlas๋ฅผ ๋น๋กฏํ ์ต๊ทผ์ ์ฐ๊ตฌ๋ค์, ์ด๋ ๊ฒ โ์์๋๋ก ์ฐจ๋ก์ฐจ๋ก ์ฒ๋ฆฌโํ๋ ๊ธฐ๋ฒ์ ํฌ๊ธฐํ๊ณ , ๋์ ์ผ์ ํ ๋ฒ์์ ํ ํฐ๋ค์ ํจ๊ป ๋ณด๋ฉด์ "์ด๋ป๊ฒ ๊ธฐ์ตํ๋ ๊ฒ ๊ฐ์ฅ ์ ์ฉํ ๊น?"๋ผ๋ ์ต์ ํ ๋ฌธ์ ๋ก ๋ฉ๋ชจ๋ฆฌ ์ ๋ฐ์ดํธ๋ฅผ ์ฌ์ ์ํ๊ณ ์๋๋ฐ, ์ด๊ฑด ์ผ๊ธฐ๋ฅผ ์๊ฐ์์ผ๋ก ๋์ดํ๋ ๊ฒ์์ ํ๋ฃจ๋ฅผ ๋์๋ณด๋ฉฐ ํต์ฌ ์๊ฐ๋ค ์ค์ฌ์ผ๋ก ์ ๋ฆฌํ๋ ๊ฒ์ผ๋ก ํจ๋ฌ๋ค์์ด ๋ฐ๋ ๊ฒ๊ณผ ๊ฐ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. Titans (์ญ์ ๊ตฌ๊ธ์์ ๋์จ), TTT (Test-Time Training) ๊ฐ์ ๋ ผ๋ฌธ๋ค๋, ๋ค์ด๋๋ฏนํ๊ฒ ์ถ๋ก ์์ ์์ ์ ์ํ๋ค๋ ๋น์ทํ ์ฃผ์ ๋ฅผ ํ๊ตฌํ ๋ฐ ์๊ตฌ์.
๋ฌผ๋ก , Atlas๊ฐ ์ต์ข ์ ์ธ ๋ต์ด ์๋ ํ๋ฅ ์ด ํฌ์ฃ . ์ง์ง ์ํ๋๋, ์ด๋ฐ ์์ด๋์ด๋ค์ด ์ผ๋ง๋ ์ ์ค์ผ์ผ๋ง๋๋์ง, ๋ค๋ฅธ ์ฌ๋๋ค์ด ์ผ๋ง๋ ์ฝ๊ฒ ๊ตฌํํ๊ณ ๋ฐ์ ์ํฌ ์ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ๋ ๊ด๋ฒ์ํ ์์ ์์๋ ๋์ ์ฑ๋ฅ์ด ์ ์ง๋๋์ง ๋ฑ์ด ๊ด๊ฑด์ด ๋ ๊ฒ๋๋ค - ๋ง์ ์ ํ๋ฆฌ์ผ์ด์ ๋ค์ ์ฌ์ ํ ์งง์ ๋งฅ๋ฝ์ ์๋์ฐ ์์์๋ ํฐ ๋ฌธ์ ์์ด ์๋ํ๊ณ ์์ผ๋๊น์.
๊ทธ๋ ์ง๋ง, ๋ถ๋ช Atlas๊ฐ ์ ์ํ๋ ๋ฐฉํฅ์ ์๋ฏธ๊ฐ ์์ต๋๋ค.
๊ธฐ์กด์ ํจ๋ฌ๋ค์์ ๋จ์ํ ํ์ฅํ๋ ๊ฒ์ด ์๋๋ผ, ๋ ๋๋ํ ์์คํ ์ ๊ตฌ์ถํ๋ค๋ ์ฒ ํ์ด๋๊น์. ํนํ ๋ฐฉ๋ํ ์ ๋ณด๋ฅผ ๋ค๋ฃจ์ด์ผ ํ ๋ ๋ด๋ถ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ด๋ฆฌํ๊ณ ์ต์ ํํ๋ ๋ฐฉ๋ฒ์ ๋ฅ๋์ ์ผ๋ก ํ์ตํ๋ ๋ชจ๋ธ, ๋ฉ์ง์ง ์๋์? ์ด ๋ฐฉํฅ์ ์ง์ ํ ๋ฐ์ ์ด ๊ณ์๋๋ค๋ฉด, โ๋ค์ด๋๋ฏนํ๊ฒ ๋งฅ๋ฝ์ ์ธ์ํ๋ฉด์ ์ง์์ ์ผ๋ก ์ต์ ํํ๋ ๋ฉ๋ชจ๋ฆฌโ๋ ๋๊ท๋ชจ์ ๋ฐ์ดํฐ์ ์ ๋จ์ํ โ์ฒ๋ฆฌโํ๋๊ฒ ์๋๋ผ โ์ ๋๋ก ์ดํดํ๊ณ ํ์ฉโํ๋ AI๋ฅผ ํฅํ ์ค์ํ ํ ๊ฑธ์์ด ๋ ๊ฒ๋๋ค.
์ด์ , ๋จ์ํ๊ฒ, ๊ทธ๋ฆฌ๊ณ ๊ธฐ๊ณ์ ์ผ๋ก ์ดํ ์ ์ ํ์ฅํ๋ ์๋๋ ์ง๋๊ณ ์์ต๋๋ค. AI๊ฐ ์ด๋ป๊ฒ ํ์ตํ๊ณ , ๊ธฐ์ตํ๊ณ , ์ถ๋ก ํด์ผ ํ๋์ง์ ๋ํด ๋ ์ง์คํด์ ์ธ๋ฐํ๊ฒ ํ๊ตฌํ๋ ์๋๊ฐ ์ค๊ณ ์์ต๋๋ค.
๋งฅ๋ฝ์ ์ต์ ํํด ๊ฐ๋ฉด์ ๊ธฐ์ตํ๋ค๋ ๊ฒ, ์ด์ ๋ํ ๊น์ ์ด๊ธฐ์ ํ๊ตฌ์ ๊ฒฐ๊ณผ๋ก์ Atlas๋, ์ด ๊ธด ์ด์ผ๊ธฐ์ ์๋ฌธ์ ์ฌ๋, ๋งค๋ ฅ์ ์ธ ํ ์ฑํฐ๊ฐ ๋ ๊ฒ๋๋ค.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
MCP๊ฐ ์์ด์ ํธ, ๊ทธ๋ฆฌ๊ณ ์์ด์ ํธ๊ฐ ์ฌ์ฉํด์ผ ํ ์ธ๋ถ ๋๊ตฌ ๊ฐ์ ์ฐ๊ฒฐ ๋ฐฉ์์ ๋ฐ๊ฟ๋์์ฃ . ์ง๊ธ ์ด ์๊ฐ์๋ ์์์ด ๋ง์ MCP ์๋ฒ๋ค์ด ์๊ฒจ๋๊ณ ์์ต๋๋ค.
๋ง์ MCP ์๋ฒ๋ค ์ค์์, ํ ๋ฒ ์ดํด๋ณผ ๋งํ ๋ฉ์ง MCP ์๋ฒ 12๊ฐ๋ฅผ ์ ์ ํด ๋ดค๋๋ฐ์, ํจ๊ป ์ดํด๋ณด์์ฃ :
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
From Typewriters to Transformers: AI is Just the Next Tools Abstraction by Steven Sinofsky
์ด ๊ธ์, ์ฐ๋ฆฌ๊ฐ ํ์๊ธฐ์์ ์๋ํ๋ก์ธ์๋ก, ๊ณ์ฐ๊ธฐ์์ ์์ ๋ก ๋์ด๊ฐ๋ ๊ฒ์ฒ๋ผ, ์ง๊ธ์ AI๋ผ๋ ์๋ก์ด โ๋๊ตฌโ๋ก ๋์ด๊ฐ๋ ๊ณผ์ ์ ์๋ค๊ณ ์ค๋ช ํฉ๋๋ค. ์ฒ์์๋ ์ด๋ฐ ์๋ก์ด ๋๊ตฌ๋ค์ด ๋ฏ์ค๊ณ , ์ฌ๋๋ค์ด "๊ธฐ์ด๋ฅผ ์๊ฒ ๋ง๋ ๋ค"๊ฑฐ๋ "์ ๋ขฐํ๊ธฐ ์ด๋ ต๋ค"๋ฉฐ ๊ฑฑ์ ํ์ง๋ง, ์๊ฐ์ด ์ง๋๋ฉด ๋ ๋น ๋ฅด๊ณ ํธ๋ฆฌํด์ง๋ฉด์ ์ฐ๋ฆฌ ์ผ์ ๊ผญ ํ์ํ ๋๊ตฌ๊ฐ ๋๋ค๋ ๊ฒ๋๋ค. AI๋ ๋ง์ฐฌ๊ฐ์ง๋ก, ์ง๊ธ์ ํผ๋์ค๋ฝ๊ณ ๋ถ์ํ๊ฒ ๋๊ปด์ง ์ ์์ง๋ง ๊ฒฐ๊ตญ ์ผํ๋ ๋ฐฉ์ ์์ฒด๋ฅผ ๋ฐ๊พธ๋ ์ค์ํ ๋ณํ๋ผ๋ ๊ฑธ ๊ฐ์กฐํ๊ณ ์๋ค์.
Trends โ Artificial Intelligence by legendary Mary Meeker (๋ถ๋ช ๋ณผ ๋งํ ๊ฐ์น๊ฐ ์๋ ๋ณด๊ณ ์์ด๊ธด ํ์ง๋ง, 340 ํ์ด์ง์ ๊ธธ์ด๊ฐ ๋ฌด์ญ๋ค์ - ๊ทธ๋ํ๊ฐ ๋ง๊ธฐ๋ ํฉ๋๋ค)
์ด ๊ธ์ ๋๋ฌด๋๋ ์ ๋ช ํ ํฌ์์์ธ ๋ฉ๋ฆฌ ๋ฏธ์ปค๊ฐ "AI๋ ์ง๊ธ๊น์ง ๋์๋ ๊ธฐ์ ์ค ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ํผ์ง๊ณ ์๋ค"๊ณ ๋งํ ๋ด์ฉ์ ์๊ฐํฉ๋๋ค. ์ธํฐ๋ท, ์ค๋งํธํฐ๋ณด๋ค๋ ํจ์ฌ ๋น ๋ฅด๊ฒ ์ฌ๋๋ค์ด AI๋ฅผ ์ฐ๊ธฐ ์์ํ๋๋ฐ, ๊ทธ ๋ฐฐ๊ฒฝ์๋ ์ ์ธ๊ณ ์ฌ๋๋ค์ด ์ธํฐ๋ท์ ์ฐ๊ณ ์๊ณ , ๋ฐ์ดํฐ๋ ๋ง์ด ์์๊ณ , ์ฑGPT ๊ฐ์ ๋๋ํ AI๊ฐ ๋ฑ์ฅํ๊ธฐ ๋๋ฌธ์ด์ฃ . ์ง๊ธ์ ์คํํธ์ ์ด๋ ๋น ํ ํฌ๋ค์ด AI์ ์์ฒญ๋ ๋์ ํฌ์ํ๊ณ ์๊ณ , ๋ฏธ๊ตญ๊ณผ ์ค๊ตญ์ด AI๋ฅผ ํตํด ๋๊ฐ ๋ ์ฐ์๋ฅผ ์ ํ ๊ฒ์ธ์ง ๊ฐ์ง๊ณ ๊ฒฝ์ ์ค์ด์ฃ . ๊ทธ๋์ AI๋ ๋จ์ํ ๊ธฐ์ ์ด ์๋๋ผ, ์์ผ๋ก ์ด๋ค ๋๋ผ๊ฐ ๋ ๋ฒ์ํ๊ฒ ๋ ์ง๋ฅผ ์ข์ฐํ ๋งํผ ์ค์ํ ๋ณํ๋ผ๊ณ ๊ฐ์กฐํ๊ณ ์์ต๋๋ค.
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
ํ๊น ํ์ด์ค, ํ๊ณผ ๋ค๋ฆฌ๋ฅผ ์ป๋ค
ํ๊น ํ์ด์ค๊ฐ ๋ ๊ฐ์ง์ ์คํ์์ค ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ถ์ํ์ต๋๋ค โ 66๊ฐ ์์ ๋๋ฅผ ๊ฐ์ง ์ค๋ฌผ ํฌ๊ธฐ์ ์ด์กฑ๋ณดํ ๋ก๋ด HopeJR($3000๋ถํฐ ์์), ๊ทธ๋ฆฌ๊ณ ๋ํ ๊ธฐ๋ฅ์ ๊ฐ์ถ ๋ฐ์คํฌํฑ ์ปดํจ๋์ธ Reachy Mini($300๋ถํฐ ์์)๊ฐ ๊ทธ ๋ ๊ฐ์ง์ธ๋ฐ์.
Pollen Robotics๋ฅผ ์ธ์ํ ํ์ ์ ์๋ ์ด ๋ก๋ด๋ค์, ์ ๋ ดํ ๊ฐ๊ฒฉ์ผ๋ก ๋ง์ ์ฌ๋๋ค์ด ๋ก๋ด์ ์ฌ์ฉํ ์ ์๊ฒ๋ ํ๋ ๊ฑธ ๋ชฉํ๋ก ํ๋ค๊ณ ํฉ๋๋ค.
Meet HopeJr, a full humanoid robot lowering the barrier to entry!
Capable of walking, manipulating many objects, open-source and costs under $3000 ๐คฏ
Designed by @therobotstudio and @huggingface ๐
โ Remi Cadene (@RemiCadene)
9:07 AM โข May 29, 2025
์ค์ฐ๋กํฝ, LLM์ ๋ด๋ถ ํ๋ก ์ถ์ ์ฉ ๋๊ตฌ๋ฅผ ์คํ์์ค๋ก ๊ณต๊ฐ
Claude์ ๊ฐ๋ฐ์ฌ์ธ ์ค์ฐ๋กํฝ์, Decode Research์ ํ์ ํด์ โLLM์ ๋ด๋ถ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋๋ฌ๋ด๋ ๊ท์ ๊ทธ๋ํ๋ฅผ ์์ฑโํ๋ ์คํ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ถ์ํ์ต๋๋ค. ์ด ๊ทธ๋ํ๋ค์ Gemma-2-2b์ Llama-3.2-1b ๊ฐ์ ๋ชจ๋ธ๋ค์ ์ง์ํ๊ณ , Neuronpedia์ ์ธํฐ๋ํฐ๋ธ ํ๋ก ํธ์๋๋ฅผ ํตํด์ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋๊ตฌ๋ค์ ํตํด์ ์ฌ์ฉ์๋ค์ ํน์ฑ ๊ฐ์ ์์ ํ๊ณ , ๊ฐ์ค์ ํ ์คํธํ๊ณ , ํ๋ก๋ฅผ ์ถ์ ํ ์ ์์ต๋๋ค.
์ค์ฐ๋กํฝ์ ์ด๋ฐ ์์ ์ ํตํด์ ๋ค๊ตญ์ด ๋ฐ ์ถ๋ก ์์ ์์ ์ผ์ด๋๋ ๋ชจ๋ธ์ ํ๋์ ๋ํ ํด์ ๊ฐ๋ฅ์ฑ ์ฐ๊ตฌ์ ์ดํด๋ฅผ ๊ฐ์ํํ๋ ๊ฒ์ด ๋ชฉํ๋ผ๊ณ ์ด์ผ๊ธฐํ๋ค์.
ํ ๋ ๊ทธ๋จ + xAI, ๊ฒฐ์ด ๋ฑ ๋ง๋ ํ์
์ฒ์์ฐ๋ถ์ ๊ฑฐ๋๋ผ๊ณ ํด์ผ ํ ๊น์? ๋ ผ๋์ ๋์ด์ง ์๋ ๋ ๋ช ์ ์ธ๋ฌผ - ํ๋ฒจ ๋๋กํ, ๊ทธ๋ฆฌ๊ณ ์ผ๋ก ๋จธ์คํฌ - ์ด xAI์ ์ฑ๋ด Grok์ ํ ๋ ๊ทธ๋จ ์ฑ์ ์ง์ ์๋ฒ ๋ฉํ๋ ๊ณ์ฝ์ ์ฒด๊ฒฐํ์ต๋๋ค. ํ ๋ ๊ทธ๋จ์ ํ๋ซํผ์ ํตํด์ ํ๋งค๋๋ Grok ๊ตฌ๋ ์์ต์ 50%๋ ๊ฐ์ ธ๊ฐ๋๋ค. ์ด ํํธ๋์ญ์ผ๋ก TON์ด 18.5% ๊ธ๋ฑํ์ง๋ง, ์ ๊ธฐํ๊ฒ๋ ๋ฐํ ๋ช ์๊ฐ ์ ์ ๋ฐ์ด์ฌ๋์ต๋๋ค. ์์ฅ์ ๋ฏธ๋๋ฅผ ๋ณด๋ ํฌ์๋ ฅ์ด๋ผ๋ ์๋ ๊ฑด๊ฐ์?
๋ฉํ์ Anduril, ํจ๊ป ๋ฌด์ฅํ๋ค
๋ฉํ, ๊ทธ๋ฆฌ๊ณ ๋ฐฉ์ฐ๊ธฐ์ ๊ธฐ์ Anduril์ด ํ์ ํฉ์ณ ํผํฉ ํ์ค (Mixed Reality)์ ์ ์ฅ์ ๋์ ํฉ๋๋ค. ์ด์ ๊ฒ์์ฉ ํค๋์ ์ ๋์ด์ ์ ํฌ์ฉ ํ ํฌ๋ ธ๋งจ์ ์ฅ๋น์ ๊ฐ๊น์ด ๊ฑธ ํจ๊ป ๋ง๋ค๊ฒ ๋ค๋ ๊ฒ์ด๊ฒ ์ฃ . ์ด ๋ ํ์ฌ์ XR ๊ธฐ๋ฐ ํตํฉ ์๋ฃจ์ ์ ๊ตฐ์ธ๋ค์ ์ธ์ง ๋ฅ๋ ฅ์ ํฅ์์ํค๊ณ Anduril์ Lattice AI ์์คํ ๊ณผ ์ง์ ์ฐ๊ฒฐ๋ ๊ฑฐ๋ผ๊ณ ํ๋๋ฐ์, ๋ฏผ๊ฐ ์๊ธ๊ณผ ์์ฉ ๊ธฐ์ ์ ๋ฐํ์ผ๋ก ๊ตฌ์ถํ ์ด ํํธ๋์ญ์ ํตํด์ ํํ๊ณค์ด ์์ญ์ต ๋ฌ๋ฌ๋ฅผ ์ ์ฝํ ์ ์์ ๊ฑฐ๋ผ๊ณ ์ฃผ์ฅํฉ๋๋ค.
์คํ๋ฌ์ค๋ฅผ ์ฐฝ์ ํ ์ดํ ๋ฉํ์ ์กฐ์ธํ๋ค๊ฐ ํด๊ณ ๋ Anduril์ ์ฐฝ์ ์ ํ๋จธ ๋ฌํค๊ฐ ๊พธ๋ โ์ฐจ์ธ๋ ์ ํฌ์โ์ ๊ฟ์ ์ฆ๊ฐ ํ์ค์ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด๊ฐ ์ด ํํธ๋์ญ - ์ ์๋ ๋ฉํ๋ฒ์ค์์๋ง ํ ์๋ ์์๊น์?

Anduril ์ฐฝ์ ์ ํ๋จธ ๋ฌํค (์ข), ๋ฉํ์ ๋งํฌ ์ ์ปค๋ฒ๊ทธ. Image Credit: Anduril
๋ฏธ์คํธ๋, ์์ด์ ํธ๋ค์๊ฒ โ์ก์ !โ ์ฌ๋ ์ดํธ๋ฅผ ์น๋ค
ํ๋์ค์ ๋ํ AI ์คํํธ์ ๋ฏธ์คํธ๋ AI๊ฐ Agents API๋ฅผ ์ถ์ํ์ต๋๋ค โ ์ด๊ฑด AI๊ฐ ์๋์ ์ธ ๊ธฐ๋ก์์ ์ญํ ์ ๋์ด์ ๋ฅ๋์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํ ์ ์๋๋ก ํด ์ฃผ๋ ํดํท์ ๋๋ค. ์ฝ๋ ์คํ, ์น ๊ฒ์ ๋ฑ์ ์ํ ๋ด์ฅ ์ปค๋ฅํฐ์ ์ค์ผ์คํธ๋ ์ด์ ๊ธฐ๋ฅ, ์์์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ฐ์ถ ์ด API๋ ๋ณธ๊ฒฉ์ ์ธ ์ํฐํ๋ผ์ด์ฆ๊ธ ์ํฌํ๋ก์ฐ๋ฅผ ์ํด์ ๊ตฌ์ถ๋ ๊ฒ์ด๋ผ๊ณ ํฉ๋๋ค. ๋ฏธ๊ตญ๊ณผ ์ค๊ตญ์ ์คํํธ์ ์ด ์น๊ณ ๋๊ฐ๋ ๊ฐ์ด๋ฐ, ๋ฏธ์คํธ๋๋ ์คํํ๋ ์์จ ์ด์์คํดํธ ์ํ๊ณ๋ฅผ ์กฐ์ฉํ ๊ตฌ์ถํ๊ณ ์๋ค์.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
Adaptive reasoning model ARM (๋ณต๋จ๋ํ๊ต์ ์คํ์ด์ค์ฃผ๋ฆฝ๋)์ ์์ ์ ๋์ด๋์ ๋ฐ๋ผ์ ๋ค ๊ฐ์ง ์ถ๋ก ํ์ (์ง์ ๋ต๋ณ, ์งง์ CoT, ์ฝ๋, ๊ธด CoT) ์ค์์ ํ๋๋ฅผ ๋ค์ด๋๋ฏนํ๊ฒ ์ ํํ๋ ๋ชจ๋ธ์ ๋๋ค. Format Collapse๋ฅผ ๋ฐฉ์งํ๋ GRPO ๋ณํ ํํ Ada-GRPO๋ก ํ๋ จ๋ ARM์, ์ ํ๋๋ฅผ ์ ์งํ๋ฉด์ ํ ํฐ ์ฌ์ฉ๋์ ํ๊ท ~30%, ์ต๋ 70%๊น์ง ์ค์ฌ์ค๋๋ค. ์ฝ 2๋ฐฐ ์ ๋ ํ๋ จ ์๋๊ฐ ํฅ์๋๋ฉฐ, ์ ์ํ, ๋ช ๋ น ์ ๋ํ, ํฉ์ ์ ๋ํ ์ถ๋ก ๋ชจ๋๋ฅผ ์ง์ํฉ๋๋ค.
TabSTAR (Technion-IIT)๋ ๊ณ ์ ๋์ง ์์ ํ ์คํธ ์ธ์ฝ๋์ ๋ชฉํ ์ธ์ (Target-Aware) ํ ํฐ์ ์ฌ์ฉํด์, ์๋ฏธ์ ์ผ๋ก ์ ๋ ฌ๋, ๊ทธ๋ฆฌ๊ณ ์์ ๋ณ๋ก ํนํ๋ ์๋ฒ ๋ฉ์ ์์ฑํ๋ ํ ์ด๋ธ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ์ ๋๋ค. TabSTAR๋ ๋ฐ์ดํฐ์ ๋ณ ํ๋ผ๋ฏธํฐ ์์ด ๋ถ๋ฅ์ ํ๊ท๋ฅผ ์ง์ํ๊ณ , (๋น์ฐํ๊ฒ๋) ํ ์คํธ ํ ์ด๋ธ ๋ฐ์ดํฐ์ ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค. 50๊ฐ์ ๋ฐ์ดํฐ์ ์ผ๋ก ์ํํ ํ๊ฐ์์, ๋ถ๋ฅ ์์ ์์๋ GBDT์ ๋ค๋ฅธ TFM๋ค์ ๋ฅ๊ฐํ๋ฉฐ, ์ต๋ 0.874์ ์ ๊ทํ๋ AUROC๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. 350๊ฐ ๋ฐ์ดํฐ์ ์ ๊ฑธ์น ์ฌ์ ํ๋ จ์ผ๋ก ์ค์ผ์ผ๋ง ๋ฒ์น์ ๋ณด์ฌ์ฃผ์๊ณ , ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ฉด ์ฑ๋ฅ์ด ๋ ์ข์์ง๋๋ค. TabSTAR๋ ๋จ์ผ A40 GPU์์ 48์๊ฐ ์ด๋ด์ ํ๋ จํ ์ ์์ต๋๋ค.
rStar-Coder (๋ง์ดํฌ๋ก์ํํธ ๋ฆฌ์์น ์์์)๋ 41๋ง 8์ฒ๊ฐ์ Competitive-Level ํ๋ก๊ทธ๋๋ฐ ๋ฌธ์ ์ 58๋ง๊ฐ์ ๊ธด ์ถ๋ก ์๋ฃจ์ ์ผ๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ์ ์ผ๋ก, ๋ชจ๋ ๋ค์ํ ํ ์คํธ ์ผ์ด์ค๋ฅผ ํตํด์ ๊ฒ์ฆ๋์์ต๋๋ค. 3๋ง 7์ฒ 7๋ฐฑ๊ฐ์ ์ ๋ฌธ๊ฐ ๋ฌธ์ ๋ฅผ ์ ๋ณํ๊ณ 38๋ง๊ฐ์ ์๋ก์ด ๋ฌธ์ ๋ฅผ ํฉ์ฑํ๋๋ฐ, 3๋จ๊ณ ํ ์คํธ ์ ๋ ฅ ์์ฑ ๋ฐฉ๋ฒ๊ณผ ์ถ๋ ฅ์ด ์ ํํ๋๋ก ๋ณด์ฅํ๊ธฐ ์ํด์ ์ํธ ๊ฒ์ฆ์ ํด์, ๋ ์ด๋ธ๋ง ์ ํ๋๊ฐ 96.8%์ ๋ฌํฉ๋๋ค. rStar-Coder๋ก ํ๋ จ๋ ๋ชจ๋ธ๋ค์ QWQ-32B๋ฅผ ๋ฅ๊ฐํ๊ณ , 7B ๋ชจ๋ธ์ด LiveCodeBench์์ 57.3%, USACO 2025์์ 16.15%๋ฅผ ๊ธฐ๋กํ๋ฉด์ ํจ์ฌ ํฐ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ๋ฐ์ด๋์์ต๋๋ค.
์ถ๋ก (Reasoning) ๋ฐ Inference ์ต์ ํ
WebDancer๋ ๋ธ๋ผ์ฐ์ง, ์ํ๋ง, ํ์ธํ๋, ๊ฐํํ์ต์ ๊ตฌ์กฐํ๋ ํ๋ จ ํ์ดํ๋ผ์ธ์ ์ฌ์ฉํด์ ์ฐ๊ตฌ ์์ ์ ํจ์จ์ ์ผ๋ก ํด๊ฒฐํ๋ ์๋ ํฌ ์๋ ์์ด์ ํธ ์ ๋ณด ํ์ ์์ด์ ํธ๋ฅผ ๊ตฌ์ถํ๊ฒ ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Universal Reasoner๋ ๊ณ ์ ๋ LLM์ ํ๋ฌ๊ทธ ์ค ํ๋ ์ด์ ์ถ๋ก ๋ชจ๋์ ์ถ๊ฐํด์ ์ฌํ๋ จ์ด ์์ด๋ ํต์ฌ ๊ธฐ๋ฅ์ ์์์ํค์ง ์์ผ๋ฉด์ ์ถ๋ก ์ ์กฐํฉํด์ ํ ์ ์๋๋ก ํฉ๋๋ค.
โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]PATS๋ ์์ ์ ๋์ด๋์ ๋ฐ๋ผ์ โ๋จ๊ณ(Step)โ ์์ค์์ LLM ์ถ๋ก ์ ๋ต์ ๋ค์ด๋๋ฏนํ๊ฒ ์กฐ์ , ์๋์ ์ ํ์ฑ์ ๋ชจ๋ ์ต์ ํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
R2R๋ ๋ฐ์ฐํ๋ ์ถ๋ก ํ ํฐ๋ง ๋ํ ๋ชจ๋ธ๋ก ๋ผ์ฐํ ํ๊ณ ๋๋จธ์ง๋ ์ํ ๋ชจ๋ธ์ด ์ฒ๋ฆฌํ๋๋ก ํด์ ์ ํ์ฑ์ ์์ค์ ์ต์ํํ๋ฉด์๋ ์๋ ํฅ์์ ํ ์ ์๊ฒ ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
ํธ๋ ์ด๋ ์ ๋ต ๋ฐ ๊ฐํํ์ต
Advancing Multimodal Reasoning via RL with Cold Start๋ ์ง๋ ํ์ธํ๋๊ณผ ๊ฐํํ์ต์ ๊ฒฐํฉํด์ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ์ฑ๋ฅ์ ํฅ์์์ผ ์ฃผ๋๋ฐ, ์ํ/์๊ฐ ๋ฒค์น๋งํฌ์์ ๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ํ์ธํ๋๋ง ํ๊ฑฐ๋ ๊ฐํํ์ต๋ง ํ ๊ฒฝ์ฐ ๋๋น ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Surrogate Signals from Format and Length๋ ์ ๋ต์ด ํ์ ์์ด โํ์โ๊ณผ โ์๋ต ๊ธธ์ดโ๋ฅผ ๋๋ฆฌ ๋ณด์ (Proxy Rewards)์ผ๋ก ์ฌ์ฉํด์ ์ํ์ฉ LLM์ ํ๋ จ์์ผ, ํ๋ จ์ ํจ์จ์ฑ์ ๊ฐ์ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
The Entropy Mechanism of RL for Reasoning LLMs๋ LLM ๊ฐํํ์ต์์ ์ํธ๋กํผ ๋ถ๊ดด๋ฅผ ๋ถ์ํ๊ณ ํ๋ จ ์ค์ ํ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์กดํ๋ ๊ธฐ๋ฒ์ ์ ์ํด์ ์ฑ๋ฅ์ ํฅ์์์ผ ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Enigmata๋ ๊ฒ์ฆ ๊ฐ๋ฅํ ํผ์ฆ ์์ ์ ์ฌ์ฉํด์ LLM์ ๋ ผ๋ฆฌ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ํฉ์ฑ ํผ์ฆ ๋ฒค์น๋งํฌ, ๊ทธ๋ฆฌ๊ณ ๊ฐํํ์ต ํ๋ จ ์ค์ํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ ์(Adaptation) ๋ฐ ํ์ธํ๋ ๊ธฐ๋ฒ
GraLoRA PEFT์์ ๊ณผ์ ํฉ์ ๋ฐฉ์งํ๊ณ ํ์ค LoRA๋ณด๋ค ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ์ธ๋ถํ๋ ์ ๋ญํฌ ์ ์ ๊ตฌ์กฐ๋ฅผ ๋์ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
introduces a granular low-rank adaptation structure that prevents overfitting in PEFT and improves performance over standard LoRA โread the paperHow Does Alignment Enhance LLMs' Multilingual Capabilities? ์ ๋ ฌ ํ ๋ค๊ตญ์ด LLM์ ๋ด๋ฐ ์์ค ๋ณํ๋ฅผ ๋ถ์ํ์ฌ ์๋ฐ์ ๊ต์ฐจ ์ธ์ด ์ ์์ ๋ํ ํต์ฐฐ์ ์ ๊ณตํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
analyzes neuron-level changes in multilingual LLMs after alignment, offering insights into spontaneous cross-lingual adaptation โread the paper
์ดํ๋ฆฌ์ผ์ด์ ๋ฐ ์์คํ
Paper2Poster๋ ์ต์ํ์ ๋น์ฉ์ ๋ค์ฌ์ ๋ ผ๋ฌธ์ ๊ตฌ์กฐํ๋ ๋ ์ด์์์ผ๋ก ์์ถํ๋ ๋ฉํฐ ์์ด์ ํธ ์์คํ ์ ์ฌ์ฉ, ํ์ ํฌ์คํฐ ์ ์์ ์๋ํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
ZeroGUI๋ VLM์ ์ฌ์ฉํด์ ์์ ์ ์์ฑํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํจ์ผ๋ก์จ, ์ฌ๋์ ์ ๋ ฅ ์์ด GUI ์์ด์ ํธ๋ฅผ ์จ๋ผ์ธ์ผ๋ก ํ๋ จ์์ผ ์ค์ค๋ก ์๊ฒฐ์ ์ผ๋ก ์๋ํ๋ GUI ์๋ํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Discrete Markov Bridge๋ ์๋ก์ด ํ๋ ฌ/์ ์ ํ์ต ์กฐํฉ์ ํตํด์ ์ด์ฐ ๋ฐ์ดํฐ ํํ์ ํ์ต, ํ ์คํธ ๋ฐ ์ด๋ฏธ์ง ๋ฒค์น๋งํฌ์์ ๋ฒ ์ด์ค๋ผ์ธ์ ๋์ด์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Are Reasoning Models More Prone to Hallucination?์ ๋ค์ํ ํ๋ จ ๋ฐฉ๋ฒ์ด LLM์ ํ๊ฐ์ ๋ฏธ์น๋ ์ํฅ์ ํ๊ตฌํ๊ณ ๋ชจ๋ธ์ ๋ถํ์ค์ฑ์ ์ฌ์ค์ฑ (Factuality) ์ค๋ฅ์ ์ฐ๊ฒฐํด์ ์ดํดํ ์ ์๋๋ก ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply