- Turing Post Korea
- Posts
- ๐FOD#111: 'AI แแ งแผแแ ขแผ'แแ ฆแแ ฅ แแ ตแแ ตแซแแ กแแ ณแซ แแ ฅแบ
๐FOD#111: 'AI แแ งแผแแ ขแผ'แแ ฆแแ ฅ แแ ตแแ ตแซแแ กแแ ณแซ แแ ฅแบ
+ แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
8์์ ์์๊ณผ ํจ๊ป, ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์๋ 2025๋ ํ๋ฐ๊ธฐ๋ฅผ ์๋กญ๊ฒ ์ถ๋ฐํฉ๋๋ค.
์ฐ์ , ๊ธฐ์กด์ ๋ง์ ๋ถ์ด ์ฌ๋ํด ์ฃผ์ โAI 101โ ์๋ฆฌ์ฆ๋ฅผ ํตํด์ ๊ณ์ํด์ ์๋กญ๊ฒ ๋ฑ์ฅํ๋ AI ๋ชจ๋ธ๊ณผ ๊ธฐ๋ฒ๋ค์ ๊พธ์คํ ์๊ฐํ ์์ ์ธ๋ฐ์. ๊ธ์ฃผ์๋ โGLM5, Kimi K2, DeepSeek, Qwen ๋ฑ ์ค๊ตญ์ AI ๋ชจ๋ธ๋คโ์ ๋ํด์ ์์๋ณด๋ ์ํผ์๋๋ฅผ ์ค๋นํฉ๋๋ค.
๊ทธ๋ฆฌ๊ณ , ์ ๋ง ๋ง์ด ์ธ๊ธ๋๊ณ ์์ง๋ง ๊ณผ์ฐ ๊ทธ๊ฒ ๋ฌด์์ธ์ง๋ถํฐ ์์ง ๋ช ํํ ์ด์ผ๊ธฐ๋์ง ์๊ณ ์๋, โAI Literacyโ์ ๋ํ ์๋ก์ด ์๋ฆฌ์ฆ๋ฅผ ์์ํ ์์ ์ด๋ ๋ง์ ๊ธฐ๋, ๊ณต์ ๋ถํ๋๋ฆฝ๋๋ค.
์น์ดํด์ง๋ โAI ๋ ์ด์ค(Race)โ, ์ด ๊ฒฝ์์์ โ์ด๊ธด๋คโ๋ ๊ฑด ๋ฌด์จ ๋ป์ผ๊น?
โAI ๋ ์ด์คโ, โAI ๊ฒฝ์โ.
๋ณธ๊ฒฉ์ ์ผ๋ก ์์๋ ๊ฒ ๊ฐ์ต๋๋ค.
๋ฐฑ์ ๊ด์์ ์ต๊ทผ์ ๋ฐํํ โAI Action Planโ์ ๋ณด๋ฉด, ๋ฏธ๊ตญ์ โ์์ฌ์ ์ฌ์ง์๋, ๋๊ตฌ์๊ฒ๋ ๋์ ๋ฐ์ง ์๋ ๊ธ๋ก๋ฒ ๊ธฐ์ ์ฐ์โ๋ฅผ ํ๋ณดํ๊ธฐ ์ํ ์ ๋ฉด์ ์ ๋์ ํ๊ณ ์๋ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค. ์ด ๋ฌธ์๋ โ๊ฒฝ์โ์ด๋ผ๋ ์์ฌ๋ก ๊ฐ๋ ์ฐจ ์๋๋ฐ, โ์ฐ์ ํ๋ช , ์ ๋ณด ํ๋ช , ๊ทธ๋ฆฌ๊ณ ๋ฅด๋ค์์ค๊น์ง ํ๊บผ๋ฒ์ ์ผ์ด๋๋ ์๋โ๋ฅผ ์๊ณ ํ๊ณ ์์ต๋๋ค.
์์ฑํด์ ์ ๋ต์ ๋ช ํํฉ๋๋ค: ๋ฏผ๊ฐ ๋ถ๋ฌธ์ ํ๋ ฅ์ ๋ถ์ด๋ฃ๊ณ , ์ธํ๋ผ๋ฅผ ๋น ๋ฅด๊ฒ ๊ตฌ์ถํ๊ณ , ๊ณต๊ธ๋ง์ ์์ ํํ๊ฒ ๋ค๋ ๊ฒ ๊ทธ ํต์ฌ์ ๋๋ค.

AI Action Plan์ โ์คํ์์ค(Open-Source) ๋ฐ ์คํ ๊ฐ์ค์น(Open-Weight)โ AI์ ๋ํ ์ ์
ํ์ง๋ง, ์ด๋ ๊ฒ โ๊ฒฝ์โ์๋ง ์ด์ ์ ๋ง์ถ๋ค๋ฉด, AI๊ฐ ํ์ค์์ ํผ์ณ์ง๋ฉด์ ๋ํ๋๋, ํจ์ฌ ๋ ๋ณต์กํ๊ณ ๋ค๋ฉด์ ์ธ ํ๋ฆ์ ๋์น๊ฒ ๋ ์ํ๋ ์์ต๋๋ค. ๊ฐ๊ตญ์ ์ ๋ถ๊ฐ ๊ฑฐ๋ํ AI ์ ๋ต์ ์ธ์ฐ๋ ๋์, AI ๊ธฐ์ ๊ทธ ์์ฒด๋ ์ค์ ๋ก ์์ฃผ ๋ค์ํ ๋ฐฉํฅ์์ ํ์ฐ๋๋ฉด์ ๋ณํ๋ฅผ ๋ง๋ค์ด๋ด๊ณ ์์ผ๋๊น์.
์๋ฅผ ๋ค๋ฉด, AI๋ ์ด๋ฏธ ๊ตญ๊ฐ์ ๊ฒฝ๊ณ๋ฅผ ๋์ด์ ์กฐ์ฉํ๊ฒ ์ฐ๋ฆฌ์ ์ผ์ ์ โ๋๊ตฌโ๋ก ์๋ฆฌ๋ฅผ ์ก์๊ฐ๊ณ ์์ต๋๋ค. ์ง๋ ์ฃผ ๊ณต๊ฐ๋ ๊ตฌ๊ธ์ โOpalโ ํ๋ก์ ํธ๋ โ๋ณต์กํ๊ฒ ์ฝ๋ฉ์ ํ์ง ์๊ณ ์์ฐ์ด ๋ช ๋ น, ์๊ฐ์ ์ธ ํธ์ง๋ง ํด๋ ๋ฏธ๋ ์ฑ์ ์ฝ๊ฒ ๋ง๋ค ์ ์๊ฒ ํด ์ฃผ๋ ๊ตฌ๊ธ ๋ฉ์ค์ ์คํ์ ์ธ ํ๋ซํผโ์ธ๋ฐ, ์ด๋ฐ ๊ฑด AI๋ฅผ ์ผ๋ฐ ์ฌ์ฉ์์ ์ผ์์ ๋ ์ธ๋ชจ์๋ ๊ธฐ์ ๋ก ๋ง๋ค๊ณ ์ ํ๋ ์๋๊ฒ ์ฃ .
๊ทธ๋ ์ง๋ง, ํ์ฌ ์์ ์์ ๋ฌด์๋ณด๋ค AI๋ฅผ ๋๋ฌ์ผ โ์ง์ ํ์ ํ๋โ๊ฐ ๋จ์ํ ์ ์ฑ ์ ๋์ด์ โ๊ฒฝ์ ๋ ฅโ์ด๋ผ๋ ํ์ค์ ์ธ ํ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌํธ๋๊ณ ์๋ค๋ ๊ฑด ๋ถ์ธํ๊ธฐ ์ด๋ ต์ต๋๋ค. ๊ทธ๋ฐ ์์ค์, ์ ๋ ดํ๋ฉด์๋ ์ฑ๋ฅ์ด ๋ฐ์ด๋ ์ค๊ตญ์ฐ AI ๋ชจ๋ธ๋ค์ด ์ ์ธ๊ณ ์์ฅ์ ๋น ๋ฅด๊ฒ ์นจํฌํ๋ฉด์, ๋ฏธ๊ตญ ์ ๋ถ์ ์ ๋ต๋ ๋ ์ด์ โ๊ฐ๊ฒฉโ๊ณผ โ์ ๊ทผ์ฑโ์ ๋ฌด์ํ ์๋ ์๋ ์ํฉ์ด ๋๊ณ ์๊ตฌ์.
์ด๋ ๊ฒ, โAI๋ฅผ ๋๋ฌ์ผ ํ์คโ์ ๋ณต์กํ ํ๋ฆ์ผ๋ก ๋ํ๋ฉ๋๋ค. ๊ฐ์ธ, ๊ตญ๊ฐ, ์ธ๊ณ ๊ฐ๊ฐ์ ๋ ๋ฒจ์์ ๋์์ ๋ค์ธต์ ์ผ๋ก ์ ๊ฐ๋๊ณ ์์ฃ .
๊ทธ๋ ๊ธฐ ๋๋ฌธ์, ๋จ์ํ โ์ด๊ธด๋ค๋ ๊ฒโ์๋ง ์ด์ ์ ๋ง์ถ๋ ์ ๋ถ์ ์ ๋ต์, โ์ ๋ต์ ์ธ ์ฐฉ์คโ๊ฐ ๋ ์๋ ์์ต๋๋ค. ๋ฏธ๊ตญ์ โAI Action Planโ ๋ฟ ์๋๋ผ ์ฐ๋ฆฌ๋๋ผ์ AI ํฌ์ ๊ณํ๋, ๋๋ฆ๋๋ก ์ฌ๋ฌ๊ฐ์ง ๋ฉด์์ ์ ์ง์ฌ ์๊ธฐ๋ ํ ํ ๊ณ ๋ ธ๋ ฅ์ ํ ๊ณํ์ด๊ฒ ์ต๋๋ค๋ง, ๊ฒฐ๊ตญ ๋ณธ์ง์ ์ผ๋ก๋ โ๋ค์ซ์๊ฐ๋ ์ ๋ต(Catch-up Play)โ์ ๊ฐ๊น์ต๋๋ค. ๋ ํฐ ๋ฌธ์ ๋, ์ด ๊ฒฝ์์ ๋์ด ๋ง์น ์คํฌ์ธ ๊ฒ์์ฒ๋ผ ๋จ์ํ ์์๋๊ฐ ์๋๋ผ, ์ฐ๋ฆฌ๊ฐ ์์ง ์ค๋นํ์ง ๋ชปํ, ์ ํ ์๋ก์ด ๊ฒฝ์ ์ , ์ฌํ์ ํ๊ฒฝ์ผ ์๊ฐ ์๋ค๋ ๊ฑฐ์์.
ใ์ด์ฝ๋ ธ๋ฏธ์คํธใ์ ์ต๊ทผ ๋ถ์ ๊ธฐ์ฌ๋ฅผ ๋ณด๋ฉด, ์ธ๊ฐ ์์ค์ AI์ ๋๋ฌํ๊ฒ ๋๋ฉด, ์ธ๊ณ ๊ฒฝ์ ๋ ์ฐ๊ฐ 20% ์ด์์ ์ฑ์ฅ๋ฅ ์ ๋ณด์ผ ์ ์์ ๊ฑฐ๋ผ๊ณ ํฉ๋๋ค. ์ด ์ ๋์ ๋ณํ๋ผ๋ฉด, ์ด๊ฑด ๋จ์ํ ๊ธฐ์ ํ์ ์ด ์๋๋ผ, ์ผ์ข ์ โ๋จ๊ณ์ ์ ํ(Phase Change)โ ์ ๋๋ผ๊ณ ๋ด์ผ๊ฒ ์ฃ . AI๊ฐ ์ค์ค๋ก ์๋ก์ด ์ง์์ ๋ฐ๊ฒฌํ๊ณ ์ฐฝ์ถํ ์ ์๊ฒ ๋๋ค๋ฉด, ๋ถ์ ์ถ์ ์๋๋ ์๋ง ์ฐ์ ํ๋ช ์๊ธฐ๋ฅผ ๋์ด์๊ฒ ๋ ๊ฒ๋๋ค.
ํ์ง๋ง ์ด๋ฐ ๊ธ๊ฒฉํ ์ฑ์ฅ์ ๋๋ถ๋ถ ๊ทน์ฌํ ํผ๋์ ํจ๊ป ์ผ์ผํค๊ธฐ๋ ํ์ฃ . ํ ์์ธก ์๋ฃ๋ฅผ ๋ณด๋ฉด, ์ฌ๋์ ์ธ์ง ๋ ธ๋, ๋ค์ ๋งํด์ โ์ง์ ๋ ธ๋โ์ ๊ฐ์น๊ฐ, ๊ฒฐ๊ตญ์ ์ปดํจํฐ์ ์ฐ์ฐ ๋น์ฉ ์์ค์ผ๋ก ๋จ์ด์ง ๊ฑฐ๋ผ๊ณ ์ด์ผ๊ธฐํ๋๋ฐ์. ๋ค์ ๋งํด์, AI๊ฐ ๋ง๋ ์ ํ์ ๊ฑฐ์ ๋ฌด๋ฃ๊ฐ ๋๋ ๋ฐ๋ฉด์, ์ฌ๋์ด ์ ๊ณตํ๋ ์๋น์ค๋ ์์ฒญ๋๊ฒ ๋น์ธ์ง๋ โ์ด์ํ ๋ฌผ๊ฐ ๊ตฌ์กฐโ๊ฐ ๋ฐ์ํ ์๋ ์๋ค๋ ๊ฒ๋๋ค.
๋ฏธ๊ตญ์ โAI Action Planโ์์๋ โ๋ฏธ๊ตญ ๋ ธ๋์์ ์ญ๋ ๊ฐํโ ํ์์ฑ์ ์ธ๊ธํ๊ธฐ๋ ํ๋๋ฐ, ๋ค๋ง ์ด ๊ฑฐ๋ํ ๋ณํ์ ๊ท๋ชจ์ ๋นํด์ ๊ทธ ํด๋ฒ์ผ๋ก ์ ์ํ ์ฌ๊ต์ก, ๊ทธ๋ฆฌ๊ณ ์ผ์๋ฆฌ ์ฐฝ์ถ์, ๊ธ์์, ์ข ๋ถ์กฑํด ๋ณด์ด๊ธฐ๋ ํฉ๋๋ค. ๋งํ์๋ฉด, 22์ธ๊ธฐ์ ๋ฌธ์ ๋ฅผ 20์ธ๊ธฐ์ ๋ฐฉ๋ฒ์ผ๋ก ํด๊ฒฐํ๋ ค๋ ๋๋์ด๋ผ๊ณ ๋ ํ ๊น์?
๋ฏธ๊ตญ์ ํฌํจํ ๋ชจ๋ ์ ๋ถ์์, โAI ์๋์ ๊ณ ๋ํ๋ ๊ฒฝ์ ํ๊ฒฝ์์ ์ ์ผ์๋ฆฌ๋ฅผ ์ฐพ๋๋ก ๋๊ฒ ๋คโ๊ณ ๋ง๋ค์ ํ์ง๋ง, ์ ์ ๋ ์ค์ํ ์ง๋ฌธ์ ๋ฌป์ง ์๋๋ค๊ณ ์๊ฐํฉ๋๋ค - ๋ฐ๋ก, โ๊ทธ๋ฐ ๊ฒฝ์ ํ๊ฒฝ์์๋ผ๋ฉด, ์ข์ ์ถ์ด๋ผ๋๊ฒ ์ด๋ค ๋ชจ์ต์ผ๊น?โํ๋ ์ง๋ฌธ์ด์.
์ด๊ฒ๊ณผ ๊ด๋ จํด์, ์ธ๋ป ๋ณด๋ฉด ์๊ด์์ด ๋ณด์ผ ์๋ ์์ง๋ง, ใNature Human Behaviourใ์ ํ ์ฐ๊ตฌ๋ฅผ ์ดํด๋ณด์๊ธฐ๋ฅผ ๊ถํ๊ณ ์ถ์ต๋๋ค. ์ด ์ฐ๊ตฌ์์๋, ์ฃผ 4์ผ ๊ทผ๋ฌด์ ๋ฅผ ์ํํ ๊ฒฐ๊ณผ, ์ง์๋ค์ ๋ฒ์์์ด ์ค๊ณ , ์ ๋ฐ์ ์ธ ๊ฑด๊ฐ๊ณผ ์ถ์ ์ง์ด ๊ฐ์ ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ๋ฌผ๋ก , ์ฃผ 4์ผ์ ๊ฐ ๋ต์ด๋ผ๊ณ ์ด์ผ๊ธฐํ๋ ๊ฑด ์๋๊ณ , ์ผํ๋ ์๊ฐ๋ณด๋ค ์ค์ํ ์์๊ฐ ์์ ๊ฑฐ๋ผ๊ณ ๋ฏฟ์ง๋ง, ์ด์จ๋ ์ค์ํ ์ ํ์ ๊ณผ ์ฐ๋ฆฌ์ ์ผ์ ํจํด ๊ฐ์ ์๊ด๊ด๊ณ๊ฐ ์์์ง ๋ชจ๋ฅธ๋ค๋ ์ , ํํธ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ฑด ์๋๊น ์๊ฐํฉ๋๋ค. โ์ฑ๊ณผโ๋ง์ด ์๋, ์กฐ๊ธ ๋ค๋ฅธ ๋ชฉํ๋ฅผ ํฌํจํ๋ ๊ด์ ์ ๋ณํ ์๋์, ์ผ ์์ฒด๋ฅผ ์ฌ์ค๊ณํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ดํด๋ณด์๋ ์์ง์์ด์ฃ .
์ง๊ธ, ๋ฏธ๊ตญ์ โAI Action Planโ์ ๋น ์ ธ ์๋ ๋ถ๋ถ์ด ์ด ๋ถ๋ถ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. AI๋, ์ฐ๋ฆฌ์๊ฒ ๋ ๋ง์ ์ ํ๊ณผ ์๋น์ค๋ฅผ ์๊ฒจ์ฃผ๋ ๊ธฐ์ ์ด ๋๋ฉด ๋ ๊น์? ์๋๋ฉด ๋ ๋ง์ ์๊ฐ, ๋๋ ์ง๊ธ๊ณผ๋ ๋ค๋ฅธ ํจํด์ ์ถ์ ์๊ฒจ์ค ์ ์๋ ๋ฌด์ธ๊ฐ๊ฐ ๋์ด์ผ ํ๋ ๊ฑธ๊น์? AI๊ฐ, ๋จ์ํ ๋ ธ๋์ ๋์ ํด ์ฃผ๋ ๋๊ตฌ๊ฐ ์ด๋ , ์๋ฅผ ๋ค์๋ฉด ๋ฒ์์ ์๋ ์ถ์ ๊ฐ๋ฅํ๊ฒ ํด ์ฃผ๋ ๋๋ฐ์๊ฐ ๋ ์ ์์๊น์?
๋ค๊ฐ์ฌ โ์ด์ง๋ฅโ์ ์๋, ์ ๋ถ๊ฐ ํด์ผ ํ ์ผ์ ๋ ๊ฐ์ง์ ๋๋ค: ํ๋๋ ๊ธฐ์ ํ์ ์ ์ ๊ทน์ ์ผ๋ก ์ด์งํ๋ ์ผ์ด๊ณ , ๋ค๋ฅธ ํ๋, ์ด์ฉ๋ฉด ๋ ์ค์ํ ์ญํ ์, ์๋ก์ด ์ฌํ ๊ณ์ฝ๊ณผ ์์คํ ์ ์ค๊ณ์๊ฐ ๋๋ ๊ฒ๋๋ค.
AI๊ฐ ๊ฐ์ ธ์ค๊ฒ ๋ โ๋ฏธ๋์ ํ์คโ์ ๋จ์ํ์ง ์์ ๊ฒ๋๋ค. ๊ทธ ๋ชจ์ต์ ๊ตฌ์ฒด์ ์ผ๋ก ๊ทธ๋ ค๋ณด๊ณ , ์ง์ํ๊ณ , ์ฌ๋์ ๋ ธ๋์ด ์๋ฏธํ๋ ๊ฐ์น๊ฐ ๊ทผ๋ณธ์ ์ผ๋ก ์ฌ์ ์๋ ๋ฏธ๋์ ๊ฑธ๋ง์ ์๋ก์ด ๊ธฐ์ค๊ณผ ์์คํ ์ ๋ง๋ค์ด์ผ ํฉ๋๋ค. ๋ถํ๋ฑ, ์ถ์ ์๋ฏธ, ์ธ๊ฐ์ ์กด์์ฑ ๊ฐ์ ๋ฌธ์ ๋ฅผ ์๋ก์ด ์๋์ ๋งฅ๋ฝ์์ ๊น์ด ์๊ฒ ๋ค๋ค์ผ ํ ๋์ ๋๋ค.
โ๊ฒฝ์์์ ์ด๊ธด๋คโ๋ ๋ง, ์์ฃผ ๋จ์ํ๊ณ ์ฐ๋ฆฌ์ ๋ง์์ ํ๋๋ ๋ง์ ๋๋ค. ํ์ง๋ง, ๊ทธ ๊ฒฝ์ ์์ฒด๊ฐ ์คํ๋ ค ์ฐ๋ฆฌ์๊ฒ ์ฐฉ์ ํจ๊ณผ๋ฅผ ์ฃผ๋ ๊ฒ์ผ ์๋ ์์ต๋๋ค.
์ง์ ํ ์น๋ฆฌ๋, ๊ฐ์ฅ ๊ฐ๋ ฅํ AI๋ฅผ ๋จผ์ ๋ง๋๋ ๋ฐ ์๋ ๊ฒ์ด ์๋๋ผ, ๊ทธ AI์ ํจ๊ป ๊ฐ์ฅ ๋ฒ์ํ๊ณ , ๊ณต์ ํ๊ณ , ์ธ๊ฐ๋ค์ด ์ฌํ๋ฅผ ๋ง๋๋ ๋ฐ ์๋ ๊ฒ ์๋๊น์? ์ฐ๋ฆฌ๊ฐ ์ค์ง ์๋์ ์๋ง ์ง์คํ๋ค๋ฉด, ๋ง์ ๋๋ฌํ ๊ฒฐ์น์ ๋๋จธ์๋, ์ฐ๋ฆฌ๊ฐ ๋ ์ด์ ์์๋ณผ ์ ์๋ ์ธ์์ด ํผ์ณ์ ธ ์์์ง๋ ๋ชจ๋ฅด๋๊น์.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
๊ฐํํ์ต(RL), ์ด์ ๋ ์ด์ ์์ ์ฒ๋ผ PPO์๋ง ๋จธ๋ฌผ๋ฌ ์์ง ์์ฃ . ๋ถ๊ณผ ์ง๋ ๋ ๋ฌ ์ฌ์ด์ ์ฐ๊ตฌ์๋ค์ด LLM, VLM, ์์ด์ ํธ๊ฐ ํ์ตํ๋ ๋ฐฉ์, ํ์ธํ๋ํ๋ ๋ฐฉ์์ ์์ ํ ๋ฐ๊ฟ๋ฒ๋ฆฌ๋ ์๋ก์ด ๊ฐํํ์ต ๊ธฐ๋ฒ๋ค์ ์ ๋ณด์์ต๋๋ค.
์ค๋์ ํ ๋ฒ ์์๋ ๋งํ ์ต์ ์ โ์ ์ฑ ์ต์ ํ(Policy Optimization)โ ๊ธฐ๋ฒ 9๊ฐ์ง๋ฅผ ์๊ฐํฉ๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
If writing is thinking by Steven Sinofsky
๋ง์ดํฌ๋ก์ํํธ์์ ์๋์ฐ์ฆ ์ฌ์ ๋ถ๋ฅผ ์ด๋์๊ณ ์ง๊ธ์ a16z์ Board Partner๋ก ์ผํ๋ฉด์ ํ๋ฐํ๊ฒ ์ ์ ํ๋์ ํ๊ณ ์๋ Sinofsky์ ๊ธ์ธ๋ฐ์. โ๊ธ์ฐ๊ธฐ๋ ์ฌ๊ณ ๊ทธ ์์ฒดโ๋ผ๋ ์ด์ผ๊ธฐ๋ฅผ ํ๊ณ ์์ต๋๋ค. ๊ธฐ์ ์์ ์์ฃผ ๋ณด๊ฒ ๋๋ ๊ธด ๋ฌธ์, ๋ณด๊ณ ์ ๋ฑ์ด ์ฌ์ค ์ฝํ์ง ์๊ณ ์์ฐ๊ณผ ์ ์ฅ์ ์ฌ์ดํด์ ๋ฐ๋ณตํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์๋ฐ์, ๊ธ์ฐ๊ธฐ๋ฅผ ํตํด์ ์ค์ค๋ก์ ์๊ฐ์ โ์ธ๋ถํโํ๊ณ ์ ๋ฆฌํ๋ ๊ณผ์ ์์ฒด๊ฐ ์ค์ํ ์ฌ๊ณ ํ๋ จ์ด ๋๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค. AI๊ฐ ๊ธ์ ๋์ ๋๋ฌด๋ ์ ์จ ์ฃผ๋ ์๋์ด์ง๋ง, ์ง์ ํ ๊ฐ์น๋ ๊ธ์ ์ด ์ฌ๋์ด ์ฃผ์ ์ ๊น์ด ๋ชฐ์ ํด์ ์ค์ค๋ก ์๊ฐํ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ํ๋ ๊ฒ์ ์๋ค๊ณ ์ด์ผ๊ธฐํ๋ฉด์, ๋จ์ํ ์์ฝ์ด๋ ์๋์ ์ธ ๋ฌธ์ ์์ฑ ๊ณผ์ ์ ๊ทธ ๋ณธ์ง์ ๋ด์๋ด๊ธฐ ์ด๋ ต๋ค๊ณ ๊ฒฝ๊ณ ํฉ๋๋ค. ์ฆ, ๊ธ์ ์ฐ๋ ํ์ ์์ฒด๊ฐ ์๊ฐ์ ์์ฑํ๊ณ ๋ฐ์ ์ํค๋ ํต์ฌ ๋ฉ์ปค๋์ฆ์ด๋ผ๋ ๋ฉ์์ง๋ค์.
A mini Moravec's paradox within robotics observed by Jim Fan
์๋น๋์์ ๋ก๋ณดํฑ์ค ์ฑ ์์์ธ Jim Fan, ์ ๊ฐ ์์ฃผ ์ข์ํ๋ ์ฐ๊ตฌ์์ด๊ธฐ๋ ํ๋ฐ์. Jim์ด ์ต๊ทผ ํธ์์์ ๋ก๋ด๊ณตํ ๋ถ์ผ์์์ ๋ฏธ๋ ๋ชจ๋ผ๋ฒก์ ์ญ์ค(Mini Moravecโs Paradox)์ ์ธ๊ธํ์ต๋๋ค. ๋ฐ๋ก, ์ฌ๋์๊ฒ๋ ์์ฃผ ์ด๋ ค์ด ์ฒด์กฐ ๋์๋ค(์: ์๋๋ ค ํ๊ฟ์น๋ก ๋ชธ์ ๋ค์ด ์ฌ๋ฆฌ๊ธฐ ๋ฑ)์ด ๋ก๋ด์๊ฒ๋ ๋น๊ต์ ์ฝ์ง๋ง, ์ผ์์ ์ด๊ณ ์ค์ฉ์ ์ธ ์์ (์๋ฆฌ, ์ฒญ์, ์กฐ๋ฆฝ ๋ฑ)์ ํจ์ฌ ๋ ์ด๋ ต๋ค๋ ์ ์ ์ง์ ํ ๊ฒ๋๋ค. ์ด๋ฐ ์ญ์ค์ ๋จ์ํ ๊ธฐ์ ์ด ๋ถ์กฑํด์๊ฐ ์๋๋ผ, ํ๊ฒฝ์ ๋ํ ์ดํด์ ์ ์๋ ฅ ๋ถ์กฑ โ ์ฆ, ๊ฐ๊ฐ๊ณผ ์ํธ์์ฉ์ ํตํ ์ค์ํ ๋์์ ๋ชจ๋ฐฉํ๋ ๊ฒ์ ์ด๋ ค์ โ ์์ ๋น๋กฏ๋ ๊ฑฐ๋ผ๋ ๊ฒ๋๋ค. Jim์ ๋ง์ ๊ฒฝ์ฐ์ ์ด๋ฃจ์ด์ง๋ ๋ก๋ด ๋ฐ๋ชจ๊ฐ ์ง๋์น ๊ณผ์ ํฉ(overfitting) ๋ชจ๋ธ์ ๊ธฐ๋ฐํด์ โ๋ชจ์ ๋ฐ๋ชจ์ฉ ๋์โ์ ์น์ค๋์ด ์๊ณ , ์ฃผ๋ณ ํ๊ฒฝ์ ์ ๋๋ก ์ธ์ํ๊ฑฐ๋ ๋์ํ๋ ์ผ๋ฐํ๋ ๋ฅ๋ ฅ์ ๋ถ์กฑํ๋ค๊ณ ๋นํํ๊ณ , ์ด๋ฐ ํ์์ด ์ ๊ณ ์ ๋ฐ์ ๋ฌธ์ ๋ผ๊ณ ์ง๋จํ์ต๋๋ค. ํฌ๊ฒ ๊ณต๊ฐํฉ๋๋ค.
AI Market Clarity by Elad Gil (really great overview!)
๋์ด์ผ๋ณด๋ฉด, ์ง๋ 12๊ฐ์๊ฐ ์์ฑ AI ์์ฅ์ ๊ตฌ์กฐ๋ ์ด์ ๋ณด๋ค ํจ์ฌ ๋ช ํํด์ก๋ค๊ณ ๋ด ๋๋ค. ์์ฅ ๊ตฌ์กฐ๊ฐ ๋ช ํํด์ง๋ฉด, ์ค์ํ ์์ญ์์ ์ ๋ ฅํ ๊ธฐ์ ๋ค์ด ๋ชจ์ต์ ๋๋ฌ๋ด์ฃ . ํ์ด๋ฐ์ด์ ๋ชจ๋ธ(ํนํ LLM) ๋ถ์ผ์์๋ ์คํAI, ๊ตฌ๊ธ(Gemini), ์ค์ฐ๋กํฝ, ๋ฉํ(Llama), ๋ง์ดํฌ๋ก์ํํธ, Mistral, X.AI ๋ฑ์ด ๊ฝค ๋ช ํํ๊ฒ ์์ฅ์ ๋ฆฌ๋๋ก ์๋ฆฌ ์ก์๊ณ , ์ฝ๋ฉ(Code), ๋ฒ๋ฅ (Legal), ์๋ฃ ๊ธฐ๋ก(MedicalโฏScribing), ๊ณ ๊ฐ ๊ฒฝํ(Customer Service), ๊ฒ์(Search/IR) ๋ฑ์์๋ ํต์ฌ์ ์ธ ํ๋ ์ด์ด๋ค์ด ์ ์ฐจ ๋ฆฌ๋์ ์๋ฆฌ๋ฅผ ์ฐจ์งํ๊ณ ์์ต๋๋ค. ๋์์ ํ๊ณ, ์ปดํ๋ผ์ด์ธ์ค, ๊ธ์ต ํด, ์์ ์๋ํ, ๋ณด์ ๋ฑ ๋ค์ ํ์ ์ ๊ธฐํ๊ฐ ์ด๋ฆด ์ ์์ฅ๋ค๋ ๋์ ๋๋๋ค. Elad๋ ์ด์ AI ์์ฅ์์ PMF(Product-Market Fit)์ GoโtoโMarket ์ ๋ต์ด ์น๋ถ๋ฅผ ๊ฐ๋ฅผ ๊ฒ์ด๊ณ , ์์ผ๋ก์ ๋์ฝ์ ๊ธฐ์ ์ ์ธ ๋ฐ์ (Model Fidelity)๊ณผ ์คํ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ํ์ ์ญ๋์ผ๋ก๋ถํฐ ๋น๋กฏ๋ ๊ฒ์ด๋ผ๊ณ ๊ฐ์กฐํ๊ณ ์์ต๋๋ค. ํนํ ๋จ์ํ ์ธํฐํ์ด์ค ๊ธฐ๋ฐ AI(Chat)์์ ๋ฒ์ด๋ ์ฌ์ฉ์๋ฅผ ๋์ ํด์ ํ๋ํ๊ณ ๊ฒฐ์ ๊น์ง ์ํํ๋ AI ์์ด์ ํธ(Agent) ์ค์ฌ์ ์ํ๊ณ๋ก ์ ํ ์ค์ด๋ผ๋ ๊ฑธ ์ค์ํ ํ๋ฆ์ ํ๋๋ก ์ง๊ณ ์์ต๋๋ค.
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
์ค์ฐ๋กํฝ, โ๊ฐ์ฌ(Auditor)๋ฅผ ๊ฐ์ํ๋ ๊ฐ์ฌ(Auditor)โ๋ฅผ ํ๋ จ
์ค์ฐ๋กํฝ์ด AI ์์คํ ์ ์ ๋ ฌ ์คํจ(Alignment Failure)๋ฅผ ๊ฐ์ํ๊ธฐ ์ํ ์ธ ์ข ๋ฅ์ AI ์์ด์ ํธ๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ์ด ์์ด์ ํธ๋ค์ โ์จ๊ฒจ์ง ๋ชฉํโ๋ฅผ ์ฐพ์๋ด๊ฑฐ๋, ๋ณด์ ๋ชจ๋ธ์ ๊ณผ๋ํ๊ฒ ์์(Sycophancy)ํ๋ ํ์, โ์ค์์ค์์ ์์ ์ถ์ฒํ๊ธฐโ ๊ฐ์ ๋ชจ๋ธ์ ์ด์ํ ํ๋๋ค์ ๊ฐ์งํฉ๋๋ค. ์ค์ ๋ก ํ ์์ด์ ํธ๋ ๋จ ํ๋์ ๋ด๋ด ํผ์ฒ(Neural Feature) ์์ ์จ์ด ์๋ 52๊ฐ์ง์ ํธํฅ(Bias)์ ๋ฐํ๋ด๊ธฐ๋ ํ๋ค๊ณ ํฉ๋๋ค. ๋, ์ฌ๋ฌ ๊ฐ์ AI ๊ฐ์ฌ ์์ด์ ํธ๋ฅผ ์กฐํฉํ โ์ํผ ์์ด์ ํธ ์์๋ธโ๋ก ๋ฌธ์ ์ ๊ฐ์ง์จ์ ํฌ๊ฒ ํฅ์์์ผฐ๋ค๊ณ ํฉ๋๋ค.
์ค์ฐ๋กํฝ์ ์ด๋ฐ ์๋๋ ๋ถ๋ช ํ ํ์ฅ ๊ฐ๋ฅํ๊ณ ๋ฐ๋ณต ๊ฐ๋ฅํ Alignment Oversight(์ ๋ ฌ ๊ฐ์) ์ฒด๊ณ๋ฅผ ๋ง๋ค์ด๊ฐ๊ธฐ ์ํ ๋ฐ์ ์ด๋ผ๊ณ ๋ณผ ์ ์๊ณ , ๋์์ AI๊ฐ ์ค์ค๋ก๋ฅผ ๋๋์๋ณด๋ ์๊ธฐ ์ฑ์ฐฐ์ ๊ธฐ๋ฅ์ ํ ๊ฑธ์ ๋ ๋ค๊ฐ๊ฐ ์ฌ๋ก์ด๊ธฐ๋ ํฉ๋๋ค.
๋ฉํ, ๊ณ์ํด์ ์คํAI์ ์ฃผ์ AI ์ธ๋ ฅ ์์
์คํAI์์ ๊ธฐ์ ํ(Technical Staff)์ผ๋ก ์ผํ๋ Shengjia Zhao๊ฐ ์ด์ ๋ฉํ์ Superintelligence Lab์ ์์ ๊ณผํ์(Chief Scientist)๋ก ํฉ๋ฅํ์ต๋๋ค. ์์ง ์จ๋ณด๋ฉ ์ํ์ธ ๊ฒ์ผ๋ก ๋ณด์ด๋ค์. ๊ทธ๋ฆฌ๊ณ ๊ณง LLaMA ์คํ์ผ์ ์๋ก์ด ๋ชจ๋ธ๋ ๊ณต๊ฐ๋ ๋ฏํฉ๋๋ค.

Image Credit: Alexander Wang Twitter
์ค๊ตญ, AI ๋๋งน ๊ฒฐ์งํ๋ฉด์ ์๋ฆฝ์ ๊ฐ์ํ
์ํ์ด AI ์ปจํผ๋ฐ์ค์์, ์ค๊ตญ์ ์ฃผ์ ํ ํฌ ๊ธฐ์ ๋ค์ด ๊ตญ์ฐ(์ค๊ตญ์ฐ) AI ๊ธฐ์ ์คํ์ ๊ฐํ๋ฅผ ์ํด์ ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ฐ๋ฐ์ฌ๋ค๊ณผ ๋ฐ๋์ฒด ์ ์ฒด๋ค์ ์ฐ๊ฒฐํ๋ ๋ ๊ฐ์ง์ ์ฃผ์ ๋๋งน์ ๋ฐํํ์ต๋๋ค. ์๋ง๋ ๋ฏธ๊ตญ์ ์ ์ฌ๊ฐ ๊ฐํ๋๋ ๊ฐ์ด๋ฐ, ๊ธฐ์ ์๋ฆฝ์ ์ํ ์ ๋ต์ ํ๋ณด๋ก ํ์ด๋ ์ ์๊ฒ ์ฃ .
ํ์จ์ด๋ 384๊ฐ ์นฉ์ผ๋ก ๊ตฌ์ฑํ ์ ๊ท ํด๋ผ์ฐ๋ ์์คํ 'CloudMatrix'๋ฅผ ๊ณต๊ฐํด์ ์ฃผ๋ชฉ๋ฐ์๊ณ , ํ ์ผํธ๋ ์์ฒด ๊ฐ๋ฐํ 3D ์๋ ์์ง์ผ๋ก ์์ ์ ๋์์ต๋๋ค. ํํธ, ๋ฐ์ด๋๋ ๋์งํธ ํด๋จผ, ์๋ฆฌ๋ฐ๋ฐ๋ ์ค๋งํธ ๊ธ๋ผ์ค๋ฅผ ์ ๋ณด์ด๋ฉด์, ๊ด๋๊ฐ๋ค์๊ฒ ์๊ธฐ์์ผฐ์ต๋๋ค: โ์ค๋ฆฌ์ฝ ๋ฐธ๋ฆฌ๋ง์ด ์ ๋ถ๋ ์๋๋คโ๋ผ๋ ๊ฒ์์.
ํ ์ฌ๋ผ, ์ผ์ฑ์ โํ ์ฌ์ค ์ฌ์ด์ฆโ์ ์๋ช ์ค์ ๋์ง๋ค
ํ ์ฌ๋ผ๊ฐ ์ผ์ฑ๊ณผ ์ฒด๊ฒฐํ 165์ต ๋ฌ๋ฌ ๊ท๋ชจ์ ๋ฐ๋์ฒด ๊ณ์ฝ์, ์ค๋ซ๋์ ์ง์ฐ๋์ด์จ ์ผ์ฑ์ ํ ์ฌ์ค ๋ฐ๋์ฒด ๊ณต์ฅ์ ์๋ก์ด ํ๋ ฅ์ ๋ถ์ด๋ฃ๋ ๋์์ ๊ณ ์ ์ค์ธ ํ์ด๋๋ฆฌ ์ฌ์ ์๋ ์จํต์ ํ์์ค ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค. ์ด ๊ณต์ฅ์์๋ ํ ์ฌ๋ผ์ AI6 ์นฉ์ด ์์ฐ๋ ์์ ์ธ๋ฐ, ์ด ์นฉ์ ์์จ์ฃผํ์ฐจ์ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ํ์ฌ๋ ํต์ฌ ๋ถํ์ด์ฃ .
์ด๋ฒ ํ๋ ฅ์ด ํ ์ฌ๋ผ์ ๋ถ์งํ ์ ๊ธฐ์ฐจ ํ๋งค ์ํฉ์ ํด๊ฒฐํด์ฃผ์ง ๋ชปํ๊ฒ ์ง๋ง, ์ผ์ฑ์ด TSMC์ ๊ทธ๋์ ๋ฒ์ด๋๋ ๋ฐ ํ ๊ฑธ์ ๋ค๊ฐ์๋ ๊ณ๊ธฐ๋ ๋ ์๋ ์์ผ๋ฆฌ๋ผ๋ ํฌ๋ง์ ๊ฐ์ ธ ๋ด ๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
์ต์ด์ ๊ฑฐ๋ ์๊ฐ ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋ธ
Memories.ai์ ์ฐ๊ตฌ์ง์ด ์ต์ด์ ๊ฑฐ๋ ์๊ฐ ๋ฉ๋ชจ๋ฆฌ ๋ชจ๋ธ(LVMM)์ ๊ณต๊ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๋ฉํฐ๋ชจ๋ฌ LLM์ด ๋ฌด์ ํ์ ์๊ฐ ์ ๋ณด๋ฅผ ๊ธฐ์ตํ๊ณ ์ถ๋ก ํ ์ ์๋๋ก ํด ์ค๋ค๊ณ ํ๋๋ฐ์! ์์ ๋ถ๋ฅ(K400, UCF101), ์์ ๊ฒ์(MSRVTT, ActivityNet), ์ง์์๋ต(NextQA, Temp Compass) ๋ฑ์์ ์ต์ฒจ๋จ ์ฑ๋ฅ(SOTA)์ ๊ธฐ๋กํ๊ณ ์์ต๋๋ค.
์ด ๋ชจ๋ธ์ ์ธ๊ฐ์ ๊ธฐ์ต ๋ฐฉ์์ ๋ชจ๋ฐฉํด์ ์ง์, ๊ฒ์, ์ ๋ชจ๋ฌ(Full-Modal) ์์ธ, ์ ํ, ๋ฐ์ถ, ์ฌ๊ตฌ์ฑ์ 6๋จ๊ณ๋ก ์๊ฐ ์ ๋ณด๋ฅผ ์ ๋ฐํ๊ฒ ๊ฒ์ยทํํฐ๋งํ๊ณ ๋ณต์กํ ์ง๋ฌธ์ ๋ํด ์ถ๋ก ํ ์ ์๋๋ก ์ค๊ณ๋์๋ค๊ณ ํฉ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]Z.ai (์ Zhipu)์ GLM-4.5 ๋ชจ๋ธ
Z.ai(์ Zhipu์์^.^)์์ ํ๋ผ๋ฏธํฐ ์ 3550์ต ๊ฐ์ ์คํ์์ค MoE ๋ชจ๋ธ์ธ GLM-4.5์ ๊ฒฝ๋ ๋ฒ์ GLM-4.5-Air (1060์ต ๊ฐ)๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ 12๊ฐ ๋ฒค์น๋งํฌ์์ ๊ธ๋ก๋ฒ 3์, ์คํ์์ค ์ค์์๋ 1์๋ฅผ ๊ธฐ๋กํ๊ณ , ์ถ๋ก , ์ฝ๋ฉ, ์์ด์ ํธ ์ํ ๋ฅ๋ ฅ์ ๋ชจ๋ ๊ฐ์ท๋ค๊ณ ํฉ๋๋ค. ์ด๋น 100ํ ํฐ ์ด์์ ์์ฑ ์๋, ํฉ๋ฆฌ์ ์ธ ๊ฐ๊ฒฉ($0.11/$0.28 per Input/Output Million Tokens), ์จํ๋ ๋ฏธ์ค ๋ฐฐํฌ ์ง์, ๊ทธ๋ฆฌ๊ณ ์์จ์ ์ธ ๋ฉํฐ์คํ ํ์คํฌ ๊ณํ ๋ฐ ์๊ฐํ๊ฐ ๊ฐ๋ฅํ ์์ด์ ํธ ๋ค์ดํฐ๋ธ ์ํคํ ์ฒ๋ฅผ ๊ฐ์ถ๊ณ ์์ต๋๋ค. โ> [๋ณด๋์๋ฃ ๋ณด๊ธฐ]
Qwen ํ โ Qwen3-Coder-480B ๋ชจ๋ธ
Qwen ํ์ 4800์ต ํ๋ผ๋ฏธํฐ์ MoE ๋ชจ๋ธ Qwen3-Coder-480B-A35B-Instruct๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. 35B์ ํ์ฑ ํ๋ผ๋ฏธํฐ์ ๊ธฐ๋ณธ 25๋ง ํ ํฐ ์ปจํ ์คํธ(์ต๋ 100๋ง๊น์ง ํ์ฅ)๋ฅผ ์ง์ํ๊ณ , SWE-Bench Verified ๋ฐ ์์ด์ ํธ ์์ ์์ SOTA ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค. ์ด 7.5์กฐ ํ ํฐ(70% ์ฝ๋)์ผ๋ก ํ๋ จํ๊ณ , ๋๊ท๋ชจ ์ฝ๋ RL ๋ฐ ์์ด์ ํธ RL์ ํ์ฉํ ํ์ฒ๋ฆฌ๋ฅผ ๊ฑฐ์ณค๋ค๊ณ ํฉ๋๋ค. Qwen Code, Claude Code ๋ฑ CLI ๊ธฐ๋ฐ ์ฝ๋ฉ๊ณผ ์คํAI ํธํ API(Dashscope)๋ฅผ ์ง์ํฉ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]
Sapient์ ๊ณ์ธต์ ์ถ๋ก ๋ชจ๋ธ
Sapient Intelligence๋ ๋์์ ์๊ฐ์ ๋ฐ์ ๊ตฌ์กฐ๋ก ๋ง๋ Hierarchical Reasoning Model (HRM; ๊ณ์ธต์ ์ถ๋ก ๋ชจ๋ธ)์ ๊ฐ๋ฐํ์ต๋๋ค. ๋จ 1,000๊ฐ์ ์ํ๋ก ์ฌ์ ํ์ต ์์ด ํ๋ จํ ์ด ๋ชจ๋ธ์ ARC-AGI-2, Sudoku-Extreme, 30x30 ๋ฏธ๋ก ๋ฌธ์ ๋ฑ์์ ๊ธฐ์กด LLM๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์๋ค๊ณ ํฉ๋๋ค. ๋ค์ค ์๊ฐ ์ฒ๋(Multi-Timescale)์ ์ด์ค ์ํ(Dual Recurrent) ๋คํธ์ํฌ๋ฅผ ํ์ฉํด์ ๋น ๋ฅด๊ณ ์ถ์์ ์ธ ์ถ๋ก ์ ํ ์ ์๋๋ฐ, ๊ธฐํ ์์ธก(S2S)์์ 97% ์ ํ๋๋ฅผ ๋ฌ์ฑํ๊ณ , ์๋ฃยท๋ก๋ณดํฑ์ค ๋ถ์ผ์๋ ์ ์ฉํ๊ธฐ ์ํด์ ํ ์คํธ ์ค์ ๋๋ค.
โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]Yume: ๋ฌดํํ ์ธํฐ๋ํฐ๋ธ ์์ ์ธ๊ณ๋ฅผ ์์ฑํ๋ค
์ํ์ด AI ๋ฉ๊ณผ ํธ๋จ๋์์, ํค๋ณด๋ ์กฐ์์ผ๋ก ๋ฌดํํ ์ธํฐ๋ํฐ๋ธ ์์ ์ธ๊ณ๋ฅผ ์์ฑํ๋ ์์คํ 'Yume'๋ฅผ ๋ฐํํ์ต๋๋ค. MVDT, AAM, TTS-SDE ์ํ๋ฌ ๋ฑ ์ฒจ๋จ ๊ธฐ์ ์ ํตํฉํ๊ณ , Sekai-Real-HQ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐ์ผ๋ก ํ์ต๋์์ต๋๋ค. Wan-2.1, MatrixGame๋ณด๋ค ๋์ ์ง์ ์ดํ ์ ์(0.657โ0.743), ํผ์ฌ์ฒด ์ผ๊ด์ฑ(0.932), ์์ ๋ถ๋๋ฌ์(0.986)์ ๊ธฐ๋กํ์ต๋๋ค. ์ ๋์ ์ฆ๋ฅ ๋ฐ ์บ์ฑ์ ํตํด์ ์ฐ์ฐ ์๋๋ ๊ฐ์ ํ๋ค๊ณ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Franca: ํ์ฅ ๊ฐ๋ฅํ ์๊ฐ ํํ ํ์ต์ ์ํ ์ค์ฒฉ ๋งํธ๋ฃ์์นด ํด๋ฌ์คํฐ๋ง ๊ธฐ๋ฒ
Franca์์, DINOv2๋ CLIP ๊ฐ์ ์์ฉ ๋ชจ๋ธ์ ๋ฅ๊ฐํ๊ฑฐ๋ ๋ง๋จน๋, ์ต์ด์ ์์ ์คํ์์ค ๋น์ ๋ชจ๋ธ์ ๋๋ค. ImageNet-21K, LAION-600M ๋ฑ ๊ณต๊ฐ ๋ฐ์ดํฐ๋ก๋ง ํ๋ จํ๊ณ , Matryoshka ํด๋ฌ์คํฐ๋ง๊ณผ RASA ๊ธฐ๋ฒ์ ํตํด์ ํํ์ ์ ๋ฐ๋์ ๊ณต๊ฐ ํธํฅ ์ ๊ฑฐ๋ฅผ ๊ฐํํ์ต๋๋ค. ์ง์ ์ฆ๋ฅ๋ ๋น๊ณต๊ฐ ๋ฐ์ดํฐ ์์ด๋ 86% ImageNet ์ ํ๋, ํ์ํ OOD ๊ฐ์ง, 3D ์ดํด, ์ธ๋ถํยท์ค๋ฒํด๋ฌ์คํฐ๋ง ์ฑ๋ฅ์ ๋ณด์๋ค๊ณ ํฉ๋๋ค. ์ฝ๋, ์ฒดํฌํฌ์ธํธ, ๋ฐ์ดํฐ ๋ชจ๋ ๊ณต๊ฐ๋์ด ์์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Gr-3: ๋ฒ์ฉ์ ๋ก๋ด ์ปจํธ๋กค์ ์ํ VLA ๋ชจ๋ธ
ByteDance์์๋ ์์ ๋ก๋ด์ ์ ์ดํ๋ 4B ํ๋ผ๋ฏธํฐ์ VLA ๋ชจ๋ธ GR-3์ ๊ณต๊ฐํ์ต๋๋ค. ์น ๊ธฐ๋ฐ ๋น์ -์ธ์ด ๋ฐ์ดํฐ, VR ๊ธฐ๋ฐ์ผ๋ก ํ ์ฌ๋์ ์์ฐ, ๋ก๋ด ๊ถค์ 252์๊ฐ ๋ถ๋์ ํตํฉ ํ์ตํ์ต๋๋ค. Pick-and-Place, ํ ์ด๋ธ ์ ๋ฆฌ, ์ท ์ ๊ธฐ ๋ฑ ์ค์ ์์ ์์ ๊ธฐ์กด ๋ชจ๋ธ ๋๋น ํ์ ํ ๋์ ์ฑ๊ณผ๋ฅผ ๋ณด์๊ณ , Flow Matching ๊ธฐ๋ฐ์ ํ๋ ์์ธก, RMSNorm ์์ ํ, ์์ ์ํ ์์ธก ๋ฑ์ ํตํด์ ์ง์๋ฅผ ์ดํํ๋ ๋ฅ๋ ฅ์ด ํฌ๊ฒ ๋์์ก๋ค๊ณ ํฉ๋๋ค. GR-3๋ ByteMini ๋ก๋ด์ ํ์ฌ๋์ด์ ํ์ค์์ ์ ๋ฐํ ๋์ ์ํ์ ํ ์ ์์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ถ๋ก (Reasoning) ์ต์ ํ๋ฅผ ์ํ ๊ฐํํ์ต
๐ Group Sequence Policy Optimization (by Qwen)์ ํ ํฐ ๋จ์๊ฐ ์๋ ์ํ์ค ๋จ์์ ์ค์๋ ๋น์จ์ ํ์ฉํด์, ๊ฐํํ์ต์ ์์ ์ฑ๊ณผ ์ํ ํจ์จ์ฑ์ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ RefCritic: Training Long Chain-of-Thought Critic Models with Refinement Feedback (by Chinese Academy of Science and Alibaba)์ ์ด์ค ์ ์ ๋ฐ ์ ๋ต ์ ํธ๋ฅผ ํ์ฉํ ๊ฐํํ์ต ๊ธฐ๋ฐ ๋นํ์(Critic) ํ๋ จ์ ํตํด์, ๊ธด ํ์์ Chain-of-Thought(CoT) ์ถ๋ก ํ๊ฐ ๋ฐ ํํฐ๋ง ์ฑ๋ฅ์ ๊ฐ์ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning์ RLVR(๊ฐํํ์ต ๊ธฐ๋ฐ ์๊ฐ ์ถ๋ก ) ํ๋ จ์์ ๋๋ฉ์ธ ๊ฐ์ ์ํธ์์ฉ์ ๋ถ์ํด์, ๋ฉํฐ๋๋ฉ์ธ ์ถ๋ก ์ฑ๋ฅ์ด ์ด๋ป๊ฒ ์ผ๋ฐํ๋๊ฑฐ๋ ์ถฉ๋ํ๋์ง๋ฅผ ๋ฐํ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ The Invisible Leash: Why RLVR May Not Escape Its Origin (by Stanford University, University of Tokyo, RIKEN AIP, University of Washington)์ RLVR์ด ๊ธฐ๋ณธ(Base) ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋์ด์ ์๋ก์ด ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฅํ ์ ์๋์ง์ ๋ํ ์๋ฌธ์ ์ ๊ธฐํ๊ณ , ํ์ ๋ฅ๋ ฅ์ ํ๊ณ๋ฅผ ๋๋ฌ๋ด ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๊ธด ์๊ณ์ด ์ถ๋ก ๊ณผ ํ ์คํธ ์์ ์์์ ์ ์ํ ์ถ๋ก
๐ Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning (by MIT CSAIL, Subconscious Systems Technologies, Princeton University, Tel Aviv University)์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ณ ๋ คํ ์ถ๋ก ๋ฐฉ์๊ณผ ํจ๊ป ์ฌ๊ท์ ์ธ ํธ๋ฆฌ ๊ตฌ์กฐ ์์ ์ ์ํํ๋๋ก ๋ชจ๋ธ์ ํ๋ จ์์ผ์, ์ฅ๊ธฐ์ ์ถ๋ก (Long-horizon Reasoning)์ ํ ์ ์๊ฒ๋ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ MUR: Momentum Uncertainty guided Reasoning for Large Language Models์์๋ ์ถ๋ก ์ ๊ฐ ๋จ๊ณ์ ๋ถํ์ค์ฑ ์์ค์ ๋ฐ๋ผ์ ์ฐ์ฐ๋์ ๋ค์ด๋๋ฏนํ๊ฒ ์กฐ์ ํจ์ผ๋ก์จ, ๋ถํ์ํ ๊ณผ๋ํ ์ฐ์ฐ(Overthinking)์ ์ค์ด๊ณ ์ ํ๋๋ฅผ ๋์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Inverse Scaling in Test-Time Compute (by Chinese Academy of Science and Alibaba)๋ ํ ์คํธ ์์ ์ ์ถ๋ก ์ ๊น์ด๋ฅผ ๋๋ ค์ ์คํ๋ ค ์ฑ๋ฅ์ ์ ํ์ํค๋ ์คํจ ์ฌ๋ก๋ค์ ๋ณด์ฌ์ฃผ๊ณ , ํนํ ์ด๋ค ๋ฐฉํด ์์๋ ์ ์ฝ ์กฐ๊ฑด์ด ์๋ ๊ฒฝ์ฐ์ ๊ทธ๋ฐ ํ์์ด ๋๋๋ฌ์ง๋์ง๋ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐Does More Inference-Time Compute Really Help Robustness? (by Princeton University, NVIDIA, Carnegie Mellon University, Google DeepMind)๋ ์ถ๋ก ์ค์ผ์ผ๋ง(Inference Scaling)์ ํน์ ํ ์กฐ๊ฑด(์ ํ๋ ์ ๋์ ํ๊ฒฝ ๊ฐ์)์์๋ ๊ฒฌ๊ณ ์ฑ์ ๋์ฌ์ฃผ์ง๋ง, ๊ทธ ์ธ์ ์ํฉ์์๋ ์คํ๋ ค ์ฑ๋ฅ์ ์ ํ์ํฌ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ฉํฐ๋ชจ๋ฌ, Embodied, GUI-์ค์ฌ ์ถ๋ก
GUI-G2: Gaussian Reward Modeling for GUI Grounding์ GUI ํ๊ฒฝ์์์ Grounding์ ๋จ์ํ ์ ๋ต/์ค๋ต(Binary) ํ๋จ์ด ์๋ Gaussian Reward Landscape์ผ๋ก ์ฌ๊ตฌ์ฑํด์, ํจ์ฌ ๋ ์ ๋ฐํ ๊ณต๊ฐ์ ์ถ๋ก ์ ํ ์ ์๊ฒ ํด ์ค๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning (by NVIDIA)์ ์๊ฐ ๊ธฐ๋ฐ ์ ์ฌ ์ถ๋ก ๊ณํ(Visual Latent Reasoning Plan)์ ํ๋ ํผ๋๋ฐฑ์ ๊ฐํ ํ์ต์ผ๋ก ๊ฒฐํฉํด์, ๊ณํ๊ณผ ํ๋ ์ฌ์ด์ ๊ฐ๊ทน์ ์ค์ด๊ณ ์ค์ฒดํ๋ ์์ด์ ํธ์ ์คํ ๋ฅ๋ ฅ์ ํฅ์์ํต๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Experience is the Best Teacher: Grounding VLMs for Robotics through Self-Generated Memory๋ ๋ก๋ด์ ์๊ฐ ์์ง ๊ฒฝํ ๋ฉ๋ชจ๋ฆฌ(Self-Curated Experience Memory)๋ฅผ ํ์ฉํด์, VLM(Vision-Language Model)์ ์ค์ ๋ก๋ด ์์ ์ ์ ๋ชฉ์ํค๊ณ ์ฑ๋ฅ์ ๊ฐ์ ํฉ๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
ํน์ํ Adaptation ๋ฐ Mitigation
Mitigating Object Hallucinations via Sentence-Level Early Intervention์ ๋ฌธ์ฅ ๋จ์์ ์ ํธ๋ ๋ชจ๋ธ(Sentence-level Preference Model)์ ํ๋ จ์์ผ์, MLLM(๋ฉํฐ๋ชจ๋ฌ LLM)์์ ํ๊ฐ(Hallucination)์ด ๋ฐ์ํ๊ธฐ ์ ์ ์กฐ๊ธฐ์ ๊ฐ์งํ๊ณ ๊ฐ์ ํจ์ผ๋ก์จ ์๋ชป๋ ์์ฑ ๊ฒฐ๊ณผ๋ฅผ ์ค์ ๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ DriftMoE: A Mixture of Experts Approach to Handle Concept Drifts (by CeADAR, University College Dublin)๋ MoE ๋ผ์ฐํฐ์ ์ ์ง์ ํธ๋ฆฌ ์ ๋ฌธ๊ฐ(Incremental Tree Experts)๋ฅผ ์จ๋ผ์ธ ํผ๋๋ฐฑ ๋ฃจํ์์ ๊ณต๋ ํ์ต์์ผ์, ์คํธ๋ฆฌ๋ฐ ๋ฐ์ดํฐ ํ๊ฒฝ์์ ์ ์๋ ฅ ์๊ฒ ๋์ํ ์ ์๊ฒ ํด ์ค๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐A New Pair of GloVes (by Stanford University)๋ ์๋ก์ด ์ฝํผ์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ํ๋ GloVe ๋ฒกํฐ๋ฅผ ์ฌํ๋ จํ๊ณ , ๋ช ํํ ๋ฌธ์ํ์ ํจ๊ป ๊ฐ์ฒด๋ช ์ธ์(NER) ๋ฐ ๋จ์ด ์ ์ฌ๋์์ ์ฑ๋ฅ์ ํฅ์์์ผ ์ค๋๋ค. โ [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply