- Turing Post Korea
- Posts
- ๐FOD#128: แแ ฉแแ ฆแฏแแ ด แแ งแจแแ ตแซแแ ต แแ ฉแจแแ กแฏแแ ขแปแแ ฅแซ แแ ตแแ กแซ
๐FOD#128: แแ ฉแแ ฆแฏแแ ด แแ งแจแแ ตแซแแ ต แแ ฉแจแแ กแฏแแ ขแปแแ ฅแซ แแ ตแแ กแซ
แแ ฉแแแ ตแแ งแซ แแ กแซ แแ ฌแฏ แแ ฉแแ ฆแฏแแ ณแฏแ แ ฉ แแ ตแแ ตแซ แแ ณแบแแ ต แแ ฅแทแแ งแแ กแซ แแ กแซ แแ ฎ + แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ งแซแแ ฎ
๋ ํ ๋ฒ์ โ๋ชจ๋ธ ์ ์โ์ ์๋ง?
์ง๋ ์ฃผ์ ๋ชจ๋ธ ์ถ์ ์์๋ค๋ง ๋๊ณ ๋ณด๋ฉด, ๋ณดํต์ด๋ผ๋ฉด 2~3๊ฐ์์น ๋์ฌ ๋ด์ค๊ฑฐ๋ฆฌ๊ฐ ํ๊บผ๋ฒ์ ๋์จ ๋๋์ด๋ผ๊ณ ๋ ํ ๊น์?
(์ฌ๋) ์ํผ๋ชจ๋ธ๋ค์ด ์ง๋ ์ฃผ ๋ฏธ์ค ์ ๋๋ฒ์ค ๋ํ์์ ๋น๋๋ ๋ฐ๋ก ๊ทธ ๋, ์๋ง์ AI ์ฐ๊ตฌ์๋ค๋ ๋ง์น ๋ฏธ์ค ์ ๋๋ฒ์ค ํ๋ณด๋ค์ด ๊ฒฝ์ํ๋ฏ์ด โ์ํผ ๋ชจ๋ธโ๋ค์ ์ค์ค์ด ๋ด๋จ์ต๋๋ค.

๋ฏธ์ค ์ ๋๋ฒ์ค 2025. Image Credit: ๋ก์ดํฐ ํต์
์ฐ์ฐ์ผ๊น์? ๊ธ์์, ์ด์จ๋ ๋ ์ธ๊ณ ๋ชจ๋ โ์ํผ ๋ชจ๋ธ ์ ์โ์ด ๋ฒ์ด์ง ๊ฑด ๋ง๋ ๊ฒ ๊ฐ์ต๋๋ค.
์ด๋ฒ FOD์์๋, ์ง๋ ์ฃผ ๋์จ ์ค์ํ ๋ชจ๋ธ๋ค์ด ์ด๋ค ๊ฑด์ง, ๊ฐ๊ฐ ์ด๋ค ๊ฐ์ ์ ๊ฐ์ง๊ณ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ์ด๋ค ์ํฉ์์ ์ด๋ค ๋ชจ๋ธ์ ์ ํํ๋ฉด ์ข์์ง ํ ๋ฒ ๊ฐ์ด ์ดํด๋ณด๊ฒ ์ต๋๋ค.
๋จผ์ , ์์ฆ AI ํ์ ๋ถ์๊ธฐ๋ฅผ ์ ๋๋ก ์ฃผ๋ํ๊ณ ์๋ โ์คํ์์คโ ๊ณ์ด์ ๋ชจ๋ธ๋ถํฐ ๋ณด์ฃ .
Olmo 3: ์คํ์์ค ์ต์ด๋ก โํธ๋ ์ด๋ ์ ๊ณผ์ โ์ ์คํ ๋ฆฌ๋ณด๋์ฒ๋ผ ์์ ํ ๊ณต๊ฐ
AI2๋ ์ง๊ธ๊น์ง ๋ํ ์ฐ๊ตฌ์๋ค์ด ๋๋ด ํ์ง ์๋ ์ผ์ ํด๋์ต๋๋ค: ๋จ์ํ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ง ๊ณต๊ฐํ ๊ฒ์ด ์๋๋ผ, ์ ์ฒด์ ํ๋ จ ํ๋ฆ โ ๋ฐ์ดํฐ, ์ฝ๋, ์ฒดํฌํฌ์ธํธ, ํ๊ฐ ํ์ดํ๋ผ์ธ๊น์ง โ ์ ๋ถ ๊ณต๊ฐํ์ต๋๋ค. ํ๋ฆฌํธ๋ ์ด๋๋ถํฐ ๊ฐํํ์ต, ํฌ์คํธํธ๋ ์ด๋ ์ฒดํฌํฌ์ธํธ๊น์ง ๋ชจ๋ ๋จ๊ณ๊ฐ ๋ค ๊ณต๊ฐ๋์ด ์์ด์! ์ ๋ง, ๋ฐ์๋ฅผ ๋ฐ์ ๋ง ํฉ๋๋ค.
์ ์ด๋ฐ ์์ง์์ด ์ค์ํ ๊น์?
Olmo 3๋ ์ถ๋ก ๋ฅ๋ ฅ์ด ์ด๋ป๊ฒ ์ด๋ค ๋จ๊ณ๋ฅผ ๊ฑฐ์น๋ฉด์ ์๊ฒจ๋๋์ง ๊ทธ ๊ณผ์ ์ ๊ทธ๋๋ก ๋ณผ ์ ์๋ค๋ ์ ์ด ๊ฐ์ฅ ํฐ ํน์ง์ ๋๋ค.
ํ๋ จ์ ๋ชจ๋ ๋จ๊ณ โ ์ค๊ฐ ํ์ต ์ฒดํฌํฌ์ธํธ, ๊ฐํํ์ต ๋จ๊ณ, ํ์ฒ๋ฆฌยทํฌ์คํธํธ๋ ์ด๋ ๋จ๊ณ โ ๊น์ง ๋ชจ๋ ๊ณต๊ฐ๋์ด ์์ด์, ์ํ๋ ์ง์ ์์ ๋ชจ๋ธ์ ๊ทธ๋๋ก ๊ฐ์ ธ์(ํฌํฌ) ์ง์ ์คํํ๊ฑฐ๋ ์ด์ด์ ํ๋ จ์ํฌ ์ ์์ต๋๋ค.
ํนํ 32B Think ๋ฒ์ ์ ์ํ, ์ฝ๋, ์ถ๋ก ๊ฐ์ โํ๋ ๋ฆฌ์ฆ๋(Hard Reasoning)โ ์์ญ์์ Qwen ๋ฑ์ ์์๊ธ ์คํ ๋ชจ๋ธ๋ค๊ณผ ๊ฒฌ์ค๋ ์ถฉ๋ถํ ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
์ด๋ ๊ฒ ๋ณด๋ฉด, Olmo 3๋ ๋จ์ํ โ๋ชจ๋ธ์ ๊ณต๊ฐํฉ๋๋คโ๊ฐ ์๋๋ผ, โ์ง์ ๊ฐํํ์ต ๊ธฐ๋ฐ์ ์ถ๋ก ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ถ๋ค๋ฉด ์ด ํ๋ฆ์ ๊ทธ๋๋ก ๋ฐ๋ผํด ๋ณด์ธ์โ๋ผ๋ ์ด๋์ฅ์ ๊ฐ๊น์ต๋๋ค.
Fara-7B: ์จ๋๋ฐ์ด์ค ์น ์์ด์ ํธ์ฉ LLM
์๋ง์ ์ฐ๊ตฌ์๋ค์ด LLM ๋ฆฌ๋๋ณด๋์์ ์์๋ฅผ ์ฐจ์งํ๊ธฐ ์ํด์ ํ๊ฒจ๋ฃจ๊ธฐ๋ฅผ ํ๋ ๋์, ๋ง์ดํฌ๋ก์ํํธ์์๋ ์กฐ์ฉํ Fara-7B๋ฅผ ๊ณต๊ฐํ์ต๋๋ค - ์ด 7B ์คํ ์จ์ดํธ ๋ชจ๋ธ์, ์น ๋ธ๋ผ์ฐ์ ๋ฅผ ์ฌ๋์ฒ๋ผ ์กฐ์ํฉ๋๋ค.
์ด ๋ชจ๋ธ์:
DOM ํธ๋ฆฌ๋ฅผ ์ฝ๋๊ฒ ์๋๋ผ, ์คํฌ๋ฆฐ์ท์ ๊ทธ๋๋ก ๋ด ๋๋ค.
ํด๋ฆญ, ์คํฌ๋กค, ํค ์ ๋ ฅ, ๊ทธ๋ฆฌ๊ณ web-search๋ visit_url ๊ฐ์ ๋งคํฌ๋ก ์ก์ ๊น์ง ์์ธกํฉ๋๋ค.
Magentic-One ๊ธฐ๋ฐ์ ๋ฉํฐ์์ด์ ํธ ์์คํ ์ด ๋ง๋ ์ฝ 15๋ง๊ฐ์ ํฉ์ฑ Trajectory๋ฅผ ์ฆ๋ฅ(Distill)ํด์ ํ๋์ ์ปดํฉํธํ ๋ชจ๋ธ๋ก ๋ง๋ค์์ต๋๋ค.
๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ๋ฅผ ์ดํด๋ณด๋ฉด:
WebVoyager์์ 73.5%๋ก ๋๊ธ์ 7B CUA ๋ชจ๋ธ๋ค์ ์์ญ๋๋ค.
DeepShop๊ณผ Online-Mind2Web์์๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
WebTailBench(ํฐ์ผ ์๋งค, ๊ตฌ์ง ์ ์ฒญ, ๊ฐ๊ฒฉ ๋น๊ต ๊ฐ์ โ์ง์ง ์ํํโ ์์ )์์ 38.4% ์์ค์ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค.
Computer-Use ์์ด์ ํธ, ์ด๋ ๊ฒ ๋ ์ด์ โํด๋ผ์ฐ๋์์ ์คํํ๋ ๊ธฐ์ โ์ด ์๋๋ผ, โ๋ด ๋ ธํธ๋ถ์์ ์กฐ์ฉํ ์น๊ณผ ์์ฝ๋ ํด์ฃผ๋ ๋ชจ๋ธโ๋ก ์งํํ๊ณ ์๋ค์.
P1: ์คํ์์ค์, ๋ฌผ๋ฆฌํ์ ์ดํดํ๋ ์ํผ๋ชจ๋ธ
P1์, ์ค์ ์ ๋ฌผ๋ฆฌ ์ฌ๋ฆผํผ์๋ ๋ฌธ์ ์์ ํฑํฐ์ด ๋ชจ๋ธ๊ณผ ์ด๊นจ๋ฅผ ๋๋ํ ํ๋ ์ต์ด์ ์คํ ๋ชจ๋ธ์ ๋๋ค.
IPhO 2025์์ ๊ธ๋ฉ๋ฌ๊ธ ์ฑ๋ฅ์ ๋๊ณ , ๋ณด๋ค ์๋ฐํ ๊ฒ์ฆ ๊ฐ๋ฅํ ๋ฌผ๋ฆฌ ๋ฌธ์ ๋ค๋ก ๊ฐํํ์ต์ ํ์ต๋๋ค.
์ด ๋ชจ๋ธ์ด ์ํ๋ ์์ญ์ ์์ฃผ ๋ถ๋ช ํฉ๋๋ค. ์ฌ๋ฆผํผ์๋ ์์ค์ ๋ฌผ๋ฆฌยท์ํยท์ฝ๋ฉ ๋ฌธ์ ๋ฅผ ์์ ์ ์ผ๋ก ํ์ด๋ด๊ณ , ์ซ์ ํ๋๋ง ํ๋ ค๋ ๋ฐ๋ก ์ค๋ฅ๊ฐ ๋๋ ๊ณผํ ๊ณ์ฐ์์๋ ๋ฏฟ์ ๋งํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ด๋ถ ์ถ๋ก ๊ณผ์ ์ ๊ฐ์ฌยท๊ฒ์ฆํด์ผ ํ๋ ์์ด์ ํธ ์์คํ ์ โ์ ๋ขฐ ๊ฐ๋ฅํ ๋๋โ ์ญํ ๋ ์ถฉ๋ถํ ์ํํ ์ ์์ต๋๋ค. ๋ณดํต ์คํ ๋ชจ๋ธ์ ๋ง๋ ์ฌ๋๋ค์ด โ์ด ๋ชจ๋ธ์ ๋ฌผ๋ฆฌ๋ฅผ ์ํฉ๋๋คโ๋ผ๊ณ ๋งํ๋ฉด ์ ๋ง ๊ทธ๋ฐ์ง ๊ผผ๊ผผํ ์์ฌํด ๋ณด๊ฒ ๋์ง๋ง, ์ด๋ฒ ๋ชจ๋ธ์ ๊ทธ๋ฐ ์์ฌ์ ๊ตณ์ด ํ ํ์๊ฐ ์์ ๋งํผ ์ฑ๋ฅ์ด ํ์คํ๊ฒ ๋๋ฌ๋ฉ๋๋ค.
Nemotron Elastic: ํ๋์ ์ค๊ณ ์ฒ ํ์ผ๋ก ๋ค์ํ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ์ถ๋ก ๋ชจ๋ธ ์ ํ๊ตฐ์ ๋ง๋ค๋ค
์๋น๋์๋ โ๋งํธ๋ฃ์์นด ์ธํโ ๊ตฌ์กฐ์์ ์ฐฉ์ํ Matryoshka ์์ด๋์ด๋ฅผ MambaโTransformer ํผํฉ ์ํคํ ์ฒ์ ์ ์ฉํ์ต๋๋ค. ํฐ ๋ชจ๋ธ ์์ ๋ ์์ ๋ชจ๋ธ๋ค์ด ์์ฐ์ค๋ฝ๊ฒ ํฌํจ๋๋๋ก ํ์ตํ๋ ๋ฐฉ์์ธ๋ฐ, ์ด ๋๋ถ์ 12B ๋ชจ๋ธ์ ํ ๋ฒ๋ง ํ๋ จํด๋ ๊ฐ์ ์จ์ดํธ์์ 9B์ 6B ๋ชจ๋ธ์ ์ถ๊ฐ ํ๋ จ์ ํ์ง ์๊ณ ๋ฐ๋ก ๊บผ๋ด ์ธ ์ ์์ต๋๋ค. ์ฆ, ์ฒ์๋ถํฐ โ์๋ผ๋ ์ฑ๋ฅ์ด ์ ์ง๋๋ ๊ตฌ์กฐโ๋ก ํ์ต์ํค๊ธฐ ๋๋ฌธ์, ์ ์ฒด ๋ชจ๋ธ์ ์ฐ๊ณ ์ถ์ ๋๋ 12B๋ก, ๋ ๊ฐ๋ณ๊ฒ ๋๋ฆฌ๊ณ ์ถ์ผ๋ฉด 9B๋ 6B๋ก ๊ทธ๋๋ก ๋ด๋ ค์ ์ฌ์ฉํ ์ ์๋ ์ผ์ข ์ โ์ค์ฒฉ ๋ชจ๋ธโ ํจ๋ฐ๋ฆฌ๊ฐ ์๋์ผ๋ก ๋ง๋ค์ด์ง๋ ์ ์ ๋๋ค.
์ด๋ฐ ๋ฐฉ์์, ๋น์ฐํ๊ฒ๋ ๋ชจ๋ธ์ ๊ฐ๊ฐ ๋ฐ๋ก ํ์ต์ํค๋ ๊ฒ๋ณด๋ค ํ๋ จ ๋น์ฉ์ด ํ ๋จ๊ณ ๋ฎ์์ง๊ณ , ๋ฐฐํฌํ ๋ ๋ฉ๋ชจ๋ฆฌ ๋น์ฉ์ด ์ผ์ ํด์ง๊ณ , ํฌ๊ธฐ๊ฐ ๋ฌ๋ผ๋ ์ํยท์ฝ๋ ์ถ๋ก ์ฑ๋ฅ์ ๊ณ ๋ฅด๊ฒ ์ ์งํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ์์ฃผ ๊ฐ๋จํ ๋งํ์๋ฉด, โ๋ ธํธ๋ถ์์๋ถํฐ ์๋ฒ ํด๋ฌ์คํฐ๊น์งโ ํ๋์ ์ถ๋ก ๊ณ์ด์ ๊ทธ๋๋ก ๋ฃ์ด์ ์ธ ์ ์๋ ์ ๊ทผ ๋ฐฉ์์ธ ๊ฑฐ์ฃ .
MiMo-Embodied: ๋ก๋ด๊ณผ ์๋์ฐจ๋ฅผ ๋ชจ๋ ๋ค๋ฃจ๋ ํ๋์ ๋ชจ๋ธ
์ค์ค๋ฏธ์ MiMo-Embodied๋ ๋ก๋ด ์๋ฒ ๋๋ ๋ฒค์น๋งํฌ์ ์์จ์ฃผํ ๋ฒค์น๋งํฌ ๋ ๋ค์์ SOTA๋ฅผ ์ฐ์ ์ฒซ ์คํ ๋ชจ๋ธ์ ๋๋ค.
์ด ๋ชจ๋ธ์ด ๋ณด์ฌ์ฃผ๋ ๊ธฐ๋ฅ๋ค์ ๊ฝค ํญ์ด ๋์ต๋๋ค. ๋ก๋ด์ด ์ฃผ๋ณ ๋ฌผ์ฒด๋ฅผ ์ด๋ป๊ฒ ์ฌ์ฉํ ์ ์๋์ง(์ดํฌ๋์ค)๋ฅผ ํ์ ํ๊ณ ๊ทธ์ ๋ง์ถฐ ํ์คํฌ๋ฅผ ๊ณํํ๋ ๋ฅ๋ ฅ๋ถํฐ, ์์จ์ฃผํ์์ ํ์ํ ์ฅ๋ฉด ์ดํดยท์ํฉ ์์ธกยท์ฃผํ ๊ณํ๊น์ง ๋ชจ๋ ๋ค๋ฃน๋๋ค. ๋ 3D ํ๊ฒฝ, ์์, ์ธ์ด๋ฅผ ์ค๊ฐ๋ฉด์ ๊ณต๊ฐ์ ์ ๋ณด๋ฅผ ํตํฉ์ ์ผ๋ก ์ดํดํ๋ ์ถ๋ก ๋ฅ๋ ฅ๋ ๊ฐ์ถ๊ณ ์์ต๋๋ค.
์ด๋ฐ ํ๋ฆ์ด ์๋ฏธํ๋ ๋ฐ๋ ๋ถ๋ช ํฉ๋๋ค. ์ง๊ธ๊น์ง๋ ๋ก๋ด์ฉ ๋ชจ๋ธ, ์์จ์ฃผํ์ฉ ๋ชจ๋ธ, ๋น์ ยท์ธ์ด ๋ชจ๋ธ์ ๋ฐ๋ก ๊ฐ๋ฐํด ์๋ค๋ฉด, ์ด์ ๋ ์ด ๋ชจ๋ ๊ฒ์ ํ๋์ ๊ณต์ ๋ โEmbodied Backboneโ โ ํ์ค ์ธ๊ณ๋ฅผ ์ดํดํ๊ณ ํ๋ํ ์ค ์๋ ๊ณตํต ๊ธฐ๋ฐ โ ์ผ๋ก ํตํฉํ๋ ค๋ ์กฐ์ง์ด ๋ํ๋๊ณ ์๋ค๋ ๊ฒ๋๋ค. ๊ธฐ์ ์ ๋ฐฉํฅ ์์ฒด๊ฐ ๋ฐ๋๋ ์ด๋ฐ ์๊ฐ, ๊ฝค ํฅ๋ฏธ๋กญ์ต๋๋ค.
์, ๊ทธ๋ผ ์ด์ ๋ํ ์ฐ๊ตฌ์๋ค ์ฐจ๋ก๋ก ๋์ด๊ฐ ๋ณผ๊น์?
Claude Opus 4.5: ๊ธด ์์ ๋ ๋๋ํ ๋ฒํฐ๋ฉด์ ํด๋ด๋, ๊ฐ๋ ฅํ ์ผ๊พผ
Opus 4.5๋ ์ค์ ์ ๋ฌด ํ๊ฒฝ์์ ๋ฐ๋ก ์ธ ์ ์๋๋ก, ํด ์ฌ์ฉยท๊ธด ์ปจํ ์คํธ ์ฒ๋ฆฌยท์คํ๋ ๋์ํธ ์์ ๊ฐ์ ์ํฉ์ ๋ง์ถฐ ํ๋๋ ๋ชจ๋ธ์ ๋๋ค.
์ด๋ฒ ์ ๋ฐ์ดํธ๋ก ์ ์ ํ ํฐ์ผ๋ก๋ ๋ ๋์ SWE-Bench ์ฑ๋ฅ์ ๋ด๊ณ , Claude Code ์ํ๊ณ์์๋ ๋ฉํฐ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์ ๋ฅ๋ ฅ์ด ๊ฐํ๋์ต๋๋ค. ๋, ํ๋กฌํํธ ์ธ์ ์ ๊ณต๊ฒฉ์๋ ๋ ๊ฐํด์ก์ต๋๋ค.
๊ทธ๋์ ๋ช ์๊ฐ ๋์ ์คํผ์ค ์คํ์ผ์ ์์ ์ ์ํํ๋ ์์ด์ ํธ๋ฅผ ๋ง๋ ๋ค๋ฉด, Opus 4.5๋ ๊ทธ ์๊ตฌ๋ฅผ ์ถฉ๋ถํ ๋ง์กฑ์ํฌ ๋งํผ ๊ฒฝ์๋ ฅ ์๋ ๋ชจ๋ธ์ ๋๋ค.
Opus 4.5์ ๋ํ ์ฒซ์ธ์ ๋ช ๊ฐ๋ฅผ ๋ฝ์๋ณด๋ฉด ์ด๋ ๋ค์:
GPT-5.1-Codex-Max โ ์ฅ๊ธฐ์ ์ธ ์ฝ๋ฉ ์์ ์ฉ์ผ๋ก ์ ํฉํ ๋๋
Codex-Max๋ ์คํAI๊ฐ ์๋ก ๊ณต๊ฐํ โ์์ด์ ํธํ ์ฝ๋ฉ ๋ชจ๋ธโ๋ก, ๋๊ท๋ชจ์ ๋ณต์กํ ์ํํธ์จ์ด ๊ฐ๋ฐ์ด๋ผ๋ ๊ฐ ์ ์ง๋ณด์ ์์ ์ ์ต์ ํ๋ผ ์์ต๋๋ค.
์ด ๋ชจ๋ธ์ ํต์ฌ ๋ฅ๋ ฅ์ ์ปดํฉ์ (Compaction)์ธ๋ฐ, ์ฌ๋ฌ ์ปจํ ์คํธ ์ฐฝ์ ํ๋์ ๊ธด ๋งฅ๋ฝ์ฒ๋ผ ๋๋๋ค๋ฉด์ ์๋ฐฑ๋ง ํ ํฐ ๊ท๋ชจ์ ์์ ๋ ํ๋ฆ์ ์ ์ ์งํ ์ฑ ์ฒ๋ฆฌํฉ๋๋ค.
์ด ๋ชจ๋ธ์ด ํนํ ์ ๋ง๋ ์์ญ์ ๋ช ํํฉ๋๋ค. ๋ ํฌ ์ ์ฒด๋ฅผ ์ค๋ซ๋์ ๋ถ์ํ๊ณ ์์ ํ๋ ์ฅ๊ธฐ ์์ด์ ํธ ์์ ์ ์ ํฉํ๊ณ , ๊ธฐ์กด ๋ชจ๋ธ๋ค์ด ์ค๊ฐ์ ๋งฅ๋ฝ์ ์๊ธฐ ์ฌ์ ๋ ๋๊ท๋ชจ ๋ฆฌํฉํ ๋ง์์๋ ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค. ๋ ์ฝ๋ฉยท๋ฆฌ์์นยทํ ์คํธยท๋ฌธ์ ์์ ์ด ์์ฌ ์๋ ์ค์ ์์ง๋์ด๋ง ์ํฌํ๋ก์ฐ์์๋ ์ ์ฉํ๊ฒ ์ธ ์ ์์ต๋๋ค.
Claude Opus 4.5๋ณด๋ค ๋จผ์ ์ถ์๋์์ง๋ง, ์๋์ ์ผ๋ก ๋ ์ฃผ๋ชฉ๋ฐ์๋ค๋ ์ ์ด ์กฐ๊ธ ์์ฌ์ธ ์ ๋๋ค์.
Google stack: Gemini 3, Antigravity, Nano Banana Pro
Gemini 3๋ ๊ตฌ๊ธ์ ์๋ก์ด ํ๋๊ทธ์ญ ๋ชจ๋ธ์ ๋๋ค.
์์ฃผ ์ธ์์ ์ธ ๋ชจ๋ธ์ด๊ณ , Pro๋ ๊ฐ๋ ฅํ์ง๋ง, Deep Think ๋ชจ๋๊ฐ ์ง์ง ํฌ์ธํธ์ธ ๊ฒ ๊ฐ์ต๋๋ค. ๋ ๋์ GPQA์ ARC-AGI-2 ์ฑ๋ฅ, ๋ ๊ธด ์ถ๋ก ์ฒด์ธ, ๋ ํํํ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ๊น์ง ๊ฐํ๋์ด ์์ต๋๋ค.
Gemini 3๋ฅผ ์ฌ์ฉํ๋ฉด ์ข์ ์ํฉ์:
๋ํดํ ์๋ฃ๋ฅผ ํจ๊ป ๊ณต๋ถํ โ์คํฐ๋ ํํธ๋โ๊ฐ ํ์ํ ๋
๊ธธ๊ณ ๋ณต์กํ ์์ด์ ํธ ์ํฌํ๋ก์ฐ๊ฐ ํ์ํ ํ๋ก์ ํธ
ํ ์คํธยท์ด๋ฏธ์งยท๋น๋์ค๊ฐ ์์ธ ๋ฉํฐ๋ชจ๋ฌ ๋ฌธ์ ํด๊ฒฐ
Nano Banana Pro๋ ์ด๋ฏธ์ง ๋ชจ๋ธ์ ์ ๊ทธ๋ ์ด๋์ธ๋ฐ, ๋๋์ด ์ด๋ฏธ์ง ์ ํ ์คํธ๋ฅผ ์ง์ง โ1๊ธ ์๋ฏผโ์ผ๋ก ๋ค๋ฃจ๋ ๋ชจ๋ธ์ ๋๋ค - ์ ๋๋ก ํ ์คํธ ์ฒ๋ฆฌ๋ฅผ ์ํ๋ ๋๋ก ํด ์ค๋ค๋ ์ด์ผ๊ธฐ์ฃ .
ํฌ์คํฐ, UI ๋ชฉ์ , ํจํค์ง ๋์์ธ, ๋ธ๋๋ ์ผ๊ด์ฑ ์๋ ๋น์ฃผ์ผ ์ ์ ๋ฑ, โ์ด ๊ฐ๋ ์ ์๊ฐ์ ์ผ๋ก ์ ์ค๋ช ํด ๋ฌ๋ผโ๋ ์์ ๋์ฆ๊ฐ ์์ ๋ ์ ํฉํฉ๋๋ค.
Google Antigravity๋ ์์ฃผ ๋ง์ ๊ด์ฌ์ ๋ฐ๊ณ ์์ฃ . ์ด๊ฑด ๋ชจ๋ธ์ ์๋์ง๋ง, ์์ด์ ํธ ์๋์ IDE๋ ์ด๋ค ๊ฒ์ผ๊น ํ๋ ์ง๋ฌธ์ ๋ํ ํ์ฌ ๊ธฐ์ค ๊ตฌ๊ธ์ ๋ต์ด ์๋๊น ์ถ์ต๋๋ค.
Google Antigravity๋ ๊ฐ๋ฐ์๋ฅผ ์ํ ์ฝ๋ ์๋ํฐ ๊ธฐ๋ฅ๊ณผ ๋๋ถ์ด์, ๋ธ๋ผ์ฐ์ ๋ ํฐ๋ฏธ๋ ๋ฑ์์ ์ฌ๋ฌ AI ์์ด์ ํธ๊ฐ ๋์์ ์์ ํ๋ ์ํฉ์ ํ๋์ ์งํํ ์ ์๋ ๊ด๋ฆฌ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. ๋ฌด์๋ณด๋ค ๊ฐ์ฅ ํ์ ์ ์ธ ์ ์ AI์ ์์ ๊ณผ์ ์ ๋ฑ๋ฑ์ด ๊ธฐ๋กํ๋ '์ํฐํฉํธ(Artifact)' ๊ธฐ๋ฅ์ ๋๋ค. ๊ธฐ์กด ๋๊ตฌ๋ค์ด ๋จ์ํ ๊ฒฐ๊ณผ ์ฝ๋(Diff)๋ง ๋ณด์ฌ์ค์ AI๊ฐ ์ด๋ค ๊ณผ์ ์ ๊ฑฐ์ณค๋์ง ์๊ธฐ ์ด๋ ค์ ๋ ๋ฐ๋ฉด, ์ํฐ๊ทธ๋๋นํฐ๋ AI๊ฐ ์๋ฆฝํ ๊ณํ๋ถํฐ ์ค์ ์ฐธ์กฐํ ํ๋ฉด, ์คํํ ๋ช ๋ น์ด ๊ธฐ๋ก๊น์ง ๋ชจ๋ ์์ ๋ก๊ทธ๋ฅผ ํฌ๋ช ํ๊ฒ ๋จ๊ฒจ์ค๋๋ค. ๋๋ถ์ ๊ฐ๋ฐ์๋ ๊ฒฐ๊ณผ๋ฌผ๋ฟ๋ง ์๋๋ผ ๊ณผ์ ๊น์ง ์๋ฒฝํ๊ฒ ๊ฒ์ฆํ ์ ์์ฃ . ์ด ๊ธฐ๋ฅ์ด ๊ธฐ๋๋งํผ ์๋ํ๋ค๋ฉด '์ปค์(Cursor)' ๊ฐ์ ๊ธฐ์กด ์ธ๊ธฐ ๋๊ตฌ๋ค์ ๊ฐ๋ ฅํ๊ฒ ์ํํ ๊ฒ์ ์ฒด์ธ์ ๊ฐ ๋ ๊ฒ์ ๋๋ค.
๋ค๋ง ์ถ์ ์งํ ๋ฐ๋ก ๋ช ๊ฐ์ง ํ๊ณ์ ๋ถ๋ชํ์, ๊ตฌ๊ธ ํ์ด ๊ฑฐ์ ๋ฐค์ ์ ๊ฐ๋ฉด์ ๊ฐ์ ์ค์ ๋๋ค.
Grok 4.1: ๊ฐ์ฑ๊ณผ ๋๋๋ฅผ ํจ๊ป ๋์ด์ฌ๋ฆฐ ๋ชจ๋ธ
Grok 4.1์ ๊ฐ์ ์ง๋ฅ(EQ)๊ณผ ์ถ๋ก ์ ์์ ์ฑ์ ๋์์ ๊ฐํํ์ต๋๋ค.
EQ-Bench ์ ์ ์์น, ์ฐฝ์ยท๊ธ์ฐ๊ธฐ ๋ฅ๋ ฅ ๊ฐ์ , ์ ๋ณด์ฑ ํ๋กฌํํธ์์ ๋ฎ์ ํ๊ฐ๋ฅ ์ ๋ณด์ฌ์ค๋๋ค.
Grok 4.1์ ์๋์ ๊ฐ์ ์์ญ์ ๋์ฆ๊ฐ ํฌ๋ค๋ฉด ์ ํฉํ ๋ชจ๋ธ์ด ์๋๊ฐ ์ถ์ด์:
์๋น์์ฉ ์ฑ ๊ฒฝํ
์ฐฝ์ยท์์ ์ค์ฌ์ ์ ํ๋ฆฌ์ผ์ด์
โํค์ด ๋ฐ๋ฐํ๋ฉด ์ ๋๋โ ์ด์์คํดํธ
์ ๋ Grok 4.1์ ์ฌ์ฉ์๋ ์๋์ง๋ง, ๊ด์ฌ ์์ผ์๋ฉด ๋ธ๋ก๊ทธ์์ ๋ ์์ธํ ๋ด์ฉ์ ๋ณด์๋ฉด ์ข๊ฒ ์ต๋๋ค.
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์๋ ๋
์๋ค์ ์์์ผ๋ก ๋ง๋ค์ด์ง๋๋ค. ๊ฐ์น์๋ ์ปจํ
์ธ ๋ฅผ ์ง์์ ์ผ๋ก ์ฌ๋ฌ๋ถ๊ณผ
๊ณต์ ํ ์ ์๋๋ก, ์ปคํผ ํ ์์ผ๋ก ํ์ ๋ณดํ์ฃผ์ธ์ โ
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
AI ์นํฐ์์ ํนํ ์์ฆ ๋ค์ ๋ง์ด ์ธ๊ธ๋๊ณ ์๋ ๊ณต๊ฐ ์ง๋ฅ(Spatial Intelligence)์ด๋, ์ฝ๊ฒ ๋งํด์ ๋ชจ๋ธ์ด ๊ฐ์ง๊ณ ์๋ โ๊ณต๊ฐ ๊ฐ๊ฐโ ์ ๋๋ก ํํํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ์ฌ๋ฌผ์ด ์ด๋์ ์๋์ง, ์๋ก ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง, ์ด๋ป๊ฒ ์์ง์ด๋์ง๋ฅผ ์ดํดํ๋ ๋ฅ๋ ฅ์ด์ฃ . ์ด ๋ฅ๋ ฅ์ด ์์ด์ผ AI ๋ชจ๋ธ์ด ๋ฐฉ ์์ ๋์๋ค๋๊ณ , ๋ณด์ด๋ ์ฅ๋ฉด์ ํด์ํ๊ณ , ์ฌ๋ฌ ๊ฐ์ ๋ฌผ์ฒด๋ค์ด ์ด๋ป๊ฒ ๋ง๋ฌผ๋ฆฌ๋์ง ํ์ ํ ์ ์์ต๋๋ค. ๋ง ๊ทธ๋๋ก, ๋จธ๋ฆฟ ์์ ํ๋์ โ์ง๋โ๊ฐ ๋ค์ด์๋ ์ ์ธ ๊ฑฐ์ฃ . ์๋ฅผ ๋ค์ด, ์๋ ๋ชจ๋ธ์ ์ด ๊ณต๊ฐ ์ง๋ฅ์ด ์๋ค๋ฉด ์ ๋๋ก ์๋ํ ์ ์์ต๋๋ค.
์ค๋์, ๊ณต๊ฐ ์ง๋ฅ์ด ๋ฌด์์ธ์ง, ๊ทธ๋ฆฌ๊ณ ์ด๋ป๊ฒ ๋ฐ์ ํ๊ณ ์๋์ง ์ดํด๋ณผ ์ ์๋ 6๊ฐ์ง ์ฝ์๊ฑฐ๋ฆฌ๋ฅผ ์ถ์ฒํฉ๋๋ค:
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
๐๐ Downscaling Intelligence: Exploring Perception and Reasoning Bottlenecks in Small Multimodal Models (by Stanford)
์ด ๋ ผ๋ฌธ์ ํํ ๋งํ๋ โ์์ ๋ชจ๋ธ์ ๊ทธ๋ฅ ์ถ๋ก ๋ฅ๋ ฅ์ด ๋จ์ด์ง๋คโ๋ ํต๋ ์ ๋ค์ง์ต๋๋ค. ์ ์๋ค์ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ์๊ฒ ๋ง๋ค๋ฉด ์ง์ง๋ก ๋ฌธ์ ๊ฐ ์๊ธฐ๋ ๊ฑด ์ธ์ด ์ถ๋ก ์ด ์๋๋ผ โ์๊ฐ์ ์ง๊ฐ ๋ฅ๋ ฅโ์ด๋ผ๋ ์ ์ ๋ณด์ฌ์ค๋๋ค. ์ฆ, ์ด๋ฏธ์ง์์ ํ์ํ ๋ํ ์ผ์ ์์ ์ ์ผ๋ก ๋ฝ์๋ด๋ ๋ฅ๋ ฅ์ด ๋จผ์ ๋ถ๊ดดํ๋ค๋ ๊ฑฐ์ฃ .
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์, EXTRACT+THINK๋ผ๋ ๋ ๋จ๊ณ ํ์ดํ๋ผ์ธ์ ์ ์ํฉ๋๋ค.์์ VLM์ด ๋จผ์ ์ง์๋ฌธ๊ณผ ๊ด๋ จ๋ ์๊ฐ ์ ๋ณด๋ฅผ ๋ช ์์ ์ผ๋ก ์ถ์ถํ๊ณ
๊ทธ ๋ค์์ผ๋ก, ์กฐ๊ธ ๋ ํฐ LLM์ด ๊ทธ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ก ์ ์ํํ๋ ๋ฐฉ์์ ๋๋ค.
๋๋๊ฒ๋, ์์ฃผ ์ ์ ๋ฐ์ดํฐ์ ํ๋ผ๋ฏธํฐ๋ง์ผ๋ก๋ ๋์ ๋ฒค์น๋งํฌ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋๋ฐ, ๊ฝค ํฅ๋ฏธ๋ก์ด ์ ๊ทผ๋ฒ์ด์ฃ .
๐ WorldGen: From Text to Traversable and Interactive 3D Worlds (by Meta)
ํ ์คํธ ํ๋กฌํํธ๋ง์ผ๋ก ์ผ๊ด์ฑ ์๊ณ ์ค์ ๋ก ๊ทธ ์์์ ์ด๋๋ ํ ์ ์๊ณ ์ํธ์์ฉํ ์ ์๋ 3D ํ๊ฒฝ์ ์์ฑํ๋ ๊ธฐ์ ์ ๋๋ค.
LLM ๊ธฐ๋ฐ ๋ ์ด์์ ์ถ๋ก , ํ๋ก์์ ๋ด ์์ฑ, ํ์ฐ ๊ธฐ๋ฐ์ 3D ํฉ์ฑ์ ๊ฒฐํฉํด์ ์ผ๋ฐ์ ์ธ ๊ฒ์ ์์ง ์์์ ๋์ํ๋ 3D ์๋๋ฅผ ๋ง๋ค์ด๋ ๋๋ค.
๐ Mixture of States: Routing Token-Level Dynamics for Multimodal Generation (by KAUST and Meta)
์ด ์ฐ๊ตฌ๋ ๋ํจ์ ๋ชจ๋ธ์์ ๋ชจ๋ฌ๋ฆฌํฐ๋ฅผ ๋ ์ ์ตํฉํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
ํ ํฐ ๋จ์ ๋ผ์ฐํฐ๋ฅผ ์ฌ์ฉํด์ ์๊ฐ์ ๋ฐ๋ผ ์จ๊ฒจ์ง ์ํ(Hidden States)๋ฅผ ํฌ์ํ๊ฒ ํผํฉํ๊ณ , ์ด๋ฅผ ํตํด์ ํจ์ฌ ํฐ ๋ชจ๋ธ ์์ค์ ์ฑ๋ฅ์ Text-to-Image ์์ฑ๊ณผ ํธ์ง ์์ ์์ ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค.
์์ด์ ํธ ๊ธฐ๋ฐ์ ๊ณผํ, ์์จ์ ์ฐ๊ตฌ ๋ฐ ์๊ธฐ ์งํ ์์ด์ ํธ
OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists
์ธ๊ฐ ์ฐ๊ตฌ์์ AI ์ฐ๊ตฌ์๊ฐ ๊ฐ์ ์ธํ๋ผ์์ ํจ๊ป ์งํํ ์ ์๋ ์ํ๊ณ๋ฅผ ๋ง๋ค๊ธฐ ์ํ ์ ์์ ๋๋ค. ์ด ๋ ผ๋ฌธ์ AI-Science ์คํ ์์ ์ธ์ฉ ๊ทธ๋ํ, ํ์ ํ๋กํ ์ฝ, ์คํ ํ๊ฐ ๊ณต๊ฐ์ ๋ด์ฅํด์ ์ธ๊ฐ๊ณผ AI๊ฐ ๋์ผํ ์ฐ๊ตฌ ํ๊ฒฝ์์ ์ํธ ๋ณด์์ ์ผ๋ก ๋ฐ์ ํ๋๋ก ํ๋ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
๐ What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity (Meta)
์ด ์ฐ๊ตฌ๋ AI ์ฐ๊ตฌ ์์ด์ ํธ์ โ์์ด๋์ด ๋ค์์ฑ(Ideation Diversity)โ์ด ์ค์ ์ฐ๊ตฌ ์ฑ๊ณผ๋ฅผ ์ด๋ป๊ฒ ๋์ด๋์ง๋ฅผ ์๊ด ๋ถ์๊ณผ ์คํ์ ํตํด ๊ฒ์ฆํฉ๋๋ค.
๊ฒฐ๋ก ์ ๋ช ํํฉ๋๋ค: ๋ ๋ค์ํ ์์ด๋์ด ์ธํธ๋ฅผ ๊ฐ์ง ์์ด์ ํธ์ผ์๋ก MLE-bench ์ฑ๋ฅ์ด ๊พธ์คํ ํฅ์๋ฉ๋๋ค. ์ฆ, โ๋ค๋ฅด๊ฒ ์๊ฐํ๊ธฐโ๊ฐ ์ฐ๊ตฌ ์์ด์ ํธ์๊ฒ๋ ํต์ฌ์ด๋ผ๋ ๊ฒ์ ๋๋ค.
Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning
์ด ๋ ผ๋ฌธ์ ์ธ๋ถ ๋ฐ์ดํฐ๊ฐ ์์ด๋ ์๊ธฐ ์งํ(Self-Evolving)ํ๋ ์์ด์ ํธ๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
์ปค๋ฆฌํ๋ผ ์์ด์ ํธ์ ์คํ ์์ด์ ํธ๋ฅผ ๋ฒ ์ด์ค๋ผ์ธ LLM์์ ํจ๊ป ์งํ์ํค๋ฉด์, ๋๊ตฌ๋ฅผ ์ ๊ทน์ ์ผ๋ก ํ์ฉํด์ ์ ์ ๋ ์ด๋ ค์ด ์์ ์ ์ค์ค๋ก ์์ฑยทํด๊ฒฐํ๊ฒ ํ๋๋ฐ, ๊ทธ ๊ฒฐ๊ณผ๋ก ์ธ๋ถ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ฐ์ง ์๊ณ ๋ ์ถ๋ก ๋ฅ๋ ฅ์ด ์๋ฏธ์๋ ์์ค์ผ๋ก ํฅ์๋ฉ๋๋ค.
Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning
LLM ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ์ํ RL ํ์ต ๋ฐฉ์์ ์ ์ํํ ํ๋ ์์ํฌ์ ๋๋ค.
ํ์ฅ๋ MDP ๊ด์ ์์ ์์ด์ ํธ์ ํ๋๊ณผ ํ๊ฒฝ ์ํธ์์ฉ์ ๋ค๋ฃจ๊ณ , ๋ค์ํ ํ๊ฒฝ์ ์ฝ๊ฒ ์ ์ฉํ ์ ์๋ ๋ชจ๋ํ RL ํธ๋ ์ด๋ ๊ตฌ์กฐ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ฆ, RL ๊ธฐ๋ฐ ์์ด์ ํธ๋ฅผ ๋ ๊ฐ๋ ฅํ๊ณ ์ผ๊ด๋๊ฒ ํ์ต์ํค๊ธฐ ์ํ โํ์คํ ์ค๊ณ๋โ์ ๊ฐ๊น์ต๋๋ค.
๋ชจ๋ธ ์ค์ผ์ผ๋ง, ํธ๋ ์ด๋ ํจ์จ์ฑ ๋ฐ ์ถ๋ก ์ฐ์ฐ
๐ Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance (Meta)
์ด ๋ ผ๋ฌธ์ ์นดํ ๊ณ ๋ฆฌ๋ณ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ๋ค์ ๋น๊ท ์ผ ๊ฐ์ค์น๋ก ์์ด์(Souping) ํ๋์ ํ๊ท ๋ชจ๋ธ์ ๋ง๋๋ SoCE(Soup of Category-specific Experts) ์ ๊ทผ๋ฒ์ ์๊ฐํฉ๋๋ค.
๋ฒค์น๋งํฌ์ ๊ตฌ์กฐ๋ฅผ ํ์ฉํด์ ์๋ก ๋ค๋ฅธ ์ ๋ฌธ๊ฐ ๋ชจ๋ธ์ ๊ฐ์ค ํ๊ท ํจ์ผ๋ก์จ ๊ฒฌ๊ณ ์ฑ์ ๋์ด๊ณ , ํจ์ ํธ์ถ ๋ฑ ์ฌ๋ฌ ๊ฐ์ง ์์ ์์ SOTA ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค.
๋จ์ํ ์ฐ์ ์ ์ธ ์กฐํฉ๋ง์ผ๋ก๋ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฌ๊ฒ ๋์ด์ฌ๋ฆด ์ ์๋ค๋ ์ ์ด ํต์ฌ์ ๋๋ค.
๐ Seer: Online Context Learning for Fast Synchronous LLM Reinforcement Learning (by Moonshot AI and Tsinghua)
Seer๋ ๋๊ธฐ์ RL ๋กค์์ ์๋๋ฅผ ๋ํญ ๋์ด์ฌ๋ฆฌ๋ ๊ธฐ๋ฒ์ ๋๋ค. ๋์ผํ ํ๋กฌํํธ๋ค์์ ๋ํ๋๋ ๊ณต์ ๋ ์์ฑ ํจํด์ ํ์ฉํด ๋ค์๊ณผ ๊ฐ์ ์ต์ ํ๋ฅผ ์ํํฉ๋๋ค:๋กค์์์ ๋์ ์ผ๋ก ๋ถํ
์ปจํ ์คํธ ์ ์ฌ๋ ๊ธฐ๋ฐ ์์ ์ค์ผ์ค๋ง
๊ทธ๋ฃน ๋จ์๋ก Adaptive Speculative Decoding ์ํ
๊ฒฐ๊ณผ์ ์ผ๋ก, ์ฒ๋ฆฌ๋์ 74โ97% ์ฆ๊ฐ, ๋กฑํ ์ผ ์ง์ฐ ์๊ฐ์ 75โ93% ๊ฐ์ํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ๊ณ , RL ํ์ต ์๋๋ฅผ ์ค์ ์์ค์ผ๋ก ๋์ด์ฌ๋ฆฌ๋ ๊ธฐ์ ๋ก ๋ณผ ์ ์์ต๋๋ค.
Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models
์ด ์ฐ๊ตฌ๋ ๋ชจ๋ ํ ํฐ์ ๋ฐ๋ณต ์ถ๋ก (Recurrent Refinement)ํ์ง ์๊ณ , ๋ชจ๋ธ์ด โ์ด๋ ค์ธ ๊ฒโ์ด๋ผ๊ณ ์์ธกํ ํ ํฐ์๋ง ์ ํ์ ์ผ๋ก ๋ฐ๋ณต ์ถ๋ก ์ ์ ์ฉํ๋ ๋ฐฉ์์ ๋๋ค. ์ด๋ฅผ ์ํด ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ decider์ LoRA-shifted objective๋ฅผ ์ฌ์ฉํฉ๋๋ค.์ด ์ ๊ทผ ๋ฐฉ์์ ์ฃผ์ ํจ๊ณผ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
ํ์ํ ๋ถ๋ถ์๋ง ๊น๊ฒ ์๊ฐํ๊ฒ ํ๋ ๋ฐฉ์์ผ๋ก ์ถ๋ก ์ฑ๋ฅ ํฅ์
๋ถํ์ํ โ์ค๋ฒ์ฝํนโ์ ๋ฐฉ์ง
๋๋ถ๋ถ์ ํ ํฐ์ ๋จ์ผ ํจ์ค๋ก ์ฒ๋ฆฌํด์ ๋น์ฉ ์ ๊ฐ
์ฆ, โ์๊ฐ์ด ํ์ํ ๋ถ๋ถ๋ง ๋ ์๊ฐํ๊ฒ ํ๋โ ํจ์จ์ ์ธ ์ถ๋ก ๊ฐํ ์ ๋ต์ ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!

Reply