• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#128: แ„†แ…ฉแ„ƒแ…ฆแ†ฏแ„‹แ…ด แ„’แ…งแ†จแ„‰แ…ตแ†ซแ„‹แ…ต แ„‘แ…ฉแ†จแ„‡แ…กแ†ฏแ„’แ…ขแ†ปแ„ƒแ…ฅแ†ซ แ„‰แ…ตแ„€แ…กแ†ซ

๐ŸŒFOD#128: แ„†แ…ฉแ„ƒแ…ฆแ†ฏแ„‹แ…ด แ„’แ…งแ†จแ„‰แ…ตแ†ซแ„‹แ…ต แ„‘แ…ฉแ†จแ„‡แ…กแ†ฏแ„’แ…ขแ†ปแ„ƒแ…ฅแ†ซ แ„‰แ…ตแ„€แ…กแ†ซ

แ„‚แ…ฉแ‡‚แ„Žแ…ตแ„†แ…งแ†ซ แ„‹แ…กแ†ซ แ„ƒแ…ฌแ†ฏ แ„†แ…ฉแ„ƒแ…ฆแ†ฏแ„ƒแ…ณแ†ฏแ„…แ…ฉ แ„†แ…ตแ„Žแ…ตแ†ซ แ„ƒแ…ณแ†บแ„‹แ…ต แ„‚แ…ฅแ†ทแ„Žแ…งแ„‚แ…กแ†ซ แ„’แ…กแ†ซ แ„Œแ…ฎ + แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‹แ…งแ†ซแ„€แ…ฎ

๋˜ ํ•œ ๋ฒˆ์˜ โ€˜๋ชจ๋ธ ์ „์Ÿโ€™์˜ ์„œ๋ง‰?

์ง€๋‚œ ์ฃผ์˜ ๋ชจ๋ธ ์ถœ์‹œ ์†Œ์‹๋“ค๋งŒ ๋†“๊ณ  ๋ณด๋ฉด, ๋ณดํ†ต์ด๋ผ๋ฉด 2~3๊ฐœ์›”์น˜ ๋‚˜์˜ฌ ๋‰ด์Šค๊ฑฐ๋ฆฌ๊ฐ€ ํ•œ๊บผ๋ฒˆ์— ๋‚˜์˜จ ๋А๋‚Œ์ด๋ผ๊ณ ๋‚˜ ํ• ๊นŒ์š”?

(์‚ฌ๋žŒ) ์Šˆํผ๋ชจ๋ธ๋“ค์ด ์ง€๋‚œ ์ฃผ ๋ฏธ์Šค ์œ ๋‹ˆ๋ฒ„์Šค ๋Œ€ํšŒ์—์„œ ๋น›๋‚˜๋˜ ๋ฐ”๋กœ ๊ทธ ๋•Œ, ์ˆ˜๋งŽ์€ AI ์—ฐ๊ตฌ์†Œ๋“ค๋„ ๋งˆ์น˜ ๋ฏธ์Šค ์œ ๋‹ˆ๋ฒ„์Šค ํ›„๋ณด๋“ค์ด ๊ฒฝ์Ÿํ•˜๋“ฏ์ด โ€˜์Šˆํผ ๋ชจ๋ธโ€™๋“ค์„ ์ค„์ค„์ด ๋‚ด๋†จ์Šต๋‹ˆ๋‹ค.

๋ฏธ์Šค ์œ ๋‹ˆ๋ฒ„์Šค 2025. Image Credit: ๋กœ์ดํ„ฐ ํ†ต์‹ 

 

์šฐ์—ฐ์ผ๊นŒ์š”? ๊ธ€์Ž„์š”, ์–ด์จŒ๋“  ๋‘ ์„ธ๊ณ„ ๋ชจ๋‘ โ€˜์Šˆํผ ๋ชจ๋ธ ์ „์Ÿโ€™์ด ๋ฒŒ์–ด์ง„ ๊ฑด ๋งž๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ด๋ฒˆ FOD์—์„œ๋Š”, ์ง€๋‚œ ์ฃผ ๋‚˜์˜จ ์ค‘์š”ํ•œ ๋ชจ๋ธ๋“ค์ด ์–ด๋–ค ๊ฑด์ง€, ๊ฐ๊ฐ ์–ด๋–ค ๊ฐ•์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์–ด๋–ค ์ƒํ™ฉ์—์„œ ์–ด๋–ค ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋ฉด ์ข‹์„์ง€ ํ•œ ๋ฒˆ ๊ฐ™์ด ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋จผ์ €, ์š”์ฆ˜ AI ํŒ์˜ ๋ถ„์œ„๊ธฐ๋ฅผ ์ œ๋Œ€๋กœ ์ฃผ๋„ํ•˜๊ณ  ์žˆ๋Š” โ€˜์˜คํ”ˆ์†Œ์Šคโ€™ ๊ณ„์—ด์˜ ๋ชจ๋ธ๋ถ€ํ„ฐ ๋ณด์ฃ .

Olmo 3: ์˜คํ”ˆ์†Œ์Šค ์ตœ์ดˆ๋กœ โ€˜ํŠธ๋ ˆ์ด๋‹ ์ „ ๊ณผ์ •โ€™์„ ์Šคํ† ๋ฆฌ๋ณด๋“œ์ฒ˜๋Ÿผ ์™„์ „ํžˆ ๊ณต๊ฐœ

AI2๋Š” ์ง€๊ธˆ๊นŒ์ง€ ๋Œ€ํ˜• ์—ฐ๊ตฌ์†Œ๋“ค์ด ๋๋‚ด ํ•˜์ง€ ์•Š๋˜ ์ผ์„ ํ•ด๋ƒˆ์Šต๋‹ˆ๋‹ค: ๋‹จ์ˆœํžˆ ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜๋งŒ ๊ณต๊ฐœํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ „์ฒด์˜ ํ›ˆ๋ จ ํ๋ฆ„ โ€” ๋ฐ์ดํ„ฐ, ์ฝ”๋“œ, ์ฒดํฌํฌ์ธํŠธ, ํ‰๊ฐ€ ํŒŒ์ดํ”„๋ผ์ธ๊นŒ์ง€ โ€” ์ „๋ถ€ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ํ”„๋ฆฌํŠธ๋ ˆ์ด๋‹๋ถ€ํ„ฐ ๊ฐ•ํ™”ํ•™์Šต, ํฌ์ŠคํŠธํŠธ๋ ˆ์ด๋‹ ์ฒดํฌํฌ์ธํŠธ๊นŒ์ง€ ๋ชจ๋“  ๋‹จ๊ณ„๊ฐ€ ๋‹ค ๊ณต๊ฐœ๋˜์–ด ์žˆ์–ด์š”! ์ •๋ง, ๋ฐ•์ˆ˜๋ฅผ ๋ฐ›์„ ๋งŒ ํ•ฉ๋‹ˆ๋‹ค.

์™œ ์ด๋Ÿฐ ์›€์ง์ž„์ด ์ค‘์š”ํ• ๊นŒ์š”?

Olmo 3๋Š” ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์–ด๋–ป๊ฒŒ ์–ด๋–ค ๋‹จ๊ณ„๋ฅผ ๊ฑฐ์น˜๋ฉด์„œ ์ƒ๊ฒจ๋‚˜๋Š”์ง€ ๊ทธ ๊ณผ์ •์„ ๊ทธ๋Œ€๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์ด ๊ฐ€์žฅ ํฐ ํŠน์ง•์ž…๋‹ˆ๋‹ค.

ํ›ˆ๋ จ์˜ ๋ชจ๋“  ๋‹จ๊ณ„ โ€” ์ค‘๊ฐ„ ํ•™์Šต ์ฒดํฌํฌ์ธํŠธ, ๊ฐ•ํ™”ํ•™์Šต ๋‹จ๊ณ„, ํ›„์ฒ˜๋ฆฌยทํฌ์ŠคํŠธํŠธ๋ ˆ์ด๋‹ ๋‹จ๊ณ„ โ€” ๊นŒ์ง€ ๋ชจ๋‘ ๊ณต๊ฐœ๋˜์–ด ์žˆ์–ด์„œ, ์›ํ•˜๋Š” ์ง€์ ์—์„œ ๋ชจ๋ธ์„ ๊ทธ๋Œ€๋กœ ๊ฐ€์ ธ์™€(ํฌํฌ) ์ง์ ‘ ์‹คํ—˜ํ•˜๊ฑฐ๋‚˜ ์ด์–ด์„œ ํ›ˆ๋ จ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํŠนํžˆ 32B Think ๋ฒ„์ „์€ ์ˆ˜ํ•™, ์ฝ”๋“œ, ์ถ”๋ก  ๊ฐ™์€ โ€˜ํ•˜๋“œ ๋ฆฌ์ฆˆ๋‹(Hard Reasoning)โ€™ ์˜์—ญ์—์„œ Qwen ๋“ฑ์˜ ์ƒ์œ„๊ธ‰ ์˜คํ”ˆ ๋ชจ๋ธ๋“ค๊ณผ ๊ฒฌ์ค˜๋„ ์ถฉ๋ถ„ํžˆ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ด๋ ‡๊ฒŒ ๋ณด๋ฉด, Olmo 3๋Š” ๋‹จ์ˆœํžˆ โ€œ๋ชจ๋ธ์„ ๊ณต๊ฐœํ•ฉ๋‹ˆ๋‹คโ€๊ฐ€ ์•„๋‹ˆ๋ผ, โ€œ์ง์ ‘ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ์ถ”๋ก  ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ  ์‹ถ๋‹ค๋ฉด ์ด ํ๋ฆ„์„ ๊ทธ๋Œ€๋กœ ๋”ฐ๋ผํ•ด ๋ณด์„ธ์š”โ€๋ผ๋Š” ์ดˆ๋Œ€์žฅ์— ๊ฐ€๊น์Šต๋‹ˆ๋‹ค.

Fara-7B: ์˜จ๋””๋ฐ”์ด์Šค ์›น ์—์ด์ „ํŠธ์šฉ LLM

์ˆ˜๋งŽ์€ ์—ฐ๊ตฌ์†Œ๋“ค์ด LLM ๋ฆฌ๋”๋ณด๋“œ์—์„œ ์ƒ์œ„๋ฅผ ์ฐจ์ง€ํ•˜๊ธฐ ์œ„ํ•ด์„œ ํž˜๊ฒจ๋ฃจ๊ธฐ๋ฅผ ํ•˜๋Š” ๋™์•ˆ, ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ์—์„œ๋Š” ์กฐ์šฉํžˆ Fara-7B๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค - ์ด 7B ์˜คํ”ˆ ์›จ์ดํŠธ ๋ชจ๋ธ์€, ์›น ๋ธŒ๋ผ์šฐ์ €๋ฅผ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ์กฐ์ž‘ํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ์€:

  • DOM ํŠธ๋ฆฌ๋ฅผ ์ฝ๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ, ์Šคํฌ๋ฆฐ์ƒท์„ ๊ทธ๋Œ€๋กœ ๋ด…๋‹ˆ๋‹ค.

  • ํด๋ฆญ, ์Šคํฌ๋กค, ํ‚ค ์ž…๋ ฅ, ๊ทธ๋ฆฌ๊ณ  web-search๋‚˜ visit_url ๊ฐ™์€ ๋งคํฌ๋กœ ์•ก์…˜๊นŒ์ง€ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.

  • Magentic-One ๊ธฐ๋ฐ˜์˜ ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์ด ๋งŒ๋“  ์•ฝ 15๋งŒ๊ฐœ์˜ ํ•ฉ์„ฑ Trajectory๋ฅผ ์ฆ๋ฅ˜(Distill)ํ•ด์„œ ํ•˜๋‚˜์˜ ์ปดํŒฉํŠธํ•œ ๋ชจ๋ธ๋กœ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ๋ฅผ ์‚ดํŽด๋ณด๋ฉด:

  • WebVoyager์—์„œ 73.5%๋กœ ๋™๊ธ‰์˜ 7B CUA ๋ชจ๋ธ๋“ค์„ ์•ž์„ญ๋‹ˆ๋‹ค.

  • DeepShop๊ณผ Online-Mind2Web์—์„œ๋„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค.

  • WebTailBench(ํ‹ฐ์ผ“ ์˜ˆ๋งค, ๊ตฌ์ง ์‹ ์ฒญ, ๊ฐ€๊ฒฉ ๋น„๊ต ๊ฐ™์€ โ€˜์ง„์งœ ์ƒํ™œํ˜•โ€™ ์ž‘์—…)์—์„œ 38.4% ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

Computer-Use ์—์ด์ „ํŠธ, ์ด๋ ‡๊ฒŒ ๋” ์ด์ƒ โ€™ํด๋ผ์šฐ๋“œ์—์„œ ์‹คํ—˜ํ•˜๋Š” ๊ธฐ์ˆ โ€™์ด ์•„๋‹ˆ๋ผ, โ€˜๋‚ด ๋…ธํŠธ๋ถ์—์„œ ์กฐ์šฉํžˆ ์น˜๊ณผ ์˜ˆ์•ฝ๋„ ํ•ด์ฃผ๋Š” ๋ชจ๋ธโ€™๋กœ ์ง„ํ™”ํ•˜๊ณ  ์žˆ๋„ค์š”.

P1: ์˜คํ”ˆ์†Œ์Šค์˜, ๋ฌผ๋ฆฌํ•™์„ ์ดํ•ดํ•˜๋Š” ์Šˆํผ๋ชจ๋ธ

P1์€, ์‹ค์ œ์˜ ๋ฌผ๋ฆฌ ์˜ฌ๋ฆผํ”ผ์•„๋“œ ๋ฌธ์ œ์—์„œ ํ†ฑํ‹ฐ์–ด ๋ชจ๋ธ๊ณผ ์–ด๊นจ๋ฅผ ๋‚˜๋ž€ํžˆ ํ•˜๋Š” ์ตœ์ดˆ์˜ ์˜คํ”ˆ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

IPhO 2025์—์„œ ๊ธˆ๋ฉ”๋‹ฌ๊ธ‰ ์„ฑ๋Šฅ์„ ๋ƒˆ๊ณ , ๋ณด๋‹ค ์—„๋ฐ€ํ•œ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋ฌผ๋ฆฌ ๋ฌธ์ œ๋“ค๋กœ ๊ฐ•ํ™”ํ•™์Šต์„ ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ์ด ์ž˜ํ•˜๋Š” ์˜์—ญ์€ ์•„์ฃผ ๋ถ„๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์˜ฌ๋ฆผํ”ผ์•„๋“œ ์ˆ˜์ค€์˜ ๋ฌผ๋ฆฌยท์ˆ˜ํ•™ยท์ฝ”๋”ฉ ๋ฌธ์ œ๋ฅผ ์•ˆ์ •์ ์œผ๋กœ ํ’€์–ด๋‚ด๊ณ , ์ˆซ์ž ํ•˜๋‚˜๋งŒ ํ‹€๋ ค๋„ ๋ฐ”๋กœ ์˜ค๋ฅ˜๊ฐ€ ๋‚˜๋Š” ๊ณผํ•™ ๊ณ„์‚ฐ์—์„œ๋„ ๋ฏฟ์„ ๋งŒํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋‚ด๋ถ€ ์ถ”๋ก  ๊ณผ์ •์„ ๊ฐ์‚ฌยท๊ฒ€์ฆํ•ด์•ผ ํ•˜๋Š” ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์˜ โ€˜์‹ ๋ขฐ ๊ฐ€๋Šฅํ•œ ๋‘๋‡Œโ€™ ์—ญํ• ๋„ ์ถฉ๋ถ„ํžˆ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณดํ†ต ์˜คํ”ˆ ๋ชจ๋ธ์„ ๋งŒ๋“  ์‚ฌ๋žŒ๋“ค์ด โ€œ์ด ๋ชจ๋ธ์€ ๋ฌผ๋ฆฌ๋ฅผ ์ž˜ํ•ฉ๋‹ˆ๋‹คโ€๋ผ๊ณ  ๋งํ•˜๋ฉด ์ •๋ง ๊ทธ๋Ÿฐ์ง€ ๊ผผ๊ผผํžˆ ์˜์‹ฌํ•ด ๋ณด๊ฒŒ ๋˜์ง€๋งŒ, ์ด๋ฒˆ ๋ชจ๋ธ์€ ๊ทธ๋Ÿฐ ์˜์‹ฌ์„ ๊ตณ์ด ํ•  ํ•„์š”๊ฐ€ ์—†์„ ๋งŒํผ ์„ฑ๋Šฅ์ด ํ™•์‹คํ•˜๊ฒŒ ๋“œ๋Ÿฌ๋‚ฉ๋‹ˆ๋‹ค.

Nemotron Elastic: ํ•˜๋‚˜์˜ ์„ค๊ณ„ ์ฒ ํ•™์œผ๋กœ ๋‹ค์–‘ํ•œ ํฌ๊ธฐ๋ฅผ ๊ฐ€์ง„ ์ถ”๋ก  ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์„ ๋งŒ๋“ค๋‹ค

์—”๋น„๋””์•„๋Š” โ€˜๋งˆํŠธ๋ฃŒ์‹œ์นด ์ธํ˜•โ€™ ๊ตฌ์กฐ์—์„œ ์ฐฉ์•ˆํ•œ Matryoshka ์•„์ด๋””์–ด๋ฅผ Mambaโ€“Transformer ํ˜ผํ•ฉ ์•„ํ‚คํ…์ฒ˜์— ์ ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ํฐ ๋ชจ๋ธ ์•ˆ์— ๋” ์ž‘์€ ๋ชจ๋ธ๋“ค์ด ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํฌํ•จ๋˜๋„๋ก ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์ธ๋ฐ, ์ด ๋•๋ถ„์— 12B ๋ชจ๋ธ์„ ํ•œ ๋ฒˆ๋งŒ ํ›ˆ๋ จํ•ด๋„ ๊ฐ™์€ ์›จ์ดํŠธ์—์„œ 9B์™€ 6B ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ํ›ˆ๋ จ์„ ํ•˜์ง€ ์•Š๊ณ  ๋ฐ”๋กœ ๊บผ๋‚ด ์“ธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ์ฒ˜์Œ๋ถ€ํ„ฐ โ€œ์ž˜๋ผ๋„ ์„ฑ๋Šฅ์ด ์œ ์ง€๋˜๋Š” ๊ตฌ์กฐโ€๋กœ ํ•™์Šต์‹œํ‚ค๊ธฐ ๋•Œ๋ฌธ์—, ์ „์ฒด ๋ชจ๋ธ์„ ์“ฐ๊ณ  ์‹ถ์„ ๋•Œ๋Š” 12B๋กœ, ๋” ๊ฐ€๋ณ๊ฒŒ ๋Œ๋ฆฌ๊ณ  ์‹ถ์œผ๋ฉด 9B๋‚˜ 6B๋กœ ๊ทธ๋Œ€๋กœ ๋‚ด๋ ค์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ผ์ข…์˜ โ€˜์ค‘์ฒฉ ๋ชจ๋ธโ€™ ํŒจ๋ฐ€๋ฆฌ๊ฐ€ ์ž๋™์œผ๋กœ ๋งŒ๋“ค์–ด์ง€๋Š” ์…ˆ์ž…๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๋ฐฉ์‹์€, ๋‹น์—ฐํ•˜๊ฒŒ๋„ ๋ชจ๋ธ์„ ๊ฐ๊ฐ ๋”ฐ๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ๋ณด๋‹ค ํ›ˆ๋ จ ๋น„์šฉ์ด ํ•œ ๋‹จ๊ณ„ ๋‚ฎ์•„์ง€๊ณ , ๋ฐฐํฌํ•  ๋•Œ ๋ฉ”๋ชจ๋ฆฌ ๋น„์šฉ์ด ์ผ์ •ํ•ด์ง€๊ณ , ํฌ๊ธฐ๊ฐ€ ๋‹ฌ๋ผ๋„ ์ˆ˜ํ•™ยท์ฝ”๋“œ ์ถ”๋ก  ์„ฑ๋Šฅ์„ ๊ณ ๋ฅด๊ฒŒ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ์ ์œผ๋กœ ์•„์ฃผ ๊ฐ„๋‹จํžˆ ๋งํ•˜์ž๋ฉด, โ€˜๋…ธํŠธ๋ถ์—์„œ๋ถ€ํ„ฐ ์„œ๋ฒ„ ํด๋Ÿฌ์Šคํ„ฐ๊นŒ์ง€โ€™ ํ•˜๋‚˜์˜ ์ถ”๋ก  ๊ณ„์—ด์„ ๊ทธ๋Œ€๋กœ ๋„ฃ์–ด์„œ ์“ธ ์ˆ˜ ์žˆ๋Š” ์ ‘๊ทผ ๋ฐฉ์‹์ธ ๊ฑฐ์ฃ .

MiMo-Embodied: ๋กœ๋ด‡๊ณผ ์ž๋™์ฐจ๋ฅผ ๋ชจ๋‘ ๋‹ค๋ฃจ๋Š” ํ•˜๋‚˜์˜ ๋ชจ๋ธ

์ƒค์˜ค๋ฏธ์˜ MiMo-Embodied๋Š” ๋กœ๋ด‡ ์ž„๋ฒ ๋””๋“œ ๋ฒค์น˜๋งˆํฌ์™€ ์ž์œจ์ฃผํ–‰ ๋ฒค์น˜๋งˆํฌ ๋‘˜ ๋‹ค์—์„œ SOTA๋ฅผ ์ฐ์€ ์ฒซ ์˜คํ”ˆ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ์ด ๋ณด์—ฌ์ฃผ๋Š” ๊ธฐ๋Šฅ๋“ค์€ ๊ฝค ํญ์ด ๋„“์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์ด ์ฃผ๋ณ€ ๋ฌผ์ฒด๋ฅผ ์–ด๋–ป๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€(์–ดํฌ๋˜์Šค)๋ฅผ ํŒŒ์•…ํ•˜๊ณ  ๊ทธ์— ๋งž์ถฐ ํƒœ์Šคํฌ๋ฅผ ๊ณ„ํšํ•˜๋Š” ๋Šฅ๋ ฅ๋ถ€ํ„ฐ, ์ž์œจ์ฃผํ–‰์—์„œ ํ•„์š”ํ•œ ์žฅ๋ฉด ์ดํ•ดยท์ƒํ™ฉ ์˜ˆ์ธกยท์ฃผํ–‰ ๊ณ„ํš๊นŒ์ง€ ๋ชจ๋‘ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ๋˜ 3D ํ™˜๊ฒฝ, ์˜์ƒ, ์–ธ์–ด๋ฅผ ์˜ค๊ฐ€๋ฉด์„œ ๊ณต๊ฐ„์  ์ •๋ณด๋ฅผ ํ†ตํ•ฉ์ ์œผ๋กœ ์ดํ•ดํ•˜๋Š” ์ถ”๋ก  ๋Šฅ๋ ฅ๋„ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฐ ํ๋ฆ„์ด ์˜๋ฏธํ•˜๋Š” ๋ฐ”๋Š” ๋ถ„๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์ง€๊ธˆ๊นŒ์ง€๋Š” ๋กœ๋ด‡์šฉ ๋ชจ๋ธ, ์ž์œจ์ฃผํ–‰์šฉ ๋ชจ๋ธ, ๋น„์ „ยท์–ธ์–ด ๋ชจ๋ธ์„ ๋”ฐ๋กœ ๊ฐœ๋ฐœํ•ด ์™”๋‹ค๋ฉด, ์ด์ œ๋Š” ์ด ๋ชจ๋“  ๊ฒƒ์„ ํ•˜๋‚˜์˜ ๊ณต์œ ๋œ โ€˜Embodied Backboneโ€™ โ€” ํ˜„์‹ค ์„ธ๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ  ํ–‰๋™ํ•  ์ค„ ์•„๋Š” ๊ณตํ†ต ๊ธฐ๋ฐ˜ โ€” ์œผ๋กœ ํ†ตํ•ฉํ•˜๋ ค๋Š” ์กฐ์ง์ด ๋‚˜ํƒ€๋‚˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค. ๊ธฐ์ˆ ์˜ ๋ฐฉํ–ฅ ์ž์ฒด๊ฐ€ ๋ฐ”๋€Œ๋Š” ์ด๋Ÿฐ ์ˆœ๊ฐ„, ๊ฝค ํฅ๋ฏธ๋กญ์Šต๋‹ˆ๋‹ค.

์ž, ๊ทธ๋Ÿผ ์ด์ œ ๋Œ€ํ˜• ์—ฐ๊ตฌ์†Œ๋“ค ์ฐจ๋ก€๋กœ ๋„˜์–ด๊ฐ€ ๋ณผ๊นŒ์š”?

Claude Opus 4.5: ๊ธด ์ž‘์—…๋„ ๋„ˆ๋ˆํžˆ ๋ฒ„ํ‹ฐ๋ฉด์„œ ํ•ด๋‚ด๋Š”, ๊ฐ•๋ ฅํ•œ ์ผ๊พผ

Opus 4.5๋Š” ์‹ค์ œ ์—…๋ฌด ํ™˜๊ฒฝ์—์„œ ๋ฐ”๋กœ ์“ธ ์ˆ˜ ์žˆ๋„๋ก, ํˆด ์‚ฌ์šฉยท๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌยท์Šคํ”„๋ ˆ๋“œ์‹œํŠธ ์ž‘์—… ๊ฐ™์€ ์ƒํ™ฉ์— ๋งž์ถฐ ํŠœ๋‹๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

์ด๋ฒˆ ์—…๋ฐ์ดํŠธ๋กœ ์ ์€ ํ† ํฐ์œผ๋กœ๋„ ๋” ๋†’์€ SWE-Bench ์„ฑ๋Šฅ์„ ๋‚ด๊ณ , Claude Code ์ƒํƒœ๊ณ„์—์„œ๋Š” ๋ฉ€ํ‹ฐ์—์ด์ „ํŠธ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ ๋Šฅ๋ ฅ์ด ๊ฐ•ํ™”๋์Šต๋‹ˆ๋‹ค. ๋˜, ํ”„๋กฌํ”„ํŠธ ์ธ์ ์…˜ ๊ณต๊ฒฉ์—๋„ ๋” ๊ฐ•ํ•ด์กŒ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ž˜์„œ ๋ช‡ ์‹œ๊ฐ„ ๋™์•ˆ ์˜คํ”ผ์Šค ์Šคํƒ€์ผ์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์—์ด์ „ํŠธ๋ฅผ ๋งŒ๋“ ๋‹ค๋ฉด, Opus 4.5๋Š” ๊ทธ ์š”๊ตฌ๋ฅผ ์ถฉ๋ถ„ํžˆ ๋งŒ์กฑ์‹œํ‚ฌ ๋งŒํผ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

Opus 4.5์— ๋Œ€ํ•œ ์ฒซ์ธ์ƒ ๋ช‡ ๊ฐœ๋ฅผ ๋ฝ‘์•„๋ณด๋ฉด ์ด๋ ‡๋„ค์š”:

GPT-5.1-Codex-Max โ€” ์žฅ๊ธฐ์ ์ธ ์ฝ”๋”ฉ ์ž‘์—…์šฉ์œผ๋กœ ์ ํ•ฉํ•œ ๋‘๋‡Œ

Codex-Max๋Š” ์˜คํ”ˆAI๊ฐ€ ์ƒˆ๋กœ ๊ณต๊ฐœํ•œ โ€˜์—์ด์ „ํŠธํ˜• ์ฝ”๋”ฉ ๋ชจ๋ธโ€™๋กœ, ๋Œ€๊ทœ๋ชจ์˜ ๋ณต์žกํ•œ ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ์ด๋ผ๋“ ๊ฐ€ ์œ ์ง€๋ณด์ˆ˜ ์ž‘์—…์— ์ตœ์ ํ™”๋ผ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ์˜ ํ•ต์‹ฌ ๋Šฅ๋ ฅ์€ ์ปดํŒฉ์…˜(Compaction)์ธ๋ฐ, ์—ฌ๋Ÿฌ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ํ•˜๋‚˜์˜ ๊ธด ๋งฅ๋ฝ์ฒ˜๋Ÿผ ๋„˜๋‚˜๋“ค๋ฉด์„œ ์ˆ˜๋ฐฑ๋งŒ ํ† ํฐ ๊ทœ๋ชจ์˜ ์ž‘์—…๋„ ํ๋ฆ„์„ ์ž˜ ์œ ์ง€ํ•œ ์ฑ„ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ์ด ํŠนํžˆ ์ž˜ ๋งž๋Š” ์˜์—ญ์€ ๋ช…ํ™•ํ•ฉ๋‹ˆ๋‹ค. ๋ ˆํฌ ์ „์ฒด๋ฅผ ์˜ค๋žซ๋™์•ˆ ๋ถ„์„ํ•˜๊ณ  ์ˆ˜์ •ํ•˜๋Š” ์žฅ๊ธฐ ์—์ด์ „ํŠธ ์ž‘์—…์— ์ ํ•ฉํ•˜๊ณ , ๊ธฐ์กด ๋ชจ๋ธ๋“ค์ด ์ค‘๊ฐ„์— ๋งฅ๋ฝ์„ ์žƒ๊ธฐ ์‰ฌ์› ๋˜ ๋Œ€๊ทœ๋ชจ ๋ฆฌํŒฉํ† ๋ง์—์„œ๋„ ์•ˆ์ •์ ์ธ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋˜ ์ฝ”๋”ฉยท๋ฆฌ์„œ์น˜ยทํ…Œ์ŠคํŠธยท๋ฌธ์„œ ์ž‘์—…์ด ์„ž์—ฌ ์žˆ๋Š” ์‹ค์ œ ์—”์ง€๋‹ˆ์–ด๋ง ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ๋„ ์œ ์šฉํ•˜๊ฒŒ ์“ธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Claude Opus 4.5๋ณด๋‹ค ๋จผ์ € ์ถœ์‹œ๋˜์—ˆ์ง€๋งŒ, ์ƒ๋Œ€์ ์œผ๋กœ ๋œ ์ฃผ๋ชฉ๋ฐ›์•˜๋‹ค๋Š” ์ ์ด ์กฐ๊ธˆ ์•„์‰ฌ์šธ ์ •๋„๋„ค์š”.

Google stack: Gemini 3, Antigravity, Nano Banana Pro

Gemini 3๋Š” ๊ตฌ๊ธ€์˜ ์ƒˆ๋กœ์šด ํ”Œ๋ž˜๊ทธ์‹ญ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

์•„์ฃผ ์ธ์ƒ์ ์ธ ๋ชจ๋ธ์ด๊ณ , Pro๋„ ๊ฐ•๋ ฅํ•˜์ง€๋งŒ, Deep Think ๋ชจ๋“œ๊ฐ€ ์ง„์งœ ํฌ์ธํŠธ์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋” ๋†’์€ GPQA์™€ ARC-AGI-2 ์„ฑ๋Šฅ, ๋” ๊ธด ์ถ”๋ก  ์ฒด์ธ, ๋” ํƒ„ํƒ„ํ•œ ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ๊นŒ์ง€ ๊ฐ•ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

Gemini 3๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์ข‹์€ ์ƒํ™ฉ์€:

  • ๋‚œํ•ดํ•œ ์ž๋ฃŒ๋ฅผ ํ•จ๊ป˜ ๊ณต๋ถ€ํ•  โ€˜์Šคํ„ฐ๋”” ํŒŒํŠธ๋„ˆโ€™๊ฐ€ ํ•„์š”ํ•  ๋•Œ

  • ๊ธธ๊ณ  ๋ณต์žกํ•œ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ํ•„์š”ํ•œ ํ”„๋กœ์ ํŠธ

  • ํ…์ŠคํŠธยท์ด๋ฏธ์ง€ยท๋น„๋””์˜ค๊ฐ€ ์„ž์ธ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฌธ์ œ ํ•ด๊ฒฐ

Nano Banana Pro๋Š” ์ด๋ฏธ์ง€ ๋ชจ๋ธ์˜ ์—…๊ทธ๋ ˆ์ด๋“œ์ธ๋ฐ, ๋“œ๋””์–ด ์ด๋ฏธ์ง€ ์† ํ…์ŠคํŠธ๋ฅผ ์ง„์งœ โ€˜1๊ธ‰ ์‹œ๋ฏผโ€™์œผ๋กœ ๋‹ค๋ฃจ๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค - ์ œ๋Œ€๋กœ ํ…์ŠคํŠธ ์ฒ˜๋ฆฌ๋ฅผ ์›ํ•˜๋Š” ๋Œ€๋กœ ํ•ด ์ค€๋‹ค๋Š” ์ด์•ผ๊ธฐ์ฃ .

ํฌ์Šคํ„ฐ, UI ๋ชฉ์—…, ํŒจํ‚ค์ง€ ๋””์ž์ธ, ๋ธŒ๋žœ๋“œ ์ผ๊ด€์„ฑ ์žˆ๋Š” ๋น„์ฃผ์–ผ ์ œ์ž‘ ๋“ฑ, โ€œ์ด ๊ฐœ๋…์„ ์‹œ๊ฐ์ ์œผ๋กœ ์ž˜ ์„ค๋ช…ํ•ด ๋‹ฌ๋ผโ€๋Š” ์‹์˜ ๋‹ˆ์ฆˆ๊ฐ€ ์žˆ์„ ๋•Œ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

Google Antigravity๋„ ์•„์ฃผ ๋งŽ์€ ๊ด€์‹ฌ์„ ๋ฐ›๊ณ  ์žˆ์ฃ . ์ด๊ฑด ๋ชจ๋ธ์€ ์•„๋‹ˆ์ง€๋งŒ, ์—์ด์ „ํŠธ ์‹œ๋Œ€์˜ IDE๋ž€ ์–ด๋–ค ๊ฒƒ์ผ๊นŒ ํ•˜๋Š” ์งˆ๋ฌธ์— ๋Œ€ํ•œ ํ˜„์žฌ ๊ธฐ์ค€ ๊ตฌ๊ธ€์˜ ๋‹ต์ด ์•„๋‹๊นŒ ์‹ถ์Šต๋‹ˆ๋‹ค.

Google Antigravity๋Š” ๊ฐœ๋ฐœ์ž๋ฅผ ์œ„ํ•œ ์ฝ”๋“œ ์—๋””ํ„ฐ ๊ธฐ๋Šฅ๊ณผ ๋”๋ถˆ์–ด์„œ, ๋ธŒ๋ผ์šฐ์ €๋‚˜ ํ„ฐ๋ฏธ๋„ ๋“ฑ์—์„œ ์—ฌ๋Ÿฌ AI ์—์ด์ „ํŠธ๊ฐ€ ๋™์‹œ์— ์ž‘์—…ํ•˜๋Š” ์ƒํ™ฉ์„ ํ•œ๋ˆˆ์— ์ง€ํœ˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ด€๋ฆฌ ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋ฌด์—‡๋ณด๋‹ค ๊ฐ€์žฅ ํ˜์‹ ์ ์ธ ์ ์€ AI์˜ ์ž‘์—… ๊ณผ์ •์„ ๋‚ฑ๋‚ฑ์ด ๊ธฐ๋กํ•˜๋Š” '์•„ํ‹ฐํŒฉํŠธ(Artifact)' ๊ธฐ๋Šฅ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด ๋„๊ตฌ๋“ค์ด ๋‹จ์ˆœํžˆ ๊ฒฐ๊ณผ ์ฝ”๋“œ(Diff)๋งŒ ๋ณด์—ฌ์ค˜์„œ AI๊ฐ€ ์–ด๋–ค ๊ณผ์ •์„ ๊ฑฐ์ณค๋Š”์ง€ ์•Œ๊ธฐ ์–ด๋ ค์› ๋˜ ๋ฐ˜๋ฉด, ์•ˆํ‹ฐ๊ทธ๋ž˜๋น„ํ‹ฐ๋Š” AI๊ฐ€ ์ˆ˜๋ฆฝํ•œ ๊ณ„ํš๋ถ€ํ„ฐ ์‹ค์ œ ์ฐธ์กฐํ•œ ํ™”๋ฉด, ์‹คํ–‰ํ•œ ๋ช…๋ น์–ด ๊ธฐ๋ก๊นŒ์ง€ ๋ชจ๋“  ์ž‘์—… ๋กœ๊ทธ๋ฅผ ํˆฌ๋ช…ํ•˜๊ฒŒ ๋‚จ๊ฒจ์ค๋‹ˆ๋‹ค. ๋•๋ถ„์— ๊ฐœ๋ฐœ์ž๋Š” ๊ฒฐ๊ณผ๋ฌผ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ณผ์ •๊นŒ์ง€ ์™„๋ฒฝํ•˜๊ฒŒ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ์ฃ . ์ด ๊ธฐ๋Šฅ์ด ๊ธฐ๋Œ€๋งŒํผ ์ž‘๋™ํ•œ๋‹ค๋ฉด '์ปค์„œ(Cursor)' ๊ฐ™์€ ๊ธฐ์กด ์ธ๊ธฐ ๋„๊ตฌ๋“ค์„ ๊ฐ•๋ ฅํ•˜๊ฒŒ ์œ„ํ˜‘ํ•  ๊ฒŒ์ž„ ์ฒด์ธ์ €๊ฐ€ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋‹ค๋งŒ ์ถœ์‹œ ์งํ›„ ๋ฐ”๋กœ ๋ช‡ ๊ฐ€์ง€ ํ•œ๊ณ„์— ๋ถ€๋”ชํ˜€์„œ, ๊ตฌ๊ธ€ ํŒ€์ด ๊ฑฐ์˜ ๋ฐค์„ ์ƒˆ ๊ฐ€๋ฉด์„œ ๊ฐœ์„  ์ค‘์ž…๋‹ˆ๋‹ค.

Grok 4.1: ๊ฐœ์„ฑ๊ณผ ๋‘๋‡Œ๋ฅผ ํ•จ๊ป˜ ๋Œ์–ด์˜ฌ๋ฆฐ ๋ชจ๋ธ

Grok 4.1์€ ๊ฐ์ • ์ง€๋Šฅ(EQ)๊ณผ ์ถ”๋ก ์˜ ์•ˆ์ •์„ฑ์„ ๋™์‹œ์— ๊ฐ•ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค.

EQ-Bench ์ ์ˆ˜ ์ƒ์Šน, ์ฐฝ์ž‘ยท๊ธ€์“ฐ๊ธฐ ๋Šฅ๋ ฅ ๊ฐœ์„ , ์ •๋ณด์„ฑ ํ”„๋กฌํ”„ํŠธ์—์„œ ๋‚ฎ์€ ํ™˜๊ฐ๋ฅ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

Grok 4.1์€ ์•„๋ž˜์™€ ๊ฐ™์€ ์˜์—ญ์— ๋‹ˆ์ฆˆ๊ฐ€ ํฌ๋‹ค๋ฉด ์ ํ•ฉํ•œ ๋ชจ๋ธ์ด ์•„๋‹Œ๊ฐ€ ์‹ถ์–ด์š”:

  • ์†Œ๋น„์ž์šฉ ์ฑ— ๊ฒฝํ—˜

  • ์ฐฝ์ž‘ยท์†Œ์…œ ์ค‘์‹ฌ์˜ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜

  • โ€˜ํ†ค์ด ๋ฐ‹๋ฐ‹ํ•˜๋ฉด ์•ˆ ๋˜๋Š”โ€™ ์–ด์‹œ์Šคํ„ดํŠธ

์ €๋Š” Grok 4.1์˜ ์‚ฌ์šฉ์ž๋Š” ์•„๋‹ˆ์ง€๋งŒ, ๊ด€์‹ฌ ์žˆ์œผ์‹œ๋ฉด ๋ธ”๋กœ๊ทธ์—์„œ ๋” ์ž์„ธํ•œ ๋‚ด์šฉ์„ ๋ณด์‹œ๋ฉด ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค.

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„๋Š” ๋…์ž๋“ค์˜ ์‘์›์œผ๋กœ ๋งŒ๋“ค์–ด์ง‘๋‹ˆ๋‹ค. ๊ฐ€์น˜์žˆ๋Š” ์ปจํ…์ธ ๋ฅผ ์ง€์†์ ์œผ๋กœ ์—ฌ๋Ÿฌ๋ถ„๊ณผ
๊ณต์œ ํ•  ์ˆ˜ ์žˆ๋„๋ก, ์ปคํ”ผ ํ•œ ์ž”์œผ๋กœ ํž˜์„ ๋ณดํƒœ์ฃผ์„ธ์š” โ˜•

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

AI ์„นํ„ฐ์—์„œ ํŠนํžˆ ์š”์ฆ˜ ๋‹ค์‹œ ๋งŽ์ด ์–ธ๊ธ‰๋˜๊ณ  ์žˆ๋Š” ๊ณต๊ฐ„ ์ง€๋Šฅ(Spatial Intelligence)์ด๋ž€, ์‰ฝ๊ฒŒ ๋งํ•ด์„œ ๋ชจ๋ธ์ด ๊ฐ€์ง€๊ณ  ์žˆ๋Š” โ€˜๊ณต๊ฐ„ ๊ฐ๊ฐโ€™ ์ •๋„๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์‚ฌ๋ฌผ์ด ์–ด๋””์— ์žˆ๋Š”์ง€, ์„œ๋กœ ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š”์ง€, ์–ด๋–ป๊ฒŒ ์›€์ง์ด๋Š”์ง€๋ฅผ ์ดํ•ดํ•˜๋Š” ๋Šฅ๋ ฅ์ด์ฃ . ์ด ๋Šฅ๋ ฅ์ด ์žˆ์–ด์•ผ AI ๋ชจ๋ธ์ด ๋ฐฉ ์•ˆ์„ ๋Œ์•„๋‹ค๋‹ˆ๊ณ , ๋ณด์ด๋Š” ์žฅ๋ฉด์„ ํ•ด์„ํ•˜๊ณ , ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋ฌผ์ฒด๋“ค์ด ์–ด๋–ป๊ฒŒ ๋งž๋ฌผ๋ฆฌ๋Š”์ง€ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ง ๊ทธ๋Œ€๋กœ, ๋จธ๋ฆฟ ์†์— ํ•˜๋‚˜์˜ โ€˜์ง€๋„โ€™๊ฐ€ ๋“ค์–ด์žˆ๋Š” ์…ˆ์ธ ๊ฑฐ์ฃ . ์˜ˆ๋ฅผ ๋“ค์–ด, ์›”๋“œ ๋ชจ๋ธ์€ ์ด ๊ณต๊ฐ„ ์ง€๋Šฅ์ด ์—†๋‹ค๋ฉด ์ œ๋Œ€๋กœ ์ž‘๋™ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

์˜ค๋Š˜์€, ๊ณต๊ฐ„ ์ง€๋Šฅ์ด ๋ฌด์—‡์ธ์ง€, ๊ทธ๋ฆฌ๊ณ  ์–ด๋–ป๊ฒŒ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ๋Š”์ง€ ์‚ดํŽด๋ณผ ์ˆ˜ ์žˆ๋Š” 6๊ฐ€์ง€ ์ฝ์„๊ฑฐ๋ฆฌ๋ฅผ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค:

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • ๐ŸŒŸ๐ŸŒŸ Downscaling Intelligence: Exploring Perception and Reasoning Bottlenecks in Small Multimodal Models (by Stanford)

    ์ด ๋…ผ๋ฌธ์€ ํ”ํžˆ ๋งํ•˜๋Š” โ€œ์ž‘์€ ๋ชจ๋ธ์€ ๊ทธ๋ƒฅ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ๋–จ์–ด์ง„๋‹คโ€๋Š” ํ†ต๋…์„ ๋’ค์ง‘์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ์ž‘๊ฒŒ ๋งŒ๋“ค๋ฉด ์ง„์งœ๋กœ ๋ฌธ์ œ๊ฐ€ ์ƒ๊ธฐ๋Š” ๊ฑด ์–ธ์–ด ์ถ”๋ก ์ด ์•„๋‹ˆ๋ผ โ€˜์‹œ๊ฐ์  ์ง€๊ฐ ๋Šฅ๋ ฅโ€™์ด๋ผ๋Š” ์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ฆ‰, ์ด๋ฏธ์ง€์—์„œ ํ•„์š”ํ•œ ๋””ํ…Œ์ผ์„ ์•ˆ์ •์ ์œผ๋กœ ๋ฝ‘์•„๋‚ด๋Š” ๋Šฅ๋ ฅ์ด ๋จผ์ € ๋ถ•๊ดดํ•œ๋‹ค๋Š” ๊ฑฐ์ฃ .

    ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ, EXTRACT+THINK๋ผ๋Š” ๋‘ ๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

    • ์ž‘์€ VLM์ด ๋จผ์ € ์ง€์‹œ๋ฌธ๊ณผ ๊ด€๋ จ๋œ ์‹œ๊ฐ ์ •๋ณด๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์ถ”์ถœํ•˜๊ณ 

    • ๊ทธ ๋‹ค์Œ์œผ๋กœ, ์กฐ๊ธˆ ๋” ํฐ LLM์ด ๊ทธ ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.


    ๋†€๋ž๊ฒŒ๋„, ์•„์ฃผ ์ ์€ ๋ฐ์ดํ„ฐ์™€ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ์œผ๋กœ๋„ ๋†’์€ ๋ฒค์น˜๋งˆํฌ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, ๊ฝค ํฅ๋ฏธ๋กœ์šด ์ ‘๊ทผ๋ฒ•์ด์ฃ .

  • ๐ŸŒŸ WorldGen: From Text to Traversable and Interactive 3D Worlds (by Meta)

    ํ…์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ๋งŒ์œผ๋กœ ์ผ๊ด€์„ฑ ์žˆ๊ณ  ์‹ค์ œ๋กœ ๊ทธ ์•ˆ์—์„œ ์ด๋™๋„ ํ•  ์ˆ˜ ์žˆ๊ณ  ์ƒํ˜ธ์ž‘์šฉํ•  ์ˆ˜ ์žˆ๋Š” 3D ํ™˜๊ฒฝ์„ ์ƒ์„ฑํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.
    LLM ๊ธฐ๋ฐ˜ ๋ ˆ์ด์•„์›ƒ ์ถ”๋ก , ํ”„๋กœ์‹œ์ €๋Ÿด ์ƒ์„ฑ, ํ™•์‚ฐ ๊ธฐ๋ฐ˜์˜ 3D ํ•ฉ์„ฑ์„ ๊ฒฐํ•ฉํ•ด์„œ ์ผ๋ฐ˜์ ์ธ ๊ฒŒ์ž„ ์—”์ง„ ์•ˆ์—์„œ ๋™์ž‘ํ•˜๋Š” 3D ์›”๋“œ๋ฅผ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค.

  • ๐ŸŒŸ Mixture of States: Routing Token-Level Dynamics for Multimodal Generation (by KAUST and Meta)

    ์ด ์—ฐ๊ตฌ๋Š” ๋””ํ“จ์ „ ๋ชจ๋ธ์—์„œ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋ฅผ ๋” ์ž˜ ์œตํ•ฉํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
    ํ† ํฐ ๋‹จ์œ„ ๋ผ์šฐํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด์„œ ์‹œ๊ฐ„์— ๋”ฐ๋ผ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ(Hidden States)๋ฅผ ํฌ์†Œํ•˜๊ฒŒ ํ˜ผํ•ฉํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด์„œ ํ›จ์”ฌ ํฐ ๋ชจ๋ธ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ Text-to-Image ์ƒ์„ฑ๊ณผ ํŽธ์ง‘ ์ž‘์—…์—์„œ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜์˜ ๊ณผํ•™, ์ž์œจ์  ์—ฐ๊ตฌ ๋ฐ ์ž๊ธฐ ์ง„ํ™” ์—์ด์ „ํŠธ

  • OmniScientist: Toward a Co-evolving Ecosystem of Human and AI Scientists

    ์ธ๊ฐ„ ์—ฐ๊ตฌ์ž์™€ AI ์—ฐ๊ตฌ์ž๊ฐ€ ๊ฐ™์€ ์ธํ”„๋ผ์—์„œ ํ•จ๊ป˜ ์ง„ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํƒœ๊ณ„๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•œ ์ œ์•ˆ์ž…๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ AI-Science ์Šคํƒ ์•ˆ์— ์ธ์šฉ ๊ทธ๋ž˜ํ”„, ํ˜‘์—… ํ”„๋กœํ† ์ฝœ, ์˜คํ”ˆ ํ‰๊ฐ€ ๊ณต๊ฐ„์„ ๋‚ด์žฅํ•ด์„œ ์ธ๊ฐ„๊ณผ AI๊ฐ€ ๋™์ผํ•œ ์—ฐ๊ตฌ ํ™˜๊ฒฝ์—์„œ ์ƒํ˜ธ ๋ณด์™„์ ์œผ๋กœ ๋ฐœ์ „ํ•˜๋„๋ก ํ•˜๋Š” ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸ What Does It Take to Be a Good AI Research Agent? Studying the Role of Ideation Diversity (Meta)

    ์ด ์—ฐ๊ตฌ๋Š” AI ์—ฐ๊ตฌ ์—์ด์ „ํŠธ์˜ โ€˜์•„์ด๋””์–ด ๋‹ค์–‘์„ฑ(Ideation Diversity)โ€™์ด ์‹ค์ œ ์—ฐ๊ตฌ ์„ฑ๊ณผ๋ฅผ ์–ด๋–ป๊ฒŒ ๋†’์ด๋Š”์ง€๋ฅผ ์ƒ๊ด€ ๋ถ„์„๊ณผ ์‹คํ—˜์„ ํ†ตํ•ด ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค.

    ๊ฒฐ๋ก ์€ ๋ช…ํ™•ํ•ฉ๋‹ˆ๋‹ค: ๋” ๋‹ค์–‘ํ•œ ์•„์ด๋””์–ด ์„ธํŠธ๋ฅผ ๊ฐ€์ง„ ์—์ด์ „ํŠธ์ผ์ˆ˜๋ก MLE-bench ์„ฑ๋Šฅ์ด ๊พธ์ค€ํžˆ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค. ์ฆ‰, โ€˜๋‹ค๋ฅด๊ฒŒ ์ƒ๊ฐํ•˜๊ธฐโ€™๊ฐ€ ์—ฐ๊ตฌ ์—์ด์ „ํŠธ์—๊ฒŒ๋„ ํ•ต์‹ฌ์ด๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

  • Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning

    ์ด ๋…ผ๋ฌธ์€ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ์—†์ด๋„ ์ž๊ธฐ ์ง„ํ™”(Self-Evolving)ํ•˜๋Š” ์—์ด์ „ํŠธ๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

    ์ปค๋ฆฌํ˜๋Ÿผ ์—์ด์ „ํŠธ์™€ ์‹คํ–‰ ์—์ด์ „ํŠธ๋ฅผ ๋ฒ ์ด์Šค๋ผ์ธ LLM์—์„œ ํ•จ๊ป˜ ์ง„ํ™”์‹œํ‚ค๋ฉด์„œ, ๋„๊ตฌ๋ฅผ ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉํ•ด์„œ ์ ์  ๋” ์–ด๋ ค์šด ์ž‘์—…์„ ์Šค์Šค๋กœ ์ƒ์„ฑยทํ•ด๊ฒฐํ•˜๊ฒŒ ํ•˜๋Š”๋ฐ, ๊ทธ ๊ฒฐ๊ณผ๋กœ ์™ธ๋ถ€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์“ฐ์ง€ ์•Š๊ณ ๋„ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์˜๋ฏธ์žˆ๋Š” ์ˆ˜์ค€์œผ๋กœ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.

  • Agent-R1: Training Powerful LLM Agents with End-to-End Reinforcement Learning

    LLM ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋ฅผ ์œ„ํ•œ RL ํ•™์Šต ๋ฐฉ์‹์„ ์ •์‹ํ™”ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.

    ํ™•์žฅ๋œ MDP ๊ด€์ ์—์„œ ์—์ด์ „ํŠธ์˜ ํ–‰๋™๊ณผ ํ™˜๊ฒฝ ์ƒํ˜ธ์ž‘์šฉ์„ ๋‹ค๋ฃจ๊ณ , ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์— ์‰ฝ๊ฒŒ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“ˆํ˜• RL ํŠธ๋ ˆ์ด๋‹ ๊ตฌ์กฐ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, RL ๊ธฐ๋ฐ˜ ์—์ด์ „ํŠธ๋ฅผ ๋” ๊ฐ•๋ ฅํ•˜๊ณ  ์ผ๊ด€๋˜๊ฒŒ ํ•™์Šต์‹œํ‚ค๊ธฐ ์œ„ํ•œ โ€˜ํ‘œ์ค€ํ˜• ์„ค๊ณ„๋„โ€™์— ๊ฐ€๊น์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ ์Šค์ผ€์ผ๋ง, ํŠธ๋ ˆ์ด๋‹ ํšจ์œจ์„ฑ ๋ฐ ์ถ”๋ก  ์—ฐ์‚ฐ

  • ๐ŸŒŸ Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance (Meta)

    ์ด ๋…ผ๋ฌธ์€ ์นดํ…Œ๊ณ ๋ฆฌ๋ณ„ ์ „๋ฌธ๊ฐ€ ๋ชจ๋ธ๋“ค์„ ๋น„๊ท ์ผ ๊ฐ€์ค‘์น˜๋กœ ์„ž์–ด์„œ(Souping) ํ•˜๋‚˜์˜ ํ‰๊ท  ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” SoCE(Soup of Category-specific Experts) ์ ‘๊ทผ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

    ๋ฒค์น˜๋งˆํฌ์˜ ๊ตฌ์กฐ๋ฅผ ํ™œ์šฉํ•ด์„œ ์„œ๋กœ ๋‹ค๋ฅธ ์ „๋ฌธ๊ฐ€ ๋ชจ๋ธ์„ ๊ฐ€์ค‘ ํ‰๊ท ํ•จ์œผ๋กœ์จ ๊ฒฌ๊ณ ์„ฑ์„ ๋†’์ด๊ณ , ํ•จ์ˆ˜ ํ˜ธ์ถœ ๋“ฑ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์ž‘์—…์—์„œ SOTA ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

    ๋‹จ์ˆœํ•œ ์‚ฐ์ˆ ์ ์ธ ์กฐํ•ฉ๋งŒ์œผ๋กœ๋„ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ๋Œ์–ด์˜ฌ๋ฆด ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.

  • ๐ŸŒŸ Seer: Online Context Learning for Fast Synchronous LLM Reinforcement Learning (by Moonshot AI and Tsinghua)

    Seer๋Š” ๋™๊ธฐ์‹ RL ๋กค์•„์›ƒ ์†๋„๋ฅผ ๋Œ€ํญ ๋Œ์–ด์˜ฌ๋ฆฌ๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ๋™์ผํ•œ ํ”„๋กฌํ”„ํŠธ๋“ค์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ๊ณต์œ ๋œ ์ƒ์„ฑ ํŒจํ„ด์„ ํ™œ์šฉํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ตœ์ ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค:

    • ๋กค์•„์›ƒ์„ ๋™์ ์œผ๋กœ ๋ถ„ํ• 

    • ์ปจํ…์ŠคํŠธ ์œ ์‚ฌ๋„ ๊ธฐ๋ฐ˜ ์ž‘์—… ์Šค์ผ€์ค„๋ง

    • ๊ทธ๋ฃน ๋‹จ์œ„๋กœ Adaptive Speculative Decoding ์ˆ˜ํ–‰


    ๊ฒฐ๊ณผ์ ์œผ๋กœ, ์ฒ˜๋ฆฌ๋Ÿ‰์€ 74โ€“97% ์ฆ๊ฐ€, ๋กฑํ…Œ์ผ ์ง€์—ฐ ์‹œ๊ฐ„์€ 75โ€“93% ๊ฐ์†Œํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ฃผ๊ณ , RL ํ•™์Šต ์†๋„๋ฅผ ์‹ค์ „ ์ˆ˜์ค€์œผ๋กœ ๋Œ์–ด์˜ฌ๋ฆฌ๋Š” ๊ธฐ์ˆ ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

    ์ด ์—ฐ๊ตฌ๋Š” ๋ชจ๋“  ํ† ํฐ์„ ๋ฐ˜๋ณต ์ถ”๋ก (Recurrent Refinement)ํ•˜์ง€ ์•Š๊ณ , ๋ชจ๋ธ์ด โ€˜์–ด๋ ค์šธ ๊ฒƒโ€™์ด๋ผ๊ณ  ์˜ˆ์ธกํ•œ ํ† ํฐ์—๋งŒ ์„ ํƒ์ ์œผ๋กœ ๋ฐ˜๋ณต ์ถ”๋ก ์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ decider์™€ LoRA-shifted objective๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

    ์ด ์ ‘๊ทผ ๋ฐฉ์‹์˜ ์ฃผ์š” ํšจ๊ณผ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

    • ํ•„์š”ํ•œ ๋ถ€๋ถ„์—๋งŒ ๊นŠ๊ฒŒ ์ƒ๊ฐํ•˜๊ฒŒ ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ถ”๋ก  ์„ฑ๋Šฅ ํ–ฅ์ƒ

    • ๋ถˆํ•„์š”ํ•œ โ€˜์˜ค๋ฒ„์”ฝํ‚นโ€™์„ ๋ฐฉ์ง€

    • ๋Œ€๋ถ€๋ถ„์˜ ํ† ํฐ์€ ๋‹จ์ผ ํŒจ์Šค๋กœ ์ฒ˜๋ฆฌํ•ด์„œ ๋น„์šฉ ์ ˆ๊ฐ


    ์ฆ‰, โ€œ์ƒ๊ฐ์ด ํ•„์š”ํ•œ ๋ถ€๋ถ„๋งŒ ๋” ์ƒ๊ฐํ•˜๊ฒŒ ํ•˜๋Š”โ€ ํšจ์œจ์ ์ธ ์ถ”๋ก  ๊ฐ•ํ™” ์ „๋žต์ž…๋‹ˆ๋‹ค.

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.