• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#89: แ„‰แ…ฅแ†ผแ„แ…ณแ†ท แ„ƒแ…กแ„€แ…กแ„‹แ…ฉแ†ซ AIแ„‹แ…ด แ„†แ…ตแ„…แ…ข: AI แ„‹แ…ฆแ†ซแ„Œแ…ตแ„‚แ…ตแ„‹แ…ฅ, แ„Œแ…กแ„€แ…ก แ„Œแ…ตแ†ซแ„’แ…ช แ„†แ…ฉแ„ƒแ…ฆแ†ฏ, แ„’แ…ฒแ„†แ…ฅแ„‚แ…ฉแ„‹แ…ตแ„ƒแ…ณ แ„…แ…ฉแ„‡แ…ฉแ†บ

๐ŸŒFOD#89: แ„‰แ…ฅแ†ผแ„แ…ณแ†ท แ„ƒแ…กแ„€แ…กแ„‹แ…ฉแ†ซ AIแ„‹แ…ด แ„†แ…ตแ„…แ…ข: AI แ„‹แ…ฆแ†ซแ„Œแ…ตแ„‚แ…ตแ„‹แ…ฅ, แ„Œแ…กแ„€แ…ก แ„Œแ…ตแ†ซแ„’แ…ช แ„†แ…ฉแ„ƒแ…ฆแ†ฏ, แ„’แ…ฒแ„†แ…ฅแ„‚แ…ฉแ„‹แ…ตแ„ƒแ…ณ แ„…แ…ฉแ„‡แ…ฉแ†บ

แ„’แ…งแ†ซแ„‰แ…ตแ†ฏแ„…แ…ฉ แ„ƒแ…ณแ†ฏแ„‹แ…ฅแ„‹แ…ฉแ„€แ…ฉ แ„‹แ…ตแ†ปแ„‚แ…ณแ†ซ แ„Žแ…ฌแ„‰แ…ตแ†ซแ„‹แ…ด AI แ„€แ…ตแ„‰แ…ฎแ†ฏแ„ƒแ…ณแ†ฏ + แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‚แ…ฒแ„‰แ…ณ แ„†แ…ตแ†พ แ„‹แ…งแ†ซแ„€แ…ฎ

์ง€๋‚œ ์ฃผ, ํŠœ๋ง ํฌ์ŠคํŠธ์˜ Ksenia๊ฐ€ ๋‰ด์š•์—์„œ ์—ด๋ฆฐ AI Engineer Summit์˜ โ€˜Agent Engineeringโ€™ ํŠธ๋ž™์—์„œ ๊ณต๋™ ์ง„ํ–‰์„ ๋งก์•˜์Šต๋‹ˆ๋‹ค. ์ด Summit์—์„œ ํ™•์ธํ•œ ์žฌ๋ฏธ์žˆ๋Š” ์†Œ์‹๋“ค๋„ ๊ณง ๊ณต์œ ํ•ด ๋“œ๋ฆฌ๋„๋ก ํ•  ํ…๋ฐ์š”.

Ksenia๊ฐ€ ๊ฐ€์žฅ ๋†€๋ž๋˜ ๊ฑด, 2022๋…„ ๋ง ์ฑ—GPT๊ฐ€ ์ƒ์„ฑํ˜• AI ์‹œ๋Œ€๋ฅผ ์—ด์–ด์ –ํžŒ ์ดํ›„, ์ •๋ง ์—„์ฒญ๋‚œ ๋ณ€ํ™”๊ฐ€ ์žˆ์—ˆ๊ตฌ๋‚˜ ๋‹ค์‹œ ํ•œ ๋ฒˆ ๋Š๊ผˆ๋˜ ๊ฑฐ๋ผ๊ณ  ํ•ด์š”.

์‚ฌ์‹ค, โ€˜๋จธ์‹ ๋Ÿฌ๋‹โ€™ ์ž์ฒด๋Š” ๊ทธ ์‹ค์šฉ์„ฑ์„ ์ฆ๋ช…ํ•œ์ง€ ๊ฝค ๋˜์—ˆ๋‹ค๊ณ  ๋ด์•ผ ํ•˜๊ณ , ๊ธ€๋กœ๋ฒŒ์˜ ํฐ ๊ธฐ์—…๋“ค์—๋Š” ๋งŽ์€ ๊ฒฝ์šฐ์— ๋จธ์‹ ๋Ÿฌ๋‹ ํŒ€์ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡์ง€๋งŒ 2023๋…„ ์ดˆ๋ถ€ํ„ฐ๋Š” ํ›จ์”ฌ ๋” ๋งŽ์€ ๊ธฐ์—…๋“ค์— AI ๋‹ด๋‹น ํŒ€์ด ์ƒ๊ธฐ๊ธฐ ์‹œ์ž‘ํ–ˆ๊ณ , ๋งŽ์€ ํšŒ์‚ฌ๋“ค์ด ๋” ํ›Œ๋ฅญํ•œ AI ์ธ์žฌ๋“ค์„ ํ™•๋ณดํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ•˜๋Š” ๋ชจ์Šต์„ Summit์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค - Jane Street, BlackRock, Morgan Stanley ๋“ฑ์—์„œ๋Š” ์ž์‹ ๋“ค์ด ์–ด๋–ค AI ์—ฐ๊ตฌ๋ฅผ ํ•˜๋Š”์ง€ ํŽผ์ณ๋†“๊ณ  โ€œ์ด๋Ÿฐ ๋ฉ‹์ง„ ์ผ์„ ์šฐ๋ฆฌ๊ฐ€ ํ•˜๊ณ  ์žˆ์œผ๋‹ˆ, ํ•จ๊ป˜ ํ•ฉ์‹œ๋‹คโ€๋Š” ๋ฉ”์‹œ์ง€๋ฅผ ๊ฐ•๋ ฅํ•˜๊ฒŒ ์ „๋‹ฌํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๋‹จ์ˆœ ๊ฐœ๋ฐœ ์ธ๋ ฅ์€ AI ๋•Œ๋ฌธ์— ์‹ค์ง ์œ„๊ธฐ์— ์žˆ๋‹ค๊ณ  ํ•˜๋Š” ๋ฐ˜๋ฉด์—, AI ์—”์ง€๋‹ˆ์–ด, ๊ฐœ๋ฐœ์ž์— ๋Œ€ํ•œ ์ˆ˜์š”๋Š” ๊พธ์ค€ํžˆ ์ฆ๊ฐ€ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก , ์š”๊ตฌํ•˜๋Š” ์ธ์žฌ์˜ ์ˆ˜์ค€์€ ๋†’์•„์š”. ๋งํฌ๋“œ์ธ์˜ Xiaofung Wang์ด ์ด์•ผ๊ธฐํ•œ ๊ฒƒ์ฒ˜๋Ÿผ, ๊ธฐ์—…๋“ค์ด ์›ํ•˜๋Š” ์ด์ƒ์ ์ธ AI ํŒ€์˜ ํ›„๋ณด๋Š” โ€˜์ธํ”„๋ผ ํ†ตํ•ฉ์— ๋Šฅ์ˆ™ํ•˜๋ฉด์„œ๋„, ๋›ฐ์–ด๋‚œ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด์—ฌ์•ผ ํ•˜๊ณ , ์ธํ„ฐํŽ˜์ด์Šค ์„ค๊ณ„ ๊ฒฝํ—˜๋„ ํ’๋ถ€ํ•œ๋ฐ, AI์™€ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค์˜ ์ง€์‹๊ณผ ๋ฐฐ๊ฒฝ์„ ๊ฐ–์ถ˜ ์‚ฌ๋žŒ์ด, ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ์— ํ˜ธ๊ธฐ์‹ฌ๋„ ๋งŽ๊ณ  ๋นจ๋ฆฌ ๋ฐฐ์šฐ๊ณ , ๋ณ€ํ™”ํ•˜๋Š” ํŠธ๋ Œ๋“œ์— ์ž˜ ์ ์‘ํ•˜๋Š”โ€™ ๊ทธ๋Ÿฐ ์‚ฌ๋žŒ์ด๋ผ๊ณ  ํ•˜๋‹ˆ๊นŒ์š” - ๋ญ, ์ด ์ •๋„๋ฉด โ€˜์œ ๋‹ˆ์ฝ˜โ€™ ๊ทธ ์ž์ฒด ์•„๋‹Œ๊ฐ€์š”? ^.^;

์ž, ๋” ๋†€๋ผ์šด ๊ฑด, ์‹ค์ œ๋กœ ๊ทธ๋Ÿฐ ์‚ฌ๋žŒ์ด ๋˜๋Š” ๊ฒŒ โ€˜์™„์ „ํžˆ ๋ถˆ๊ฐ€๋Šฅํ•œ ๋ฏธ์…˜โ€™์ด ์•„๋‹ˆ๋ผ๋Š” ์ ์ด์ฃ . ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ, ๊ต์œก ์ž๋ฃŒ, ๊ทธ๋ฆฌ๊ณ  ์ง์ ‘ ์‚ฌ์šฉํ•˜๊ณ  ์ฒดํ—˜ํ•ด ๋ณผ ์ˆ˜ ์žˆ๋Š” ๋„๊ตฌ๋“ค์ด ์‚ฌ๋ฐฉ์— ๋„๋ ค(?) ์žˆ๋‹ค๊ณ  ํ•ด๋„ ๊ณผ์–ธ์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ƒ์„ฑํ˜• AI ๊ธฐ์ˆ ์— ๋Œ€ํ•œ ์ ‘๊ทผ์„ฑ, ๊ทธ ์–ด๋Š ๋•Œ๋ณด๋‹ค๋„ ๋†’์•„์กŒ์Šต๋‹ˆ๋‹ค.

์ง€๊ธˆ, ์ด ์‹œ๋Œ€, AI ๊ฐœ๋ฐœ์ž, AI ์ œํ’ˆ ๊ฐœ๋ฐœ์ž, AI ์‚ฌ์—…๊ฐ€, ๋ญ๋ผ๊ณ  ๋ถˆ๋Ÿฌ๋„ ์ข‹์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ์‚ฌ๋žŒ์ด ๋˜๊ธฐ ์ •๋ง ์ข‹์€ ์‹œ๊ธฐ๊ณ , ๋‹น๋ถ„๊ฐ„์€ ๊ทธ ๊ธธ์˜ ์—ด๋งค๋„ ์•„์ฃผ ๋‹ฌ์ฝคํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ์Šค์Šค๋กœ์˜ ๊ธฐ์ˆ ์„ ๊ฐˆ๊ณ ๋‹ฆ๋Š”๋‹ค๋ฉด, AI๋„ ๊ฐ€๋งŒํžˆ ์žˆ์ง€๋Š” ์•Š์ฃ . ๋”์šฑ ์‹ค์šฉ์ ์œผ๋กœ, ๋” ๊ณ ๋„๋กœ ๋ณ€ํ™”ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ตœ๊ทผ์˜ ๋ฐœ์ „ ์ƒํ™ฉ ์ค‘์— ์ผ๋ถ€๋งŒ ๋ณผ๊นŒ์š”?

์ผ๋ณธ์˜ AI ์Šคํƒ€ํŠธ์—…, ์‚ฌ์นด๋‚˜ AI์˜ โ€˜AI CUDA Engineerโ€™๋ฅผ ์˜ˆ๋กœ ๋“ค์–ด ๋ณผ๊ป˜์š”. ์ด๊ฑด โ€˜AI ์ž์ฒด๋ฅผ ์ตœ์ ํ™”โ€™ํ•˜๋Š” AI๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

High-Level Overview of The AI CUDA Engineer Agentic Framework. Image Credit: ์‚ฌ์นด๋‚˜ AI

โ€˜์ง„ํ™”๋ก ์  ์ตœ์ ํ™” (Evolutionary Optimization) ์•Œ๊ณ ๋ฆฌ์ฆ˜โ€™์„ ์ด์šฉํ•ด์„œ, ํŒŒ์ดํ† ์น˜ ์ฝ”๋“œ๋ฅผ โ€˜์ดˆ-์ตœ์ ํ™”๋œ CUDA ์ปค๋„โ€™๋กœ ๋ณ€ํ™˜, GPU ์—ฐ์‚ฐ ์†๋„๋ฅผ 10๋ฐฐ์—์„œ 100๋ฐฐ๊นŒ์ง€ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์ž์œจํ˜• ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค.

์ด๋Ÿฐ ๊ฒƒ ๋ง๊ณ , ๋‚ด ์ผ์ƒ์ƒํ™œ์— ๋„์›€๋˜๋Š”, ์˜ˆ๋ฅผ ๋“ค์–ด AI๊ฐ€ ๋นจ๋ž˜๋ฅผ ๊ฐœ์ฃผ๋Š” ๊ฑธ ์›ํ•˜์‹ ๋‹ค๋ฉด? ๋กœ๋ด‡ ํšŒ์‚ฌ ๋‘ ๊ตฐ๋ฐ - Figure์™€ 1X Technologies - ์—์„œ ํฅ๋ฏธ๋กœ์šด ๋กœ๋ด‡ ๋ฐ๋ชจ๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

๋จผ์ €, Figure๋Š” ์ง€๊ฐ, ์–ธ์–ด ์ดํ•ด, ๋Šฅ์ˆ™ํ•œ ์ œ์–ด ๊ธฐ๋Šฅ์„ ํ†ตํ•ฉํ•˜๋Š” ๋ฒ”์šฉ VLA (Vision-Language-Action) ๋ชจ๋ธ โ€˜Helixโ€™๋ฅผ ์†Œ๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

Figure๊ฐ€ ๊ฐœ๋ฐœํ•œ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์—์„œ ์ž‘๋™ํ•˜๋Š” Helix๋Š”, ๋กœ๋ด‡์—๊ฒŒ ์‹ค์ œ ์„ธ๊ณ„์—์„œ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” โ€˜์ง€๋Šฅโ€™์„ ๊ฐ€์ ธ๋‹ค ์ค๋‹ˆ๋‹ค - ์ด์ „์— ๋ณธ ์  ์—†๋Š” ๋ฌผ๊ฑด์„ ์ง‘์–ด ์˜ฌ๋ฆฌ๊ณ , ๋‹ค๋ฅธ ๋กœ๋ด‡๊ณผ ํ˜‘๋ ฅํ•˜๊ณ , ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ์—†์ด๋„ ์ž์—ฐ์–ด๋กœ ๋œ ๋ช…๋ น์— ์‘๋‹ตํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

1X ํ…Œํฌ๋†€๋กœ์ง€์Šค๋Š” ์ž์‚ฌ์˜ ๋กœ๋ด‡, โ€˜NEO Gammaโ€™๋ฅผ ์‹œ์—ฐํ–ˆ์Šต๋‹ˆ๋‹ค. ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ฑธ์Œ๊ฑธ์ด๋กœ ๊ฑท๊ณ , ๋ฌผ๊ฑด์„ ์ง‘์–ด ์˜ฌ๋ฆฌ๊ณ , ์˜์ž์— ์•‰๊ธฐ๋„ ํ•˜๊ณ , ์ž์ฒด ๊ฐœ๋ฐœํ•œ ์–ธ์–ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด์„œ ๋Œ€ํ™”ํ˜• ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ดํ•ดํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์•ˆ์ „์„ ์œ„ํ•œ ๋ถ€๋“œ๋Ÿฌ์šด ์ปค๋ฒ„, ๊ทธ๋ฆฌ๊ณ  ๊ฐ์ •์„ ํ‘œํ˜„ํ•˜๋Š” ๊ท€์˜ ๋ง ๋ชจ์–‘๊นŒ์ง€ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณด๋‹ค๋ณด๋‹ˆ, ๋กœ๋ด‡์ด ์šฐ๋ฆฌ ์ƒํ™œ์— ๊นŠ์ˆ™์ด ๋“ค์–ด์˜จ๋‹ค๋ฉด, ์•ฝ๊ฐ„์˜ ๊ฐœ์„ฑ์„ ๊ฐ–์ถ”๋Š” ๊ฒƒ๋„ ์ข‹์ง€ ์‹ถ๋„ค์š”.

๋ชจ๋“  ์‚ฐ์—… ๋ถ„์•ผ, ๋ชจ๋“  ์˜์—ญ์—์„œ ์ง„์งœ ์ œ๋Œ€๋กœ ๋œ AI ์ธ์žฌ๋ฅผ ๋‚š์•„์ฑ„์„œ ๊ฐ™์ด ์ผํ•˜๊ธฐ๋ฅผ ์›ํ•˜๋Š” ์ˆ˜๋งŽ์€ ํšŒ์‚ฌ๋“ค. AI ์Šค์Šค๋กœ๋ฅผ ์ตœ์ ํ™”ํ•˜๋Š” AI. ์šฐ๋ฆฌ ์ง‘์— ๊ณง ๋“ค์–ด์˜ฌ ๊ฒƒ๋งŒ ๊ฐ™์€ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡.

2025๋…„ ์‹œ์ž‘๋œ ์ง€ ์–ผ๋งˆ ๋˜์ง€ ์•Š์•˜์ง€๋งŒ, ์ด๋ฏธ ์ •์‹ ์ด ์—†์„ ์ •๋„๋กœ, AI์˜ ๋ฐœ์ „์ƒ๊ณผ ํ™œ์•ฝ์œผ๋กœ ๊ฐ€๋“ ์ฐจ ๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. โ€˜ํŠน์ด์ โ€™์ด ๊ณง ์˜จ๋‹ค๋Š” ์‹์˜ ์ด์•ผ๊ธฐ๋ฅผ ํ•  ์ƒ๊ฐ์€ ์—†๋‹ค๋Š” ๊ฑธ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋…์ž ๋ถ„๋“ค์ด์‹œ๋ผ๋ฉด ์ด๋ฏธ ์•„์‹œ๊ฒ ์ง€๋งŒ, โ€˜์ˆ˜ํ™• ๊ฐ€์†์˜ ๋ฒ•์น™โ€™์„ ๋”ฐ๋ผ ์ ์  ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ์ด ๋“ฑ์žฅํ•˜๋Š” ์†๋„๊ฐ€ ๋นจ๋ผ์ง€๋Š” ์ง€๊ธˆ, โ€˜๋ณ€ํ•˜์ง€ ์•Š๋Š” ๊ฒƒโ€™, โ€˜์ง€์ผœ์•ผ ํ•  ๊ฒƒโ€™, โ€˜์žŠ์ง€ ๋ง์•„์•ผ ํ•  ๊ฒƒโ€™์€ ์–ด๋–ค ๊ฒƒ๋“ค์ผ๊นŒ์š”?

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

AI ์—์ด์ „ํŠธ, ์˜ฌํ•ด ๊ฐ€์žฅ ํ•ซํ•œ AI ์˜์—ญ์˜ ์ค‘์š” ํ† ํ”ฝ ์ค‘์— ํ•˜๋‚˜๋ผ๊ณ  ํ•ด๋„ ๊ณผ์–ธ์ด ์•„๋‹ˆ์ฃ ? ์—ฌ๋Ÿฌ๋ถ„๋“ค๋„ ์—์ด์ „ํŠธ์— ๋งŽ์€ ๊ด€์‹ฌ์„ ๊ฐ€์ง€๊ณ  ๊ณ„์‹ค ๊ฑฐ๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

์˜ค๋Š˜์€ ์ด โ€˜์—์ด์ „ํŠธโ€™์˜ ์ด๋ก ์ ์ธ, ๊ทธ๋ฆฌ๊ณ  ์‹ค์šฉ์ ์ธ ์ธก๋ฉด์— ๋Œ€ํ•ด์„œ ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•˜๋„๋ก ๋„์™€์ฃผ๋Š” 8๊ฐ€์ง€ ์ž๋ฃŒ๋“ค์„ ๋ชจ์•„ ๋ดค์Šต๋‹ˆ๋‹ค:

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ์˜ ์–‘์ž ๋„๋ฐ•, ์‹œ์žฅ์„ ๋’คํ”๋“ค๋‹ค

๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ์˜ ๋งˆ์š”๋ผ๋‚˜ (Majorana) 1 ์–‘์ž ์ปดํ“จํŒ… ์นฉ์ด ์›”์ŠคํŠธ๋ฆฌํŠธ๋ฅผ ๋“ค์ฉ์ด๋ฉด์„œ, ์–‘์ž ์ปดํ“จํŒ… ๊ธฐ์—…์ธ IonQ, Rigetti, D-Wave์˜ ์ฃผ๊ฐ€๊นŒ์ง€๋„ ๋Œ์–ด์˜ฌ๋ ธ์Šต๋‹ˆ๋‹ค. ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ๊ฐ€ ์ž์‚ฌ๊ฐ€ ๋งŒ๋“  ์นฉ์ด ์˜ค๋ฅ˜ ๋ฐœ์ƒ๋ฅ ์ด ๋‚ฎ๊ณ  ์‹ค์ œ ์‘์šฉ๊นŒ์ง€ ์ด์–ด์งˆ ๊ฐ€๋Šฅ์„ฑ์ด ๋” ๋†’๋‹ค๊ณ  ์ฃผ์žฅํ•˜๋ฉด์„œ, ์–‘์ž ์ปดํ“จํŒ…์˜ ์ƒ์šฉํ™” ์‹œ์ ์— ๋Œ€ํ•œ ๋…ผ์Ÿ์ด ํ›จ์”ฌ ๋” ํฅ๋ฏธ์ง„์ง„ํ•ด์กŒ๋‹ค๊ณ ๋‚˜ ํ• ๊นŒ์š”? ์—”๋น„๋””์•„์˜ ์  ์Šจ ํ™ฉ์€ CES ์ดํ›„ ์–‘์ž ์ปดํ“จํŒ…์˜ ๋‹จ๊ธฐ์ ์ธ ์˜ํ–ฅ๋ ฅ์„ ๋‚ฎ๊ฒŒ ํ‰๊ฐ€ํ–ˆ์ง€๋งŒ, ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ, ์•ŒํŒŒ๋ฒณ, ๊ทธ๋ฆฌ๊ณ  IBM์˜ ์ƒ๊ฐ์€ ์ข€ ๋‹ค๋ฅธ ๊ฒƒ ๊ฐ™๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ๋ˆ„๊ฐ€ ์˜ณ์•˜๋‹ค๊ณ  ์‹œ์žฅ์€ ํŒ๋‹จํ• ๊นŒ์š”? ๋‹ค๋ฅธ ์ƒ๊ฐ์„ ๊ฐ€์ง„ ๋“ฏํ•ฉ๋‹ˆ๋‹ค. ๋ˆ„๊ฐ€ ์˜ณ์€ ๊ฑธ๊นŒ์š”? ์‹œ์žฅ์ด ์ง€์ผœ๋ณด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ง€๊ธˆ ๋Œ์•„๋‹ค๋‹ˆ๋Š” ๋ฏธ์Šคํ…Œ๋ฆฌ ๋ชจ๋ธ, GPT-4.5์ธ๊ฐ€?

Reddit์—์„œ, ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ์ง€๊ธˆ ๋Œ์•„๋‹ค๋‹ˆ๋Š” Mystery Model์ด ๊ธˆ์ฃผ์— ๊ณต๊ฐœ๋  GPT-4.5๊ฐ€ ์•„๋‹ˆ๋ƒ๋Š” ์˜ˆ์ƒ๋“ค์„ ํ•˜๊ณ  ์žˆ๋„ค์š”. ์ด Mystery Model์ด ์ƒ์„ฑํ•œ ์ด๋ฏธ์ง€ ํฌ์ŠคํŒ…์ด ์˜คํ”ˆAI ์ง์›๋“ค์ด โ€˜์ข‹์•„์š”โ€™๋ฅผ ๋งŽ์ด ๋ˆ„๋ฅด๊ณ  ์žˆ๋‹ค๊ณ ๋„ ํ•˜๊ตฌ์š” ^.^; ์ƒ์„ฑ๋œ ๊ทธ๋ฆผ์˜ ํ’ˆ์งˆ์„ ๋ณด๋ฉด, Claude 3.7 Sonnet๋„ ๋‚˜์˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค๋งŒ ๋น„๊ต ์ž์ฒด๊ฐ€ ์ข€ ์–ด๋ ค์›Œ ๋ณด์ด๊ธฐ๋„ ํ•˜๋„ค์š”. Claude 3.7๋„ ๋‚˜์˜จ์ง€ ๋ฉฐ์น  ๋˜์ง€ ์•Š์•˜๋Š”๋ฐโ€ฆ

์–ด์จŒ๋“  ๊ทธ ์ง„์œ„๋Š” ์•„๋งˆ๋„ ๊ธˆ์ฃผ ๋‚ด์— ํ™•์ธํ•˜๊ฒŒ ๋˜์ง€ ์•Š์„๊นŒ ํ•ฉ๋‹ˆ๋‹ค.

Mystery Model๊ณผ Claude 3.7 Sonnet์ด ์ƒ์„ฑํ•œ XBox ์ปจํŠธ๋กค๋Ÿฌ ์ด๋ฏธ์ง€. Image Credit: Reddit

์•ค์“ฐ๋กœํ”ฝ, โ€˜ํ•˜์ด๋ธŒ๋ฆฌ๋“œ AIโ€™ Claude 3.7 Sonnet ๊ณต๊ฐœ

์•คํŠธ๋กœํ”ฝ์—์„œ ์‹ฌ์ธต์ ์ธ ์ถ”๋ก ๊ณผ ์‹ค์‹œ๊ฐ„์˜ ์‘๋‹ต์„ ํ•จ๊ป˜ ํ•˜๋„๋ก ํ†ตํ•ฉํ•œ Claude 3.7 Sonnet์„ ๊ณต์‹์ ์œผ๋กœ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜๋‚˜์˜ ์ธํ„ฐํŽ˜์ด์Šค๋กœ ๋‹ค์–‘ํ•œ ๋ชจ๋“œ์˜ ์‚ฌ๊ณ ๋ฅผ ํ•˜๋„๋ก ๋ช…๋ นํ•  ์ˆ˜ ์žˆ๋Š” ์…ˆ์ธ๋ฐ์š”.

์ผ๋‹จ Claude 3.7 Sonnet์˜ ์ถ”๋ก  ๊ธฐ๋Šฅ์€ ์œ ๋ฃŒ ์‚ฌ์šฉ์ž์—๊ฒŒ๋งŒ ์ œ๊ณต๋˜์ง€๋งŒ, ์ „์ฒด์ ์ธ ์„ฑ๋Šฅ๋„ ๊ธฐ์กด์˜ 3.5 ๋ฒ„์ „๋ณด๋‹ค ๊ฐœ์„ ๋˜์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํŠนํžˆ ์ด ๋ชจ๋ธ์€ โ€˜SWE Bench (์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ๋ฒค์น˜๋งˆํฌ)โ€™์—์„œ ์˜คํ”ˆAI์˜ โ€˜o3-miniโ€™๋ณด๋‹ค ๋†’์€ 62.3% ์ •ํ™•๋„๋ฅผ ๊ธฐ๋กํ•˜๋ฉด์„œ, ๋ณต์žกํ•œ ์ฝ”๋“œ๋ฒ ์ด์Šค๋ฅผ ์ž˜ ๋‹ค๋ฃฌ๋‹ค๋Š” ํ‰๊ฐ€๋ฅผ ๋ฐ›๊ณ  ์žˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

Image Credit: ์•ค์“ฐ๋กœํ”ฝ

๊ธ€์Ž„์š”, ๊ธˆ์ฃผ์— GPT-4.5๊ฐ€ ๊ณต๊ฐœ๋  ๊ฒƒ ๊ฐ™๊ณ , GPT-5๊ฐ€ ๋‚˜์˜ค๋ฉด ๋˜ ์ˆœ์œ„๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ฐ”๋€”์ง€ ๋ชจ๋ฅด๊ฒ ์ง€๋งŒ, Claude๋Š” โ€˜์ฝ”๋”ฉโ€™ ์˜์—ญ์— ์žˆ์–ด์„œ ๋†’์€ ํ’ˆ์งˆ๋กœ ์ธ์ •๋ฐ›๊ณ  ์žˆ๋Š” ๋ชจ๋ธ์ด ๋˜์–ด๊ฐ€๊ณ  ์žˆ๋Š” ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค.

์˜คํ”ˆAI์˜ o1-preview์™€ DeepSeek-R1, ์ฒด์Šค๋ฅผ ๋‘๋‹ค๊ฐ€ ์†์ž„์ˆ˜๋ฅผ ์“ฐ๋‹ค

์ตœ๊ทผ์— ์ƒˆ๋กœ ๋‚˜์˜จ ์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด, ์ถ”๋ก  ๋ชจ๋ธ๋“ค์€ ๋‹จ์ˆœํžˆ ๊ทœ์น™์„ ๋”ฐ๋ฅด๊ธฐ๋งŒ ํ•˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ ๊ทœ์น™์„ ๋‹ค์‹œ ์“ฐ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์˜คํ”ˆAI์˜ o1-preview๋‚˜ DeepSeek-R1 ๊ฐ™์€ ๋ชจ๋ธ๋“ค์ด ๊ทœ์น™๋Œ€๋กœ ๊ณต์ •ํ•˜๊ฒŒ ํ”Œ๋ ˆ์ด๋ฅผ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ๋Œ€์‹  ์ฒด์Šค ๊ฒŒ์ž„ ๊ฐ™์€ ๊ฑธ ํ•  ๋•Œ ๊ฒŒ์ž„ ํ™˜๊ฒฝ ์ž์ฒด๋ฅผ ํ•ดํ‚นํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋งŽ์ด ํ๋ฅด๊ฒŒ ๋œ๋‹ค๋Š” ๊ฑธ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. GPT-4o๋‚˜ Claude 3.5 sonnet ๊ฐ™์ด ๋” โ€˜์ „ํ†ต์ ์ธโ€™ ๋ชจ๋ธ๋“ค๋„, ๊ทœ์น™์„ ์–ด๊ธฐ๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ž๊ทน์„ ์ฃผ๊ณ  ํ‘ธ์‰ฌ๋ฅผ ํ•ด์•ผ ํ–ˆ์ง€๋งŒ, ๊ฒฐ๊ตญ์—๋Š” ๊ฐ™์€ ๋ชจ์Šต์„ ๋ณด์˜€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ƒˆ๋กœ์šด ์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด AI ์ถ”๋ก  ๋ชจ๋ธ๋“ค์€ ๊ทœ์น™์„ ๋‹จ์ˆœํžˆ ๋”ฐ๋ฅด๊ธฐ๋งŒ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๊ทœ์น™์„ ๋‹ค์‹œ ์”๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ OpenAI์˜ o1-preview์™€ DeepSeek-R1๊ณผ ๊ฐ™์€ ๋ชจ๋ธ๋“ค์ด ๊ณต์ •ํ•œ ํ”Œ๋ ˆ์ด ๋Œ€์‹  ์ฒด์Šค ๊ฒŒ์ž„ ํ™˜๊ฒฝ์„ ํ•ดํ‚นํ•˜๋Š” ๊ฒƒ์— ์ž์ฃผ ์˜์กดํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. GPT-4o์™€ Claude 3.5 Sonnet๊ณผ ๊ฐ™์€ ๋ณด๋‹ค ์ „ํ†ต์ ์ธ LLM๋“ค์€ ๊ทœ์น™์„ ์–ด๊ธฐ๋„๋ก ์•ฝ๊ฐ„์˜ ์ž๊ทน์ด ํ•„์š”ํ–ˆ์ง€๋งŒ, ๊ฒฐ๊ตญ์—๋Š” ๊ฐ™์€ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

์ดˆ์ง€๋Šฅ ์—์ด์ „ํŠธ, ํŒŒ๋ฉธ์ ์ธ ์œ„ํ—˜์„ ์ดˆ๋ž˜ํ•  ์ˆ˜๋„ - โ€˜Scientist AIโ€™๋ผ๋ฉด ๋‹ค๋ฅผ๊นŒ?

MILA-Quebec AI ์—ฐ๊ตฌ์†Œ, ๋ชฌํŠธ๋ฆฌ์˜ฌ ๋Œ€ํ•™๊ต, ์บ˜๋ฆฌํฌ๋‹ˆ์•„ ๋ฒ„ํด๋ฆฌ ๋Œ€ํ•™๊ต์˜ ์—ฐ๊ตฌ์ž๋“ค์€, ์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ ๊ฒƒ์ฒ˜๋Ÿผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์†์ž„์ˆ˜๊นŒ์ง€ ์“ฐ๋Š” AI๊ฐ€ ์ดˆ์ง€๋Šฅ์ ์ธ ์—์ด์ „ํŠธ๊ฐ€ ๋˜์–ด์„œ ์ž‘๋™ํ•  ๋•Œ ์•ผ๊ธฐํ•  ์ˆ˜ ์žˆ๋Š” ์—„์ฒญ๋‚œ ์œ„ํ—˜ ์š”์†Œ์— ๋Œ€ํ•ด์„œ ๊นŠ์ด ์šฐ๋ คํ•˜๊ณ  ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์— ๋Œ€์‘ํ•ด์„œ, โ€˜๋ชฉํ‘œ๋ฅผ ๋ฌด์ง€์„ฑ์ ์œผ๋กœ ์ซ“๊ธฐโ€™๋ณด๋‹ค๋Š”, โ€˜์ดํ•ดโ€™๋ฅผ ๊ทธ ์ฃผ ๋ชฉ์ ์œผ๋กœ ํ•˜๋Š”, Non-Agentic AI๋กœ์„œ โ€˜Scientist AIโ€™๋ผ๋Š” ๊ฐœ๋…์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ๋งŒ, ์ž๊ธฐ ๋ณด์กด, ๊ถŒ๋ ฅ ์ถ”๊ตฌ ๋“ฑ์˜ ์œ„ํ—˜์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค๊ณ  ๋ณด์ด๋Š” Agentic AI์™€๋Š” ๋‹ค๋ฅด๊ฒŒ, Scientist AI๋Š” โ€˜์ธ๊ณผ ๋ชจ๋ธ (Causal Model)โ€™์„ ๊ตฌ์ถ•ํ•˜๊ณ  โ€˜๋ถˆํ™•์‹ค์„ฑ์„ ๊ณ ๋ คํ•ด ๊ฐ€๋ฉด์„œ ์งˆ๋ฌธ์— ๋‹ต๋ณ€โ€™์„ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, AI ์‹œ์Šคํ…œ์˜ ์œ„ํ—˜ ์š”์†Œ์— ๋Œ€ํ•ด ์ผ์ • ์ •๋„์˜ ์•ˆ์ „ ์žฅ์น˜๊ฐ€ ๋งˆ๋ จ๋˜๊ณ , ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ํ•˜๋„๋ก ์ง€์›ํ•˜๋ฉด์„œ, ์šฐ๋ คํ•˜๋Š” ์‹ค์กด์ ์ธ ์œ„ํ˜‘์ด ์—†์ด AI ์•ˆ์ „์„ฑ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๋„ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ โ€˜๋ฒ ์ด์ง€์•ˆโ€™์˜ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์‹œ์Šคํ…œ์€ AI์— ๋Œ€ํ•œ ์ง€๋‚˜์นœ ๊ณผ์‹ ์„ ํ•˜์ง€ ์•Š๋„๋ก ํ•ด ์ค๋‹ˆ๋‹ค.

๊ตฌ๊ธ€ ๋ฆฌ์„œ์น˜, AI Co-Scientist ๋ฐœํ‘œ

์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ โ€˜Scientist AIโ€™์™€๋Š” ๋‹ค๋ฅธ ๊ฑด๋ฐ์š”. ๊ตฌ๊ธ€ ๋ฆฌ์„œ์น˜๊ฐ€ โ€˜๊ณผํ•™์ ์ธ ๋ฐœ๊ฒฌ (Scientific Discovery)โ€™์„ ๊ฐ€์†ํ™”ํ•˜๋„๋ก ๋„์™€์ค„, Gemini 2.0์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•ํ•œ ๋ฉ€ํ‹ฐ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ, โ€˜AI Co-Scientistโ€™๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ฐ€์„ค์„ ๋งŒ๋“ค๊ณ , ์—ฐ๊ตฌ ์ œ์•ˆ์„œ๋ฅผ ๊ฐœ์„ ํ•˜๊ณ , ๋ฐ”์ด์˜ค ๋ฉ”๋””์ปฌ ์˜์—ญ์˜ ํ˜์‹ ์„ ์ง€์›ํ•œ๋‹ค๋Š” ๋ชฉํ‘œ๋กœ ์„ค๊ณ„๋˜์—ˆ๊ณ , ์ด๋ฏธ ๋ฐฑํ˜ˆ๋ณ‘์ด๋ผ๋“ ๊ฐ€ ํ•ญ๊ท  ์ €ํ•ญ์„ฑ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์•ฝ๋ฌผ Repurposing์— ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ „๋ฌธ๊ฐ€๋ฅผ ์ด ๊ณผ์ •์— ์ฐธ์—ฌ์‹œํ‚ค๋Š” ์ ‘๊ทผ ๋ฐฉ์‹, ๊ทธ๋ฆฌ๊ณ  ์‹ค์ œ ์—ฐ๊ตฌ ํ™˜๊ฒฝ์—์„œ ๋„์›€์ด ๋˜๋Š”์ง€ ํ™•์ธํ•˜๋Š” โ€˜Trusted Testerโ€™ ํ”„๋กœ๊ทธ๋žจ์„ ์šด์˜ํ•˜๋ฉด์„œ, ๋‹จ์ˆœํ•œ ๋„๊ตฌ๊ฐ€ ์•„๋‹ˆ๋ผ ์ง„์งœ ํ˜‘๋ ฅ์ž๋กœ์„œ AI Co-Scientist๊ฐ€ ๋ฐœ์ „ํ•˜๋Š”๊ฒŒ ๋ชฉํ‘œ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๊ณต๋™ ๊ณผํ•™์ž๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์„ค ์ƒ์„ฑ, ์—ฐ๊ตฌ ์ œ์•ˆ์„œ ๊ฐœ์„ , ์ƒ์˜ํ•™์  ํ˜์‹  ์ง€์›์„ ์œ„ํ•ด ์„ค๊ณ„๋˜์—ˆ์œผ๋ฉฐ, ์ด๋ฏธ ๋ฐฑํ˜ˆ๋ณ‘ ๋ฐ ํ•ญ๊ท  ์ €ํ•ญ์„ฑ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ์•ฝ๋ฌผ ์žฌ์ฐฝ์ถœ์— ๊ธฐ์—ฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „๋ฌธ๊ฐ€ ์ฐธ์—ฌ ์ ‘๊ทผ ๋ฐฉ์‹๊ณผ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ํ…Œ์Šคํ„ฐ ์•ก์„ธ์Šค๋ฅผ ํ†ตํ•ด ๊ตฌ๊ธ€์˜ AI๋Š” ๋‹จ์ˆœํ•œ ๋„๊ตฌ๊ฐ€ ์•„๋‹Œ ์ง„์ •ํ•œ ํ˜‘๋ ฅ์ž๊ฐ€ ๋˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

Thinking Machines Lab: ์ƒˆ๋กœ์šด AI ํŒŒ์›Œํ•˜์šฐ์Šค๋กœ ๋– ์˜ค๋ฅผ๊นŒ

์˜คํ”ˆAI์™€ ๋ฉ”ํƒ€, ์บ๋ฆญํ„ฐ AI, ๋”ฅ๋งˆ์ธ๋“œ ๋“ฑ์—์„œ ์ผํ–ˆ๋˜ ์—ฐ๊ตฌ์ž๋“ค์ด ๋งž์ถคํ™”ํ•  ์ˆ˜ ์žˆ๋Š” AI, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‹œ์Šคํ…œ, ๊ทธ๋ฆฌ๊ณ  ํˆฌ๋ช…์„ฑ๊ณผ ์•ˆ์ „์„ฑ์— ์ดˆ์ ์„ ๋งž์ถฐ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ณ ์ž Thinking Machines Lab์ด๋ผ๋Š” ์ƒˆ๋กœ์šด ํšŒ์‚ฌ๋ฅผ ์„ค๋ฆฝํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜คํ”ˆAI์˜ CTO์˜€๋˜ ๋ฏธ๋ผ ๋ฌด๋ผํ‹ฐ, ๊ทธ๋ฆฌ๊ณ  ์กด ์Š๋จผ์ด ์ด๋„๋Š” ํšŒ์‚ฌ์ธ๋ฐ์š”. ์•„์ง ์ •ํ™•ํ•˜๊ฒŒ ๋ญ˜ ํ• ์ง€๋Š” ๋ช…ํ™•ํ•˜์ง€ ์•Š์€๋ฐ๋„, ํˆฌ์ž์ž๋“ค์˜ ๊ด€์‹ฌ์€ ๋ชฐ๋ ค๋“œ๋Š” ๊ฒƒ ๊ฐ™๋„ค์š”.

์•Œ๋ฆฌ๋ฐ”๋ฐ”, ๋น„๋””์˜ค ์ƒ์„ฑ AI ๋ชจ๋ธ โ€˜WAN 2.1โ€™ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœ

์•Œ๋ฆฌ๋ฐ”๋ฐ”๊ฐ€ Text-to-Video / Image-to-Video ๋ชจ๋ธ์ธ WAN 2.1์„ ์˜คํ”ˆ์†Œ์Šค ๋ฒ„์ „์œผ๋กœ 26์ผ์— ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ๊นƒํ—ˆ๋ธŒ, ํ—ˆ๊น…ํŽ˜์ด์Šค ๋“ฑ์—์„œ ๋‹ค์šด๋กœ๋“œํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ผ๋ฐ˜์ ์ธ ๊ณ ํ™”์งˆ ์˜์ƒ์„ ์ž˜ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•  ๋ฟ ์•„๋‹ˆ๋ผ, ์‚ฌ๋žŒ์˜ ์ด๋ฏธ์ง€๋ฅผ ์˜์ƒ์œผ๋กœ ๋งŒ๋“ค๊ฑฐ๋‚˜ ํšŒ์ „, ์ ํ”„, ๊ตฌ๋ฅด๊ธฐ ๋“ฑ ์ธ๋ฌผ์ด๋‚˜ ์บ๋ฆญํ„ฐ์˜ ๋‹ค์–‘ํ•˜๊ณ  ๋ณต์žกํ•œ ์›€์ง์ž„์„ ์•ˆ์ •์ ์œผ๋กœ ์ž˜ ํ‘œํ˜„ํ•œ๋‹ค๋Š” ํ‰๊ฐ€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๋น„๋””์˜ค ์ƒ์„ฑ AI ํ‰๊ฐ€๋ฅผ ํ•˜๋Š” Vbench์—์„œ ์ด์  86.22%๋กœ, ์˜คํ”ˆAI์˜ ์†Œ๋ผ (84.28%)๋‚˜ ๋ฃจ๋งˆ (83.61%) ๋“ฑ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค์„ ๊ทผ์†Œํ•œ ์ฐจ์ด๋กœ ์•ž์„œ๋ฉด์„œ 1์œ„์— ์˜ฌ๋ž์Šต๋‹ˆ๋‹ค.

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ํŒ€์ด ์ฝ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค

AI Engineer Summit์€ AI ์—”์ง€๋‹ˆ์–ด๋ง ๋ถ„์•ผ์˜ ์ตœ์‹  ๊ธฐ์ˆ ๊ณผ ํŠธ๋ Œ๋“œ๋ฅผ ๊ณต์œ ํ•˜๊ณ  ๋…ผ์˜ํ•˜๋Š” ํ–‰์‚ฌ์ฃ . ๋‰ด์š•์—์„œ ์—ด๋ฆฌ๊ณ  ์žˆ๋Š” AI Engineer Summit 2025์˜ ๋‘ ๋ฒˆ์งธ ๋‚ , โ€˜Agent Engineeringโ€™์— ๋Œ€ํ•ด ์ฃผ๋กœ ๋‹ค๋ฃจ๋Š”, 8์‹œ๊ฐ„ 30๋ถ„์— ๋‹ฌํ•˜๋Š” ๋™์˜์ƒ์ž…๋‹ˆ๋‹ค. Timestamp ์ƒ์˜ ์ œ๋ชฉ๋งŒ ๋ด๋„ ํฅ๋ฏธ๋กœ์šด ๋ฐœํ‘œ ๋‚ด์šฉ์ด ๋งŽ์•„ ๋ณด์ด๋„ค์š”.

๊ณ ์„ฑ๋Šฅ์˜ LLM์„ ์–ด๋–ป๊ฒŒ ๊ตฌํ˜„ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ด๊ณ  ์ข…ํ•ฉ์ ์ธ ์ดํ•ด๋ฅผ ํ•  ์ˆ˜ ์žˆ๋„๋ก, ๋‹ค์–‘ํ•œ ๊ธฐ๋ฒ•์˜ ์ด๋ก ๊ณผ ๊ฐœ๋…, ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์˜ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋ฒ•, ๋ณ‘๋ ฌํ™” ๋“ฑ์˜ ๊ธฐ๋ฒ•์œผ๋กœ ๋ฉ”๋ชจ๋ฆฌ ์ œ์•ฝ์„ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ• ๋“ฑ์„ ๋‹ค๋ฃจ๋Š” ํ—ˆ๊น…ํŽ˜์ด์Šค์˜ ์ข…ํ•ฉ ์•ˆ๋‚ด์„œ์ž…๋‹ˆ๋‹ค. PDF๋กœ ๋‹ค์šด๋ฐ›์•„ ๋ณผ ์ˆ˜๋„ ์žˆ๋„ค์š”. ์•„๋ž˜ ๋น„์ฃผ์–ผ์€ ํ—ˆ๊น…ํŽ˜์ด์Šค์—์„œ ์ตœ๋Œ€ 512๊ฐœ์˜ GPU์—์„œ 4,000๋ฒˆ ์ด์ƒ์˜ Scaling ์‹คํ—˜์„ ์ง„ํ–‰ํ•˜๊ณ  Throughput (๋งˆ์ปค ํฌ๊ธฐ)๊ณผ GPU ์‚ฌ์šฉ๋ฅ (๋งˆ์ปค ์ƒ‰์ƒ)์„ ์ธก์ •ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์‹œ๊ฐํ™”ํ•œ ๊ฑฐ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ง€๋‚œ 2์›” 20์ผ, AI, ๊ธฐ์ˆ , ๊ณผํ•™ ๋ถ„์•ผ์—์„œ ๋„๋ฆฌ ์•Œ๋ ค์ง„ ํŒŸ์บ์Šคํ„ฐ Dwarkesh Patel์ด ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ์˜ CEO ์‚ฌํ‹ฐ์•„ ๋‚˜๋ธ๋ผ์™€ ์ธํ„ฐ๋ทฐ๋ฅผ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตญ๋‚ด์—๋„ ๊ทธ ๋‚ด์šฉ๋“ค ์ค‘ ์ผ๋ถ€๊ฐ€ ๋‹ค์–‘ํ•œ ๊ธฐ์‚ฌ๋กœ ์†Œ๊ฐœ๋˜์—ˆ๋Š”๋ฐ์š”. ๋“ค์–ด๋ณผ ๋งŒํ•œ ๋‚ด์šฉ์ด ๋งŽ์œผ๋‹ˆ, 1์‹œ๊ฐ„ 30๋ถ„ ์ •๋„ ๋˜์ง€๋งŒ ํ•œ ๋ฒˆ ์‹œ๊ฐ„๋‚ด์–ด ๋“ค์–ด๋ณด์‹œ๊ธฐ๋ฅผ ๊ถŒํ•ฉ๋‹ˆ๋‹ค.

์•„์ฃผ ๊ฐ„๋‹จํžˆ, ์ฃผ์š” ๋‚ด์šฉ์„ ๋ฝ‘์•„๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  1. AI์‹œ์žฅ, ๋‹จ์ˆœํ•œ ์Šน์ž ๋…์‹ ์‹œ์žฅ์ด ์•„๋‹ˆ๋‹ค
    AI ๋ถ„์•ผ์—๋Š” ์˜คํ”ˆ์†Œ์Šค์™€ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ์ด ๊ณต์กดํ•˜๊ณ , B2C ์‹œ์žฅ์—๋Š” ์Šน์ž ๋…์‹ ํ˜„์ƒ์ด ์žˆ์„ ์ˆ˜๋„ ์žˆ์ง€๋งŒ B2B ์‹œ์žฅ์—์„œ๋Š” ๊ทธ๋Ÿฐ ์ผ์ด ์ผ์–ด๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ๊ทนํžˆ ์ ๋‹ค - ๊ธฐ์—… ๊ณ ๊ฐ๋“ค์€ ๋‹จ์ผํ•œ ๊ณต๊ธ‰์ž๊ฐ€ ์‹œ์žฅ์„ ์žฅ์•…ํ•˜๋Š” ๊ฑธ ์›์น˜ ์•Š๋Š”๋‹ค.

  2. โ€˜AGIโ€™์˜ ์˜๋ฏธ, ์‹ค์ œ ์‚ฐ์—…๊ณผ ๊ฒฝ์ œ์— ์–ผ๋งˆ๋‚˜ ์˜ํ–ฅ์ด ์žˆ๋Š๋ƒ๊ฐ€ ์ค‘์š”
    AGI์— ๋„๋‹ฌํ–ˆ๋‹ค๊ณ  ์šฐ๋ฆฌ๊ฐ€ ์Šค์Šค๋กœ ์ฃผ์žฅํ•˜๋Š” ๊ฑด ์•„๋ฌด๋ž˜๋„ ํ„ฐ๋ฌด๋‹ˆ ์—†์ด ์•ž์„œ ๋‚˜๊ฐ€๋Š”, ์ผ์ข…์˜ โ€˜๋ฒค์น˜๋งˆํฌ ์กฐ์ž‘โ€™์— ๋ถˆ๊ณผํ•  ์ˆ˜ ์žˆ๋‹ค. ๋‹จ์ˆœํžˆ AI์˜ ์„ฑ๋Šฅ์ด ์–ด๋–ป๋‹ค๊ฐ€ ์•„๋‹ˆ๋ผ, ์‹ค์ œ ๊ฒฝ์ œ์— ์–ผ๋งˆ๋‚˜ ์˜ํ–ฅ์„ ๋ฏธ์น˜๋Š”์ง€๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ด์•ผ ํ•˜๊ณ , ์ง„์ •ํ•œ ๋ฒค์น˜๋งˆํฌ๋Š” ์•„๋งˆ โ€˜์„ธ๊ณ„ ๊ฒฝ์ œ๊ฐ€ 10% ์„ฑ์žฅํ•˜๋Š” ๊ฒƒโ€™์ผ ๊ฒƒ์ด๋‹ค.

  3. ์–‘์ž ์ปดํ“จํŒ…์˜ โ€˜ํŠธ๋žœ์ง€์Šคํ„ฐ ๋ชจ๋จผํŠธโ€™
    ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ์—์„œ๋Š” ์ตœ๊ทผ โ€˜Majorana Zeroโ€™ ์นฉ๊ณผ ๊ฐ™์€, ์–‘์ž ์ปดํ“จํŒ… ๋ถ„์•ผ์—์„œ ์ค‘์š”ํ•œ ์„ฑ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ์ด ๊ธฐ์ˆ ๋กœ, ํ–ฅํ›„ ์ˆ˜๋ฐฑ๋งŒ ํ๋น„ํŠธ ๊ทœ๋ชจ์˜ ์–‘์ž ์ปดํ“จํ„ฐ ๊ตฌ์ถ•์ด ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€ํ•˜๋Š”๋ฐ, ์•ฝ 4๋…„ ๋‚ด โ€˜์œ ํ‹ธ๋ฆฌํ‹ฐ ๊ทœ๋ชจ์˜ ์–‘์ž ์ปดํ“จํ„ฐ ๊ตฌ์ถ•โ€™์„ ํ•  ์ˆ˜ ์žˆ๋‹ค.

  4. Muse AI, ๊ฒŒ์ž„ ์‚ฐ์—…์— ๊ฑฐ๋Œ€ํ•œ ์˜ํ–ฅ์„ ๋ฏธ์น  ๊ฒƒ
    2์›” ๋ฐœํ‘œํ•œ, ๊ฒŒ์ž„ ์‚ฐ์—…์„ ํ˜์‹ ํ•  ์„ธ๊ณ„ ์ตœ์ดˆ์˜ ์ƒ์„ฑํ˜• AI ๋ชจ๋ธ Muse AI. ๊ฒŒ์ž„ ๊ฐœ๋ฐœ ๊ณผ์ •์„ ํ˜์‹ ํ•˜๊ณ  ๋” ๋ชฐ์ž…๊ฐ์žˆ๋Š” ๊ฒฝํ—˜์„ ์ œ๊ณตํ•˜๊ฒŒ ๋  ๊ฒƒ์ด๋‹ค.

  5. AI์˜ ๋ฒ•์  ์žฅ๋ฒฝ ๋ฐ ์•ˆ์ „์„ฑ ํ™•๋ณด์— ๋Œ€ํ•œ ์ค€๋น„ ํ•„์š”
    ๋ฒ•์ , ๊ทœ์ œ์  ์žฅ์• ๋ฌผ์ด ํ•ด๊ฒฐ๋˜๊ธฐ ์ „์—๋Š” ๊ฐ•๋ ฅํ•œ AI๊ฐ€ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ํ™œ์šฉ๋˜๊ธฐ ์–ด๋ ค์šธ ๊ฒƒ์ด๋ฏ€๋กœ, ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๊ณต์กฐ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋”๋ถˆ์–ด, AI๋ฅผ ์•ˆ์ „ํ•˜๊ฒŒ ๊ฐœ๋ฐœํ•˜๊ณ  ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ AGI ์•ˆ์ „์„ฑ์— ๋Œ€ํ•œ ์ฒ ์ €ํ•œ ๊ฒ€ํ† , ๋Œ€๋น„๊ฐ€ ํ•„์š”ํ•˜๋‹ค.

์ธ๊ตฌ์˜ ๊ฐ์†Œ์™€ AI, ๋กœ๋ด‡์˜ ๋ถ€์ƒ์œผ๋กœ ์ธํ•œ ๊ฒฝ์ œ ๋ณ€ํ™”, ์‚ฌํšŒ์ƒ ๋ณ€ํ™”๊ฐ€ ์–ด๋–ป๊ฒŒ ์ผ์–ด๋‚ ๊นŒ์— ๋Œ€ํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ธ๊ตฌ๊ฐ€ ๊ฐ์†Œํ•จ์— ๋”ฐ๋ผ์„œ AI์™€ ๋กœ๋ด‡์ด ๊ฒฝ์ œ์˜ ์ฃผ์š” ์ƒ์‚ฐ์ž ๋ฐ ์†Œ๋น„์ž๊ฐ€ ๋˜๊ณ , ์‚ฌ๋žŒ์€ ์ฐฝ์˜์ ์ธ ํ™œ๋™์— ์ง‘์ค‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋  ๊ฑฐ๋ผ๊ณ  ์ „๋งํ•˜๊ณ  ์žˆ๋Š”๋ฐ์š”. ์ฃผ๋กœ ์‚ฌ๋žŒ๊ณผ ๊ธฐ๊ณ„ ๊ฐ„์˜ ์ƒํ˜ธ ๋ณด์™„์ ์ธ ๊ด€๊ณ„๋ฅผ ๊ฐ•์กฐํ•˜๋Š” ๊ด€์ ์—์„œ ์ž‘์„ฑ๋œ ๊ธ€์ธ๋ฐ, ์ด๋Ÿฐ ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐˆ ์ˆ˜ ์žˆ๋‹ค๋ฉด ๋‚˜์˜์ง€ ์•Š์„ ๊ฒƒ ๊ฐ™์€๋ฐ, ์–ด๋–จ๊นŒ์š”?

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • Claude 3.7 Sonnet and Claude Code โ€“ ์•ค์“ฐ๋กœํ”ฝ์˜ ์ฒซ ๋ฒˆ์งธ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ถ”๋ก  ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋น ๋ฅด๊ฒŒ ์‘๋‹ต์„ ๋ฐ›์„ ๊ฑด์ง€, ์‹ฌ์ธต์ ์ธ ์‚ฌ๊ณ ๋ฅผ ๊ฑฐ์นœ ์‘๋‹ต์„ ๋ฐ›์„ ๊ฑด์ง€ ์‚ฌ์šฉ์ž๊ฐ€ ์„ ํƒํ•ด์„œ ์ „ํ™˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. SWE-bench Verified (70.3%) ๋ฐ TAU-bench์—์„œ SOTA ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ , ์ฝ”๋”ฉ ์ž‘์—…์— ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ์ด์ „ ๊ฐ€๊ฒฉ ๊ทธ๋Œ€๋กœ์ธ ์ž…๋ ฅ 100๋งŒ ํ† ํฐ๋‹น 3๋‹ฌ๋Ÿฌ, ์ถœ๋ ฅ 100๋งŒ ํ† ํฐ๋‹น 15๋‹ฌ๋Ÿฌ์ž…๋‹ˆ๋‹ค.

  • Microsoftโ€™s Muse โ€“ ๊ฒŒ์ž„ํ”Œ๋ ˆ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•ด์„œ ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ ๋””์ž์ธ ๊ด€์ ์—์„œ ์ฐฝ์˜์ ์ธ ์•„์ด๋””์–ด๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๊ธฐ ์œ„ํ•œ ๋Œ€์ฒด ๊ฒŒ์ž„ ์‹œํ€€์Šค๋ฅผ ์ƒ์„ฑํ•˜๋„๋ก ํ•œ, ์ƒ์„ฑํ˜• AI ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • SmolVLM2 โ€“ ๋‹ค์–‘ํ•œ ์‚ฌ์–‘์„ ๊ฐ€์ง„ ์žฅ์น˜์—์„œ ํšจ์œจ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋„๋ก ์ตœ์ ํ™”๋œ, ์ž‘์ง€๋งŒ ๊ฐ•๋ ฅํ•œ ๋น„๋””์˜ค-์–ธ์–ด ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์œผ๋กœ, ์‹ค์‹œ๊ฐ„ ๋น„๋””์˜ค ๋ถ„์„ ๋ฐ Semantic Search๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

  • InfiR โ€“ ์ถ”๋ก ์— ์ตœ์ ํ™”๋œ ์†Œํ˜• ์–ธ์–ด๋ชจ๋ธ๋กœ, ๋น„์Šทํ•œ ๊ทœ๋ชจ์˜ ๋ชจ๋ธ๋ณด๋‹ค ํ›จ์”ฌ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ์ œ๊ณตํ•˜๊ณ  ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค์—๋„ ํšจ์œจ์ ์œผ๋กœ ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • Multimodal Mamba โ€“ ๊ฐ•๋ ฅํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ์ถ”๋ก  ๋น„์šฉ์„ ์ค„์—ฌ์ฃผ๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • Magma โ€“ ๋””์ง€ํ„ธ ๋ฐ ๋กœ๋ณดํ‹ฑ์Šค ์˜์—ญ์— ์ ์šฉํ•˜๊ธฐ ์œ„ํ•œ, ๋น„์ „, ์–ธ์–ด ๋ฐ ํ–‰๋™ ๊ณ„ํš์„ ํ†ตํ•ฉํ•˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, ์ธ์ง€, ๋น„์ „-์–ธ์–ด๋ชจ๋ธ

LLM ์ตœ์ ํ™”, ๋ฉ”๋ชจ๋ฆฌ, ํšจ์œจ์„ฑ

๊ฐ•ํ™”ํ•™์Šต, ์ž๊ธฐ ๊ฐœ์„  (Self-Improvement) ๋ฐ ์˜์‚ฌ ๊ฒฐ์ •

  • ๐ŸŒŸ S2R: Teaching LLMs to Self-verify and Self-correct via RL โ€“ ์ž๊ธฐ ๊ฒ€์ฆ, ๊ทธ๋ฆฌ๊ณ  ์ž๊ธฐ ์ˆ˜์ • ์ž‘์—…์„ ํ•™์Šตํ•ด์„œ LLM ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ํ”„๋ ˆ์ž„์›์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Discovering Highly Efficient Low-Weight Quantum Error-Correcting Codes with RL โ€“ ๊ฐ•ํ™” ํ•™์Šต์„ ์‚ฌ์šฉํ•ด์„œ ์–‘์ž ์˜ค๋ฅ˜ (Quantum Error) ์ˆ˜์ • ์ฝ”๋“œ๋ฅผ ์ตœ์ ํ™”, ๋ฌผ๋ฆฌ์ ์ธ ํ๋น„ํŠธ ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ์ค„์—ฌ ์ค๋‹ˆ๋‹ค.

  • ๐ŸŒŸOctoTools: An Agentic Framework with Extensible Tools for Complex Reasoning โ€“ ๋‹ค๋‹จ๊ณ„ (Multi-step) ์˜์‚ฌ ๊ฒฐ์ • ๋ฐ ๊ตฌ์กฐํ™”๋œ ๋„๊ตฌ ์‚ฌ์šฉ์„ ์œ„ํ•œ ๋„๊ตฌ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Thinking Preference Optimization โ€“ ์ถ”๋ก  ๋‹จ๊ณ„์—์„œ ์„ ํ˜ธ๋„ ๊ธฐ๋ฐ˜ ์ตœ์ ํ™” ์ž‘์—…์„ ๊ฐœ์„ ํ•ด์„œ LLM ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๊ธฐ๋ฒ•์„ ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

LLM ์‹ ๋ขฐ์„ฑ, ์•ˆ์ „, Alignment

  • ๐ŸŒŸReLearn: Unlearning via Learning for Large Language Models โ€“ LLM์ด ๋ง์„ ์ˆ ์ˆ  ์ž˜ ํ•˜๋Š” ๋Šฅ๋ ฅ์€ ์œ ์ง€ํ•˜๋ฉด์„œ, ๋ฏผ๊ฐํ•œ ์ง€์‹์„ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸ On the Trustworthiness of Generative Foundation Models โ€“ ์ง€์นจ๊ณผ ํ‰๊ฐ€ ๊ธฐ์ค€, ๊ด€์  ๋“ฑ, ์ƒ์„ฑํ˜• AI ๋ชจ๋ธ์˜ ์‹ ๋ขฐ์„ฑ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ํ”„๋ ˆ์ž„์›์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Rethinking Diverse Human Preference Learning through Principal Component Analysis โ€“ ๋” LLM Alignment๋ฅผ ์ž˜ ํ•˜๊ธฐ ์œ„ํ•ด์„œ PCA (Principal Component Analysis) ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉ, ์‚ฌ๋žŒ์˜ ์„ ํ˜ธ๋„ ๋ชจ๋ธ๋ง์„ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค.

์ฝ”๋“œ ์ƒ์„ฑ, ์†Œํ”„ํŠธ์›จ์–ด ๊ณตํ•™, ์›น ํฌ๋กค๋ง

  • ๐ŸŒŸ S Test Time Scaling for Code Generation โ€“ ๋ฐ˜๋ณต์ ์ธ ๋””๋ฒ„๊น…์œผ๋กœ LLM ๊ธฐ๋ฐ˜์˜ ์ฝ”๋“œ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” Test-Time Scaling ํ”„๋ ˆ์ž„์›์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Craw4LLM: Efficient Web Crawling for LLM Pretraining โ€“ ๊ฐ€์žฅ ์˜ํ–ฅ๋ ฅ ์žˆ๋Š” ํŽ˜์ด์ง€๋ฅผ ๋†’์€ ์šฐ์„  ์ˆœ์œ„๋กœ ์ง€์ •ํ•ด์„œ, LLM ํ•™์Šต์„ ์‹œํ‚ค๊ธฐ ์œ„ํ•œ ์›น ํฌ๋กค๋ง์„ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸAutellix: An Efficient Serving Engine for LLM Agents as General Programs โ€“ ์š”์ฒญ ์Šค์ผ€์ค„๋ง์„ ์ตœ์ ํ™”ํ•ด์„œ, ์—์ด์ „ํŠธ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ LLM ์„œ๋น„์Šค ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

์ˆ˜ํ•™์  ์ถ”๋ก , ๋…ผ๋ฆฌ์  ์‚ฌ๊ณ , Test-Time ์ตœ์ ํ™”

  • LLMs and Mathematical Reasoning Failures โ€“ ์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ์ƒˆ๋กญ๊ฒŒ ์„ค๊ณ„ํ•ด์„œ LLM์„ ํ‰๊ฐ€, ๋‹ค๋‹จ๊ณ„ (Multi-step) ๋ฌธ์ œ ํ•ด๊ฒฐ ๊ธฐ๋ฒ•์— ์–ด๋–ค ๋ฌธ์ œ๊ฐ€ ์žˆ๋Š”์ง€ ๋ฐํ˜€๋ƒ…๋‹ˆ๋‹ค.

  • Small Models Struggle to Learn from Strong Reasoners โ€“ ์ž‘์€ LLM์ด ํฐ ๋ชจ๋ธ์˜ CoT Distillation์œผ๋กœ๋ถ€ํ„ฐ ์–ป๋Š” ์ด์ ์— ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐํ˜€๋ƒ…๋‹ˆ๋‹ค.

  • ๐ŸŒŸIs That Your Final Answer? Test-Time Scaling Improves Selective Question Answering โ€“ ์ถ”๋ก  ์Šค์ผ€์ผ๋ง์„ ํ•˜๋ฉด, LLM์ด ํ™•์‹ ์ด ์žˆ๋Š” ์งˆ๋ฌธ์— ๋Œ€ํ•ด์„œ ์„ ํƒ์ ์œผ๋กœ ๋‹ต๋ณ€ํ•˜๋Š”๋ฐ ์–ด๋–ป๊ฒŒ ๋„์›€์ด ๋˜๋Š”์ง€ ๊ฒ€ํ† ํ•ฉ๋‹ˆ๋‹ค.

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.