• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#119: GPUแ„€แ…ก แ„‹แ…ฎแ†ฏแ„…แ…ตแ„‚แ…ณแ†ซ แ„’แ…กแ†ทแ„‰แ…ฅแ†ผ แ„‚แ…ฅแ„†แ…ฅ, แ„‹แ…ฃแ†ผแ„Œแ…กแ„€แ…ก แ„’แ…กแ†ทแ„แ…ฆแ„’แ…กแ„‚แ…ณแ†ซ แ„Œแ…ฉแ„‹แ…ญแ†ผแ„’แ…กแ†ซ แ„’แ…งแ†จแ„‰แ…ตแ†ซ

๐ŸŒFOD#119: GPUแ„€แ…ก แ„‹แ…ฎแ†ฏแ„…แ…ตแ„‚แ…ณแ†ซ แ„’แ…กแ†ทแ„‰แ…ฅแ†ผ แ„‚แ…ฅแ„†แ…ฅ, แ„‹แ…ฃแ†ผแ„Œแ…กแ„€แ…ก แ„’แ…กแ†ทแ„แ…ฆแ„’แ…กแ„‚แ…ณแ†ซ แ„Œแ…ฉแ„‹แ…ญแ†ผแ„’แ…กแ†ซ แ„’แ…งแ†จแ„‰แ…ตแ†ซ

+ แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‚แ…ฒแ„‰แ…ณ แ„†แ…ตแ†พ แ„‹แ…งแ†ซแ„€แ…ฎ

GPU์˜ ํฌํšจ ์† ์–‘์ž ์†์‚ญ์ž„

โ€˜ํ‹ฑํ†ก ๋ฏธ๊ตญ ๋ฒ•์ธ์˜ ์ง€๋ถ„ 15%๋ฅผ ๋ณด์œ ํ•˜๊ฒŒ ๋  ํšŒ์‚ฌโ€™๋กœ โ€˜์˜ค๋ผํดโ€™์ด ์ตœ๊ทผ์— ๋‰ด์Šค์— ์ข…์ข… ๋“ฑ์žฅํ•˜์ฃ . ์˜ค๋ผํด ํ•˜๋ฉด ์‚ฌ์‹ค ๋ฌด์กฐ๊ฑด โ€˜๋ž˜๋ฆฌ ์•จ๋ฆฌ์Šจโ€™์ด ๋– ์˜ค๋ฅผ ์ •๋„์ด๊ธด ํ•˜์ง€๋งŒ, ์ตœ๊ทผ์— ๋‘ ๋ช…์˜ ์ž„์›์ด ์˜ค๋ผํด์˜ ๋ฏธ๋ž˜๋ฅผ ๋งก์„ ๊ณต๋™ CEO๋กœ ์ž„๋ช…๋˜์—ˆ์Šต๋‹ˆ๋‹ค (๋ฌผ๋ก  ๋ž˜๋ฆฌ ์•จ๋ฆฌ์Šจ์€ ํšŒ์žฅ์ด๊ณ , ์ง์ „ CEO๋„ โ€˜์‚ฌํ”„๋ผ ์บ์ธ โ€™๋ผ๋Š” ๋ถ„์ด์—ˆ์Šต๋‹ˆ๋‹ค): ๋ฐ”๋กœ, ์˜ค๋ผํด์˜ ํด๋ผ์šฐ๋“œ ์ธํ”„๋ผ ๋ถ€๋ฌธ ์‚ฌ์žฅ์„ ์ง€๋‚ธ ํด๋ ˆ์ด ๋งค๊ฑฐํฌ, ๊ทธ๋ฆฌ๊ณ  ์˜ค๋ผํด ์ธ๋”์ŠคํŠธ๋ฆฌ ์‚ฌ์žฅ์œผ๋กœ ๋ฒ„ํ‹ฐ์ปฌ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜๊ณผ ์‘์šฉ AI ๋ถ€๋ฌธ์„ ์ด๋Œ์–ด ์˜จ ๋งˆ์ดํฌ ์‹œ์‹ค๋ฆฌ์•„์ž…๋‹ˆ๋‹ค.

โ€œThe promotion of the two executives underscores the tech industry and Wall Streetโ€™s focus on cloud computing strategy, as companies pour billions of dollars into expanding the infrastructure that powers AI.โ€

โ€œ๋‘ ์ž„์›์˜ ์Šน์ง„์€, ๊ธฐ์—…๋“ค์ด AI๋ฅผ ๊ตฌ๋™ํ•˜๋Š” ์ธํ”„๋ผ๋ฅผ ํ™•์žฅํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ˆ˜์‹ญ์–ต ๋‹ฌ๋Ÿฌ ์ด์ƒ์„ ์Ÿ์•„๋ถ‡๊ณ  ์žˆ๋Š” ํ™˜๊ฒฝ์—์„œ, ํ…Œํฌ ์ธ๋”์ŠคํŠธ๋ฆฌ ๊ทธ๋ฆฌ๊ณ  ์›”์ŠคํŠธ๋ฆฌํŠธ๊ฐ€ ๊ณ„์†ํ•ด์„œ ํด๋ผ์šฐ๋“œ ์ปดํ“จํŒ… ์ „๋žต์— ์ง‘์ค‘ํ•˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฑธ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.โ€

๋กœ์ดํ„ฐ ํ†ต์‹ 

๋กœ์ดํ„ฐ ํ†ต์‹ ์—์„œ ๋‚ด๋†“์€ ์œ„ ๊ธฐ์‚ฌ๋ฅผ ๋ณด๋ฉด์„œ, (๋‰ด์Šค์™€ ๋ฏธ๋””์–ด๋ฅผ ํ†ตํ•ด์„œ) ์šฐ๋ฆฌ๊ฐ€ AI์˜ ๋ฏธ๋ž˜๋ฅผ ๋ฐ”๋ผ๋ณด๋Š” ํ”„๋ ˆ์ž„์— ๋Œ€ํ•ด์„œ ํ•œ ๋ฒˆ ์ƒ๊ฐํ•ด ๋ณด๊ฒŒ ๋์Šต๋‹ˆ๋‹ค. ์›”์ŠคํŠธ๋ฆฌํŠธ์˜ ๊ด€์ ์—์„œ๋Š”, ์ด์•ผ๊ธฐ๋Š” ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค: AI์˜ ์ˆ˜์š”๊ฐ€ ๋Š˜๋ฉด GPU๊ฐ€ ๋” ํ•„์š”ํ•˜๊ณ , ๋ฐ์ดํ„ฐ์„ผํ„ฐ๋Š” ๋” ์ปค์งˆ ํ…Œ๊ณ , ํด๋ผ์šฐ๋“œ ์ปจํŠธ๋ž™ํŠธ๋Š” ๋” ๋งŽ์•„์งˆ ๊ฑฐ๋ผ๋Š” ๊ฒ๋‹ˆ๋‹ค.

๋ฉฐ์น  ์ „์ธ 22์ผ ์˜คํ”ˆAI์™€ ์—”๋น„๋””์•„๊ฐ€ 10๊ธฐ๊ฐ€์™€ํŠธ ๊ทœ๋ชจ์˜ GPU ์ธํ”„๋ผ๋ฅผ ๋ฐฐ์น˜(Deploy)ํ•˜๊ฒ ๋‹ค๋Š” ํŒŒํŠธ๋„ˆ์‹ญ์„ ๋ฐœํ‘œํ–ˆ๋Š”๋ฐ์š”, ์ด ๋ฐœํ‘œ๋กœ ์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ ํ”„๋ ˆ์ž„์€ ๋” ๋‹จ๋‹จํ•ด์กŒ์„ ๊ฒ๋‹ˆ๋‹ค. ์–ด์จŒ๋“ , ์›”์ŠคํŠธ๋ฆฌํŠธ ์‚ฌ๋žŒ๋“ค์˜ ๋จธ๋ฆฌ ์†์—์„œ๋Š” โ€˜AIโ€™๋ผ๋Š” ๋ง์„ ์–ด๋””์„œ ๋“ฃ์ž๋งˆ์ž โ€˜ํด๋ผ์šฐ๋“œ์˜ Capacityโ€™, ๊ทธ๋ฆฌ๊ณ  โ€˜์‹ค๋ฆฌ์ฝ˜ ์นฉ ๊ณต๊ธ‰โ€™์ด๋ผ๋Š” ๋‹จ์–ด๋กœ ๋ฒˆ์—ญ์ด ๋  ์ •๋„์ผ ๊ฒ๋‹ˆ๋‹ค.

๊ทธ๋ž˜์„œ, ์˜คํžˆ๋ ค ๋” โ€˜์—ฐ๊ตฌ๋กœ๋ถ€ํ„ฐ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ์šฉํ•œ ์‹œ๊ทธ๋„โ€™์— ๋” ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์ด๋Š”๊ฒŒ ์ค‘์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹œ๊ทธ๋„์€ โ€˜์Šค์ผ€์ผ๋ง(Scaling)โ€™์ด โ€˜๋” ๋งŽ์€ ํ•˜๋“œ์›จ์–ดโ€™์™€ ๋™์˜์–ด๋ผ๊ณ  ์™ธ์น˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ, โ€˜๋” ์Šค๋งˆํŠธํ•œ ์ˆ˜ํ•™ ๊ณต์‹๊ณผ ์•„ํ‚คํ…์ฒ˜โ€™๋ผ๊ณ  ๋ถ€๋ฅด์ง–๋Š” ์‹œ๊ทธ๋„๋“ค์ด์ฃ . ๊ทธ๋ฆฌ๊ณ , โ€˜์–‘์ž(Quantum) ์ปดํ“จํŒ…โ€™ ์ด์•ผ๊ธฐ๊ฐ€ ์ด ์‹œ๊ทธ๋„๋“ค์˜ ์ƒ๋‹น ๋ถ€๋ถ„์„ ์ฐจ์ง€ํ•ฉ๋‹ˆ๋‹ค.

๊ฝค ์˜ค๋žœ ๋™์•ˆ, ์–‘์ž ์ปดํ“จํŒ… ์—ฐ๊ตฌ์ž๋“ค๋„ ์–‘์ž ์ปดํ“จํŒ…์œผ๋กœ ๋ญ˜ ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ œ๋Œ€๋กœ ์ƒ๊ฐํ•˜์ง€ ๋ชปํ–ˆ์„ ๊ฒ๋‹ˆ๋‹ค. AI๊ฐ€ ์ด ๋ถ„์•ผ์—๋„ ์ƒˆ๋กœ์šด ์ถ”์ง„์˜ ๋™๋ ฅ์„ ์ œ๊ณตํ•˜๊ณ  ์žˆ๊ณ , ์ง€๊ธˆ์€ โ€˜์ด์ œ ์ถ”๋ก (Inference) ์Šค์ผ€์ผ๋ง์ด๋ผ๋Š”๊ฒŒ ๊ผญ ๋ฌด์ž‘์ • ํž˜์œผ๋กœ ๋ฐ€์–ด๋ถ™์ด๋Š” ๋ฐฉ์‹์ผ ํ•„์š”๋Š” ์—†๋‹คโ€™๋Š” ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋“ค๋„ ๋‚˜์˜ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ง€๋‚œ ์ฃผ์— ๋‚˜์˜จ ์„ธ ํŽธ์˜ ๋…ผ๋ฌธ์„ ๋“ค์—ฌ๋‹ค๋ณด๋ฉด, AI๊ฐ€ โ€˜์‚ฌ์ด์ฆˆโ€™๊ฐ€ ์•„๋‹ˆ๋ผ โ€˜ํšจ์œจ์„ฑ(Efficiency)โ€™์ด๋ผ๋Š” ๋‘ ๋ฒˆ์งธ ์ถ•์„ ๋”ฐ๋ผ์„œ ์Šค์ผ€์ผ๋งํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฑธ ์‹œ์‚ฌํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™์€๋ฐ์š”:

์••์ถ•(Compression): QKAN๊ณผ ์–‘์ž ํ™œ์„ฑํ™” ํ•จ์ˆ˜

์ฒซ ๋ฒˆ์งธ ๋…ผ๋ฌธ์€, โ€˜Quantum Variational Activation Functions Empower Kolmogorov-Arnold Networksโ€™๋ผ๋Š” ์ œ๋ชฉ์˜ ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค. โ€˜์–‘์ž ๋ณ€๋ถ„ ํ™œ์„ฑํ™” ํ•จ์ˆ˜๊ฐ€ KAN ๋„คํŠธ์›Œํฌ๋ฅผ ๊ฐ•ํ™”ํ•œ๋‹คโ€™ ์ •๋„๋กœ ๋ฒˆ์—ญ๋˜๋ ค๋‚˜์š”?

์ œ๋ชฉ์€ ๊ธธ์ง€๋งŒ ํ•ต์‹ฌ์€ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค: AI ์‹ ๊ฒฝ๋ง์˜ โ€˜์Šค์œ„์น˜โ€™ ์—ญํ• ์„ ํ•˜๋Š” ํ™œ์„ฑํ™” ํ•จ์ˆ˜(Activation Function)๋ฅผ ์–‘์ž ์ปดํ“จํŒ… ์Šคํƒ€์ผ๋กœ ๋ฐ”๊พธ๋Š” ๊ฒ๋‹ˆ๋‹ค. ํ‰๋ฒ”ํ•œ ์ž์ „๊ฑฐ๋ฅผ ์ „๊ธฐ ์ž์ „๊ฑฐ๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜๋“ฏ์ด, ๊ธฐ์กด์˜ ๋‹จ์ˆœํ•œ ์Šค์œ„์น˜ - ๋‹จ์ˆœํ•œ ํ™œ์„ฑํ™” ํ•จ์ˆ˜ - ๋Œ€์‹  ๋‹จ์ผ ํ๋น„ํŠธ(์–‘์ž ๋น„ํŠธ) ๋ณ€๋ถ„ ํšŒ๋กœ(Variational Circuit)๋ฅผ ๋„ฃ์Šต๋‹ˆ๋‹ค (์ด๊ฑธ DARUAN์ด๋ผ๊ณ  ๋ถ€๋ฆ…๋‹ˆ๋‹ค). ์ด ์ž‘์€, ์ƒˆ๋กœ์šด ์Šค์œ„์น˜๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ โ€˜์žฌ์—…๋กœ๋“œโ€™ํ•˜๋ฉด์„œ, ๋งˆ์น˜ ์กฐ๊ทธ๋งŒ ์ƒ์ž์— ์ˆ˜๋งŽ์€ ์ƒ‰๊น”์„ ๋‹ด๋Š” ๋“ฏํ•œ ๋А๋‚Œ์œผ๋กœ, โ€˜์ง€์ˆ˜์ ์œผ๋กœโ€™ ํ’๋ถ€ํ•œ ํŒจํ„ด(์ฃผํŒŒ์ˆ˜ ์ŠคํŽ™ํŠธ๋Ÿผ)์„ ๋งŒ๋“ค์–ด๋‚ด์š”. ๊ทธ๋ž˜์„œ, ๋ชจ๋ธ์ด ํ›จ์”ฌ ์ ์€ ๋งค๊ฐœ๋ณ€์ˆ˜๋กœ๋„ ๋˜‘๊ฐ™์ด ๊ฐ•๋ ฅํ•œ ํž˜์„ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฑฐ์ฃ .

์—ฐ๊ตฌ์ž๋“ค์ด ์ด ์•„์ด๋””์–ด๋ฅผ ํ™œ์šฉํ•ด์„œ QKAN(์–‘์ž KAN)์„ ๋งŒ๋“ค์—ˆ์”๋‹ˆ๋‹ค. QKAN์€ ์ˆซ์ž ์˜ˆ์ธก(Regression), ์นดํ…Œ๊ณ ๋ฆฌ ๋ถ„๋ฅ˜(Classification), ์‹ฌ์ง€์–ด๋Š” ChatGPT ๊ฐ™์€ ํ…์ŠคํŠธ ์ƒ์„ฑ ์ž‘์—…์„ ๋Œ€์ƒ์œผ๋กœ ํ–ˆ์„ ๋•Œ ๊ธฐ์กด์˜ MLP๋‚˜ ๊ณ ์ „์ ์ธ KAN๋ณด๋‹ค ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ 30% ์ด์ƒ ์ž‘์•„๋„ ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

Image Credit: QKAN ๋…ผ๋ฌธ

โ€˜AI ์ถ”๋ก (Inference) ์Šค์ผ€์ผ๋งโ€™์˜ ๋งฅ๋ฝ์—์„œ, QKAN์ด ๋ณด์—ฌ์ฃผ๋Š” ์ด๋Ÿฐ ํผํฌ๋จผ์Šค๋Š”, ๋งˆ์น˜ ๊ฑฐ๋Œ€ํ•œ ํŠธ๋Ÿญ์ด ์•„๋‹ˆ๋ผ ์Šค๋งˆํŠธํ•œ ์Šคํฌ์ธ ์นด๋กœ ์ง์„ ๋‚˜๋ฅด๋Š” ๊ฒƒ ๊ฐ™๋‹ค๊ณ ๋‚˜ ํ• ๊นŒ์š”? ๋น„์šฉ ๊ณก์„ ์„ ์™„์ „ํžˆ ๊ตฌ๋ถ€๋ ค๋ฒ„๋ฆฌ๋Š” ๊ฒ๋‹ˆ๋‹ค. ํ•˜์ดํผ์Šค์ผ€์ผ๋Ÿฌ ๊ฐ™์€ ๋Œ€ํ˜•์˜ AI ํšŒ์‚ฌ๋ผ๋ฉด, ์ƒˆ๋กœ์šด ๋ฐœ์ „์†Œ๋ฅผ ์ง“๋Š” ๊ฒƒ๋งŒํผ์ด๋‚˜ ํฐ ๊ฐ€์น˜๊ฐ€ ์žˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ˜น์‹œ KAN ๋„คํŠธ์›Œํฌ์— ๋Œ€ํ•ด์„œ ๊ถ๊ธˆํ•˜์‹  ๋ถ„์€, ์•„๋ž˜์˜ ๊ธ€์„ ์ฐธ๊ณ ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค:

์ •ํ™•์„ฑ(Exactness): ๊ฒฉ์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์œ„ํ•œ ์ฝ”์…‹(Coset) ์ƒ˜ํ”Œ๋ง

์ผ๋‹จ ๊ฐ„๋‹จํ•œ ๋ฐฐ๊ฒฝ ์ง€์‹์„ ๋จผ์ € ์•Œ์•„๋ณผ๊ป˜์š”:

๊ฒฉ์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜(Lattice Algorithm)์€ ๋‹ค์ฐจ์› ๊ฒฉ์ž ๊ตฌ์กฐ์˜ ์ˆ˜ํ•™์  ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ธ๋ฐ, ์–‘์ž ์ปดํ“จํŒ…์—์„œ ์ตœ๋‹จ ๋ฒกํ„ฐ ๋ฌธ์ œ๋‚˜ ํ•™์Šต ์˜ค๋ฅ˜ ๋ฌธ์ œ(LWE)๊ฐ™์€ ์•”ํ˜ธํ•™ ๊ด€๋ จ๋œ ๋‚œ์ œ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ‘ธ๋Š”๋ฐ ํ™œ์šฉ๋œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด์™€ ๊ด€๋ จ๋œ ์ฝ”์…‹ ์ƒ˜ํ”Œ๋ง(Coset Sampling)์€ ๊ฒฉ์ž์˜ ์ฝ”์…‹(๋ถ€๋ถ„ ์ง‘ํ•ฉ)์„ ์ •ํ™•ํ•˜๊ฒŒ ์ถ”์ถœํ•˜๋Š” ๊ธฐ์ˆ ์ธ๋ฐ, ์•Œ๋ ค์ง€์ง€ ์•Š์€ ์˜คํ”„์…‹์„ ์ œ๊ฑฐํ•ด์„œ ํ›„์† ํ‘ธ๋ฆฌ์— ์ƒ˜ํ”Œ๋ง ๋‹จ๊ณ„๊ฐ€ ์ฆ๋ช… ๊ฐ€๋Šฅํ•˜๊ฒŒ ์ •ํ™•ํ•ด ์ง€๋„๋ก ํ•ด์„œ, ์–‘์ž ๊ฒฉ์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์‹ ๋ขฐ์„ฑ์„ ๋†’์ด๋Š”๋ฐ ๋„์›€์„ ์ค€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ฝ”์…‹(Coset)์€ ๊ทธ ๊ฒฉ์ž๋ฅผ ์กฐ๊ธˆ '์ด๋™'(Offset)์‹œํ‚จ ๋ถ€๋ถ„ ์ง‘ํ•ฉ์ž…๋‹ˆ๋‹ค. ์ฝ”์…‹ ์ƒ˜ํ”Œ๋ง์€ ์ด ์ฝ”์…‹์„ ์ •ํ™•ํ•˜๊ฒŒ ๋ฝ‘์•„๋‚ด๋Š” ๋ฐฉ๋ฒ•์ธ๋ฐ, ๋ฌธ์ œ๋Š” ๊ทธ ์ด๋™(์˜คํ”„์…‹)์ด ๋ฏธ๋ฆฌ ์•Œ๋ ค์ง€์ง€ ์•Š์•˜๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค. ์ด ๊ธฐ์ˆ ์€ 'Pair-shift Difference'๋ผ๋Š” ํŠธ๋ฆญ์„ ์จ์„œ ์˜คํ”„์…‹์„ ์™„๋ฒฝํžˆ ์ง€์›Œ๋ฒ„๋ฆฌ๊ณ , ๊ท ์ผํ•œ ์ฝ”์…‹์„ ๋งŒ๋“ค์–ด์„œ ๋‹ค์Œ ๋‹จ๊ณ„์ธ ํ‘ธ๋ฆฌ์— ์ƒ˜ํ”Œ๋ง(์ฃผํŒŒ์ˆ˜ ๋ถ„์„์ฒ˜๋Ÿผ ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์„ ์ถ”์ถœํ•˜๋Š” ๊ณผ์ •)์ด ์ˆ˜ํ•™์ ์œผ๋กœ ์ฆ๋ช…๋  ๋งŒํผ ์ •ํ™•ํ•ด์ง€๊ฒŒ ํ•ด ์ค€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ GPS๊ฐ€ ์œ„์น˜ ์˜ค์ฐจ๋ฅผ ์—†์•  ์ •ํ™•ํ•œ ๊ฒฝ๋กœ๋ฅผ ์•ˆ๋‚ดํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์–‘์ž ๊ฒฉ์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜(์˜ˆ: ์•”ํ˜ธ ํ•ด๋…์ด๋‚˜ AI ์ตœ์ ํ™” ๋ฌธ์ œ ํ•ด๊ฒฐ)์˜ ์ „์ฒด ์‹ ๋ขฐ์„ฑ์„ ๋†’์—ฌ์ค๋‹ˆ๋‹ค.

ํŽธ์ง‘์ž

๊ทธ๋ž˜์„œ, ๋‘ ๋ฒˆ์งธ ๋…ผ๋ฌธ์ด ๋ฐ”๋กœ โ€˜Exact Coset Sampling for Quantum Lattice Algorithmsโ€™๋ผ๋Š” ๋…ผ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ œ๋ชฉ ์ž์ฒด๋Š” ์ˆœ์ˆ˜ ์ˆ˜ํ•™์ ์ธ ๋‚ด์šฉ์ฒ˜๋Ÿผ ๋А๊ปด์ง€๊ณ  AI์™€๋Š” ๊ฑฐ๋ฆฌ๊ฐ€ ๋ฉ€์–ด๋ณด์ด๊ธฐ๋„ ํ•˜์ฃ .

์ด๊ฒŒ ์™œ AI ์ถ”๋ก (Inference)์— ์žˆ์–ด์„œ ์ค‘์š”ํ• ๊นŒ์š”?

์š”์ฆ˜ AI ๋ชจ๋ธ๋“ค์€ โ€˜๋žœ๋คํ•œ ๊ธธโ€™์„ ๋”ฐ๋ผ๊ฐ€๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ƒ๊ฐ์„ ํ•˜์ฃ  - ๋ฏธ๋กœ์—์„œ ๋ˆˆ์„ ๊ฐ€๋ฆฌ๊ณ  ํ—ค๋งค๋“ฏ์ด, CoT๋ฅผ ๋ฐฉํ™ฉํ•˜๊ฑฐ๋‚˜ ๊ฒ€์ƒ‰์„ ๋Œ€์ถฉ(?) ํ•˜๊ฑฐ๋‚˜, ๊ฒฝํ—˜์น™ - ํœด๋ฆฌ์Šคํ‹ฑ - ์œผ๋กœ ๋„๊ตฌ๋ฅผ ํ˜ธ์ถœํ•ฉ๋‹ˆ๋‹ค. ์˜ค์ฐจ์—†์ด ์ •ํ™•ํ•œ ๊ณผ์ •์„ ๊ฑฐ์น˜๋Š” ๊ฐœ๋…์ด ์•„๋‹ˆ๊ณ , โ€˜์ •ํ™•ํ•œโ€™ ๋‹ต์ด ๋“œ๋ฌผ์ฃ . ํ•˜์ง€๋งŒ ์œ„์—์„œ ์„ค๋ช…ํ•œ ๊ธฐ์ˆ ์ฒ˜๋Ÿผ ์ˆ˜ํ•™์ ์œผ๋กœ โ€˜๋ณด์žฅ๋œโ€™ ๋‹จ๊ณ„๋ฅผ AI ์›Œํฌํ”Œ๋กœ์šฐ์— ๋ผ์›Œ๋„ฃ๊ฒŒ ๋˜๋ฉด, AI์˜ ์‹ ๋ขฐ์„ฑ์ด ์˜ฌ๋ผ๊ฐ€๊ฒ ์ฃ .

QKAN์ด ๋ชจ๋ธ์„ โ€˜์••์ถ•โ€™ํ•ด์„œ ์ž‘๊ณ  ๊ฐ•ํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๊ฑฐ๋ผ๋ฉด, ์ด ๋‘ ๋ฒˆ์งธ ๋…ผ๋ฌธ์€ โ€˜์ •ํ™•์„ฑโ€™์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค: ์“ธ๋ฐ์—†๋Š” ํ† ํฐ์„ ์ค„์ด๊ณ , ๋ง‰๋‹ค๋ฅธ ๊ณจ๋ชฉ์„ ํ”ผํ•˜๊ฒŒ ํ•ด ์ฃผ๊ณ , ํ•œ ๋ฒˆ ์ฟผ๋ฆฌํ•  ๋•Œ ๋น„์šฉ์ด ๋œ ๋“ค์ญ‰๋‚ ์ญ‰ํ•˜๊ฒŒ๋”, ๋น„์šฉ์˜ ๋ณ€๋™์„ฑ์„ ๋‚ฎ์ถ”๋Š” ๊ฒ๋‹ˆ๋‹ค.

ํ•˜์ด๋ธŒ๋ฆฌ๋“œํ™”(Hybridization): ์‹ค์ „์—์„œ์˜ ์–‘์ž-๊ณ ์ „ ๋ชจ๋ธ

์„ธ ๋ฒˆ์งธ ์–ธ๊ธ‰ํ•  ๋…ผ๋ฌธ์€ ์ข€ ๋” ์‹ค์šฉ์ ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค: โ€˜Hybrid Quantum-Classical Model for Image Classificationโ€™์ด๋ผ๋Š” ์ด๋ฆ„์˜ ์ด ๋…ผ๋ฌธ์€, ๊ณ ์ „์ ์ธ CNN(Convolutional Neural Network)์˜ ๊ณ„์ธต๋“ค ์ค‘ ์ผ๋ถ€๋ฅผ โ€˜์–‘์ž ์ปดํ“จํŒ… ๊ธฐ๋ฐ˜์˜ ์ž‘์€ ๋ชจ๋“ˆ - ์–‘์ž ํšŒ๋กœโ€™๋กœ ๊ต์ฒดํ•˜๊ฑฐ๋‚˜ ์ถ”๊ฐ€ํ•œ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด์„œ, ์–‘ ์ธก์˜ ๊ฐ•์ ์„ ํ•ฉ์น˜๊ฒ ๋‹ค๋Š” ์•„์ด๋””์–ด์ž…๋‹ˆ๋‹ค. ๊ตณ์ด ๋น„๊ตํ•˜์ž๋ฉด, ๊ฐ€์†”๋ฆฐ ์—”์ง„์„ ์“ฐ๋Š” ์ž๋™์ฐจ์— ์ „๊ธฐ ์—”์ง„์„ ์‚ด์ง ๋”ํ•ด์„œ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ฐจ๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ ๊ฐ™๋‹ค๊ณ ๋‚˜ ํ• ๊นŒ์š”?

CIFAR100, STL10 ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ…Œ์ŠคํŠธํ•ด ๋ณธ ๊ฒฐ๊ณผ, ์ˆœ์ˆ˜ํ•œ ํด๋ž˜์‹ ๋ชจ๋ธ๋ณด๋‹ค ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์คฌ๊ณ , ํ›ˆ๋ จ๋„ ๋” ๋น ๋ฅด๊ฒŒ ์ง„ํ–‰๋˜๊ณ  ๋งค๊ฐœ๋ณ€์ˆ˜๋„ ๋” ์ ์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์–ด์ฉŒ๋ฉด, ํ‘œ์ค€์ ์ธ AI ์ž‘์—…์—์„œ๋„ ์–‘์ž ๊ตฌ์„ฑ์š”์†Œ๊ฐ€ AI ๋ชจ๋ธ์˜ ํšจ์œจ์„ฑ์„ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ฆ๊ฑฐ ์•„๋‹๊นŒ์š”?

Image Credit: โ€˜Hybrid quantum-classical convolutional neural network architectureโ€™

์–ด์ฉŒ๋ฉด, ์˜ค๋ฅ˜ ๋‚ด์„ฑ ์–‘์ž ์ปดํ“จํ„ฐ(Fault-Tolerant Quantum Computer)๋ผ๋Š” ๋ชฉํ‘œ๊ฐ€ ๋‹ฌ์„ฑ๋˜์ง€ ์•Š์•„๋„ ์ˆ˜๋งŽ์€ ์ž‘์—…์— ์–‘์ž ์ปดํ“จํŒ…์„ ์ด์šฉํ•œ ์—„์ฒญ๋‚œ ํšจ์œจ์„ฑ ๊ฐœ์„ ์„ ์ด๋ฃฐ ์ˆ˜ ์žˆ์„์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค. AI์˜ ์ถ”๋ก  ๋งฅ๋ฝ์—์„œ๋„, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋œ ๊ฒƒ์ด๋“  ์•„๋‹ˆ๋ฉด ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋Š” ๊ฒƒ์ด๋“ , ๋ช‡ ๊ฐœ์˜ ํ๋น„ํŠธ๋งŒ ๊ฐ€์ง€๊ณ ๋„ ๊ณ ์ „์ ์ธ AI ํŒŒ์ดํ”„๋ผ์ธ์— ์ž˜ ๊ฒฐํ•ฉํ•˜๋ฉด ์ง€๊ธˆ๋ณด๋‹ค ํ›จ์”ฌ ๋” ํšจ์œจ์ ์ธ ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฑฐ๊ตฌ์š”. ์ด๊ฑด, ๋ชจ๋“  ํ•˜์ดํผ์Šค์ผ€์ผ๋Ÿฌ๊ฐ€ ๊ฟˆ๊พธ๋Š”, ๋น ๋ฅธ ํ›ˆ๋ จ, ๋” ์ ์€ ๋ฉ”๋ชจ๋ฆฌ ์†Œ๋น„๋ผ๋Š” ์ง€ํ‘œ์— ๋‹ค๊ฐ€๊ฐ€๊ฒŒ ํ•ด ์ฃผ๋Š” ํ•˜๋‚˜์˜ ๊ฐ€๋Šฅ์„ฑ์ž…๋‹ˆ๋‹ค.

โ€˜์ถ”๋ก (Inference) ์Šค์ผ€์ผ๋งโ€™์— ์žˆ์–ด์„œ์˜ ์˜๋ฏธ

์œ„์—์„œ ๊ฐ„๋‹จํžˆ ๋ง์”€๋“œ๋ฆฐ ๋…ผ๋ฌธ๋“ค์„ ์ข…ํ•ฉํ•ด ๋ณด๋ฉด, ๊ฒฐ๊ตญ โ€˜์Šค์ผ€์ผ๋ง(Scaling)โ€™์ด ๋” ํฐ ํด๋Ÿฌ์Šคํ„ฐ, ๋” ํฐ ๋ชจ๋ธ์„ ํ–ฅํ•œ ๋œ€๋ฐ•์งˆ๋งŒ์„ ์˜๋ฏธํ•˜๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ๋Š” ๊ฑธ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๊ฐ๊ฐ์˜ ๋งค๊ฐœ๋ณ€์ˆ˜์—์„œ ๋” ๋งŽ์€ ์ •๋ณด์™€ ์˜๋ฏธ๋ฅผ ์ถ”์ถœํ•ด ๋‚ด๊ณ , ์˜ค๋ฅ˜๋ฅผ ๊ทธ ์›์ฒœ(Source)์—์„œ ์ฐจ๋‹จํ•˜๊ณ  ์ค„์—ฌ๋‚˜๊ฐ€๊ณ , ์–‘์ž(Quantum) ์ปดํ“จํŒ…๊ณผ ๊ณ ์ „(Classical) ์ปดํ“จํŒ…์˜ ๊ฐ•์ ์„ ์„ž๋Š” ๊ฒ๋‹ˆ๋‹ค.

์›”์ŠคํŠธ๋ฆฌํŠธ์˜ ๊ด€์ ์—์„œ์•ผ โ€˜ํด๋ผ์šฐ๋“œ ์ž๋ณธ ์ง€์ถœโ€™์ด ๋ฌด์—‡๋ณด๋‹ค ํฌ๊ฒŒ ๋ณด์ด๋Š”, ๊ทธ๋ฆฌ๊ณ  ์ค‘์š”ํ•œ ์ง€ํ‘œ๊ฒ ์ง€๋งŒ, ์ง€๊ธˆ ์ด๋ค„์ง€๊ณ  ์žˆ๋Š” ๋‹ค์–‘ํ•œ ์—ฐ๊ตฌ๋“ค์€, โ€˜๊ทธ ๊ณ„์‚ฐ๋ฒ•์„ ๋‹ค์‹œ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ๋Š”, ์ƒˆ๋กญ๊ฒŒ, ๊ทน์ ์œผ๋กœ ํšจ์œจ์„ฑ์„ ๊ฐœ์„ ํ•  ๊ธฐ๋ณธ์  ์š”์†Œ๋“ค์„ ํƒ๊ตฌโ€™ํ•˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์—๋„ ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์—ฌ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

๋‹น์—ฐํžˆ, ์—”๋น„๋””์•„ ๊ฐ™์€ ํšŒ์‚ฌ๋“ค์ด ์ด๊ฑธ ๋†“์น  ๋ฆฌ ์—†์ฃ . ์—”๋น„๋””์•„์˜ ์–‘์ž ์ปดํ“จํŒ…์— ๋Œ€ํ•œ ํˆฌ์ž๋„ ๊ณ„์†ํ•ด์„œ ๋น ๋ฅด๊ฒŒ ์ฆ๊ฐ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค; ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์–‘์ž-๊ณ ์ „ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ์œ„ํ•œ ์˜คํ”ˆ ์†Œํ”„ํŠธ์›จ์–ด ํ”Œ๋žซํผ์ธ CUDA-Q๋ฅผ ๋งŒ๋“ค์—ˆ๊ณ , DGX Quantum์ด๋ผ๋Š” ๋ ˆํผ๋Ÿฐ์Šค ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ถœ์‹œ, ์–‘์ž ์ œ์–ด ์‹œ์Šคํ…œ์„ AI ์Šˆํผ์ปดํ“จํ„ฐ์— ์ง์ ‘ ์—ฐ๊ฒฐํ•˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์—ฌ๋Ÿฌ ํ•˜๋“œ์›จ์–ด ํŒŒํŠธ๋„ˆ๋“ค๊ณผ ํ•จ๊ป˜ ์ „์šฉ ์–‘์ž ์—ฐ๊ตฌ์„ผํ„ฐ๋ฅผ ์—ด๊ณ  ์žˆ๊ธฐ๋„ ํ•˜์ฃ .

์  ์Šจ ํ™ฉ์€ NVentures๋ฅผ ํ†ตํ•ด์„œ PsiQuantum, Quantinuum, QuEra ๊ฐ™์€ ์–‘์ž ์Šคํƒ€ํŠธ์—…์— ์ ๊ทน์ ์œผ๋กœ ํˆฌ์žํ•˜๊ณ  ์žˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. PsiQuantum์€ ์ตœ๊ทผ์— 10์–ต ๋‹ฌ๋Ÿฌ ํˆฌ์ž๋ฅผ ๋ฐ›๊ธฐ๋„ ํ–ˆ๊ณ , ์•ž์œผ๋กœ 2๋…„ ์•ˆ์— ์ž‘๋™ํ•˜๋Š” ์–‘์ž ์ปดํ“จํ„ฐ๋ฅผ ์ถœ์‹œํ•˜๊ฒ ๋‹ค๊ณ  ํ•˜๋„ค์š”.

์–ด์จŒ๋“ , ์—”๋น„๋””์•„์˜ ์ด๋Ÿฐ ์›€์ง์ž„์€ 2025๋…„์— ๋“ค์–ด์„œ ๋‘๋“œ๋Ÿฌ์ง„ ์ค‘์š”ํ•œ ์ „๋žต์  ์›€์ง์ž„์ด๊ณ , ์–‘์ž ์ปดํ“จํŒ…์˜ โ€˜์ƒ์—…์  ์‹คํ–‰โ€™์— ๋Œ€ํ•œ ํƒ€์ž„๋ผ์ธ์„ ์–ด๋А ์ •๋„ ๊ฐ€์‹œํ™”ํ•˜๋Š” ๊ฒŒ ์•„๋‹๊นŒ ํ•ฉ๋‹ˆ๋‹ค.

์•ž์œผ๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋ณด๊ฒŒ ๋  ๊ฒƒ

์ง€๊ธˆ๊นŒ์ง€์ฒ˜๋Ÿผ, ๋Œ€๊ทœ๋ชจ์˜ โ€˜ํด๋ผ์šฐ๋“œ ๊ตฌ์ถ•(Build-out)โ€™์€ ๊ณ„์†๋  ๊ฒ๋‹ˆ๋‹ค. GPU๋Š” ์ด ์„ฑ์žฅ์˜ ์ฃผ์—ญ์œผ๋กœ, ์—ฌ์ „ํžˆ ์ค‘์‹ฌ์— ์žˆ์„ ๊ฑฐ๊ตฌ์š”.

ํ•˜์ง€๋งŒ, ๋ฏธ๋ž˜๋ฅผ ํ–ฅํ•œ ์—ฐ๊ตฌ ํŒŒ์ดํ”„๋ผ์ธ์— ์ฃผ์˜๋ฅผ ๋†“์น˜์ง€ ์•Š๋Š”๋‹ค๋ฉด, ์–‘์ž ์ปดํ“จํŒ…๊ณผ ๊ด€๋ จ๋œ ์•„์ด๋””์–ด๊ฐ€ ์ ์ฐจ โ€˜์ถ”๋ก  ์Šค์ผ€์ผ๋งโ€™ ๋‚ด๋Ÿฌํ‹ฐ๋ธŒ์— ์—ฐ๊ฒฐ๋˜๊ณ  ํ•ฉ์ณ์ง€๋Š” ๋ชจ์Šต์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์„ ๊ฒ๋‹ˆ๋‹ค.

์•„์ง์€ ์ดˆ๊ธฐ์ผ์ง€ ๋ชจ๋ฅด์ง€๋งŒ, ํšจ์œจ์„ฑ(Efficiency), ๊ทธ๋ฆฌ๊ณ  ๊ตฌ์กฐ(Structure; Architecture)๊ฐ€ ์›์‹œ์ ์ธ ์Šค์ผ€์ผ๋ง๋งŒํผ ์ค‘์š”ํ•ด์ง€๋Š” ์‹œ๊ธฐ๊ฐ€ ์˜ฌ ๊ฒ๋‹ˆ๋‹ค.

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

LoRA(Low-Rank Adaptation)๋Š”, ์ „์ฒด ๋ชจ๋ธ์„ ๋‹ค์‹œ ํ•™์Šต์‹œํ‚ค๋Š” ๋Œ€์‹ ์— ์ž‘์€ ์ €๋žญํฌ ํ–‰๋ ฌ์„ ์ถ”๊ฐ€ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ํšจ์œจ์ ์œผ๋กœ ๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด ์ฃผ๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

๋‹ค๋ฅธ AI ๋ถ„์•ผ์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ์ด ๋ถ„์•ผ๋„ ๊ณ„์†ํ•ด์„œ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์ฃ . ์ƒˆ๋กœ์šด LoRA ๊ธฐ๋ฒ•๋“ค์ด ๋‚˜์˜ค๋ฉด์„œ ํšจ์œจ์„ฑ, ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ, ๊ฐœ์ธํ™”๋ผ๋Š” ์˜์—ญ์—์„œ ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์„ ํ•œ๊ณ„๊นŒ์ง€ ๋Œ์–ด์˜ฌ๋ฆฌ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ผญ ์•Œ์•„๋‘˜ ๋งŒํ•œ ์ตœ์‹ ์˜ LoRA ๊ธฐ๋ฒ• 10๊ฐ€์ง€๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค:

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

์•Œ๋ฆฌ๋ฐ”๋ฐ”์˜ ์—์ด์ „ํŠธ, ์กฐ๊ธˆ โ€˜๋ถˆํŽธํ•  ์ •๋„โ€™๋กœ ๋˜‘๋˜‘ํ•ด์ง€๋‚˜?

์ฑ—๋ด‡์— ๋ญ”๊ฐ€ ์š”์ฒญ์„ ํ–ˆ์„ ๋•Œ, ๋„๊ตฌ(Tool)๋ฅผ ๋ง ๊ทธ๋Œ€๋กœ ์“ฐ๋‹ค๊ฐ€ ๋ง๊ณ  โ€˜๋ฉˆ์ถฐ๋ฒ„๋ฆฌ๋Š”โ€™ ๋ฌธ์ œ๋“ค์ด ์ข…์ข… ์ผ์–ด๋‚˜์ฃ . ๋งŽ์€ ์—ฐ๊ตฌ์†Œ์™€ ํšŒ์‚ฌ์—์„œ ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๊ณ  ๊ณ ๊ตฐ๋ถ„ํˆฌํ•˜๊ณ  ์žˆ๋Š” ๊ฐ€์šด๋ฐ, ์•Œ๋ฆฌ๋ฐ”๋ฐ”์˜ Tongyi ์—ฐ๊ตฌ์†Œ๋Š” ์ด๋ฏธ ํ•œ ๋ฐœ ์•ž์„œ๊ฐ€๊ณ  ์žˆ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ด๋„ค์š”.

๊ณ„ํšํ•˜๊ณ , ์ ์‘ํ•˜๊ณ , ์ถ”๋ก ํ•˜๊ณ , ์‹ฌ์ง€์–ด ์–ธ์ œ ๋ง์„ ๋ฉˆ์ถฐ์•ผ ํ• ์ง€๋„ ์•„๋Š”, โ€˜์ƒ๊ฐํ•˜๋Š” ์‹œ์Šคํ…œโ€™์„ ๋งŒ๋“ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์•„๋ž˜ Tongyi ์—ฐ๊ตฌ์†Œ๊ฐ€ ๋ฐœํ‘œํ•œ ์—ฌ์„ฏ ํŽธ์˜ ๋›ฐ์–ด๋‚œ ๋…ผ๋ฌธ, ๋ฐ”๋กœ ์—์ด์ „ํ‹ฑ AI (Agentic AI)์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์ƒˆ๋กญ๊ฒŒ ์ •์˜ํ•˜๋Š” ๋…ผ๋ฌธ๋“ค์ž…๋‹ˆ๋‹ค. ๊ฒŒ๋‹ค๊ฐ€ ๋ชจ๋‘ ์˜คํ”ˆ์†Œ์Šค ์ฝ”๋“œ, ๋ฐ์ดํ„ฐ์…‹์„ ํ•จ๊ป˜ ๊ณต๊ฐœํ•˜๊ณ  ์žˆ๋„ค์š”.

  • WebWeaver: โ€˜์‚ฌ๋žŒ์ฒ˜๋Ÿผโ€™ ์—ฐ๊ตฌํ•˜๋Š” ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์ •๋ณด๋ฅผ ์ฐพ์„ ๋•Œ๋งˆ๋‹ค ๊ณ„ํš์„ ์—…๋ฐ์ดํŠธํ•˜๊ณ , ํ•„์š”ํ•œ ์ •๋ณด๋งŒ ๊ณจ๋ผ ์„น์…˜๋ณ„๋กœ ์ž‘์„ฑํ•˜์ฃ . ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์šฐ๊ฒจ๋„ฃ๋Š” ๋Œ€์‹  ๋˜‘๋˜‘ํ•˜๊ฒŒ ์ผํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ, ๋ชจ๋“  ๋”ฅ ๋ฆฌ์„œ์น˜ ๋ฒค์น˜๋งˆํฌ์—์„œ 1๋“ฑ์„ ์ฐจ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • AgentFounder: ๋ชจ๋ธ์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ์—์ด์ „ํŠธ์ฒ˜๋Ÿผ ํ›ˆ๋ จ์‹œํ‚ค๋ฉด, ๋‚˜์ค‘์— ๋„๊ตฌ ์‚ฌ์šฉ ๋Šฅ๋ ฅ์„ ์–ต์ง€๋กœ ๋ถ™์ด๋Š” ๊ฒƒ๋ณด๋‹ค ํ›จ์”ฌ ๋‚˜์€ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฑธ ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์—์ด์ „ํŠธ ์ง€์† ์‚ฌ์ „ํ›ˆ๋ จ(Agentic Continual Pre-training, Agentic CPT)์ด๋ผ๋Š” ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์•ˆํ•˜๋Š”๋ฐ, 300์–ต ๋งค๊ฐœ๋ณ€์ˆ˜์˜ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์ด ํ›จ์”ฌ ๋” ํฐ ๋น„๊ณต๊ฐœ ๋ชจ๋ธ์„ ๋„๊ตฌ ํ™œ์šฉ ์ž‘์—…์—์„œ ์ด๊ธฐ๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ฃผ๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • WebSailor-V2: ์˜คํ”ˆ์†Œ์Šค ์—์ด์ „ํŠธ๊ฐ€ ๊ฑฐ๋Œ€ ๋ชจ๋ธ๋“ค๊ณผ ๊ฒฝ์Ÿํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด ์ค๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ํ›ˆ๋ จ์„ ์„ž๊ณ , ์ผ๋ถ€๋Ÿฌ ํ—ท๊ฐˆ๋ฆฌ๊ฒŒ ๋งŒ๋“  ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ›ˆ๋ จํ•ด์„œ, ์ž์‹ ๋ณด๋‹ค 20๋ฐฐ ํฐ ๋ชจ๋ธ๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • AgentScaler: ๋˜‘๋˜‘ํ•œ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋Œ€์‹ , ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์—์„œ ์—์ด์ „ํŠธ๋กœ์„œ์˜ ํ–‰๋™(Agentic Behavior)์„ ๋ฐฐ์šฐ๊ฒŒ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด์„œ, ์ด์ƒํ•œ API ํ˜ธ์ถœ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ๋„ ์ž˜ ์ž‘๋™ํ•˜๋„๋ก์š”. ๋ฏธ์„ธ ์กฐ์ •์€ ์ข€ ๋œ ํ•˜๊ณ , ์ง„์งœ ์ง€๋Šฅ์„ ํ‚ค์šฐ๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ท„๋‹ค๊ณ  ๋ณด๋ฉด ๋  ๋“ฏ ํ•ฉ๋‹ˆ๋‹ค.

  • WebResearcher: ์—ฐ๊ตฌ๋ฅผ ํ•œ ๋ฒˆ์— ๋๋‚ด๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ ๊ณ„์† ๋ฐœ์ „์‹œํ‚ค๋Š” ์—์ด์ „ํŠธ์ž…๋‹ˆ๋‹ค. ๋ฐฐ์šด ๊ฑธ ๊ธฐ์–ตํ•˜๊ณ , ๋ณด๊ณ ์„œ๋ฅผ ์ ์  ๋” ์ •๊ตํ•˜๊ฒŒ ๋‹ค๋“ฌ๊ณ , ์›น์˜ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์—์„œ ํ†ต์ฐฐ์„ ๋ฝ‘์•„๋ƒ…๋‹ˆ๋‹ค. ์‹ฌ์ง€์–ด ์Šค์Šค๋กœ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜๋„ ์žˆ๋‹ค๊ณ  ํ•˜๋„ค์š”.

  • ReSum: ๊ธด ๋Œ€ํ™”์—์„œ๋„ ์žŠ์ง€ ์•Š๋„๋ก ์—์ด์ „ํŠธ๊ฐ€ ์Šค์Šค๋กœ ์š”์•ฝํ•˜๋Š” ๋ฒ•์„ ๋ฐฐ์šฐ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜๋ฐฑ ๋ฒˆ์˜ ์ƒํ˜ธ์ž‘์šฉ์—์„œ๋„ ํ๋ฆ„์„ ์žƒ์ง€ ์•Š๊ณ  ๊ณ„์† ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค; ๊ธฐ์–ต๋ ฅ๊ณผ ์‚ฌ๊ณ ๋ฅผ ํ•ฉ์นœ ์…ˆ์ž…๋‹ˆ๋‹ค.

ํ‰์ด ์—ฐ๊ตฌ์†Œ์˜ ๋…ผ๋ฌธ๋“ค์„ ๋ณด๋ฉด, ํ™•์‹คํžˆ ๋‹จ์ˆœํžˆ ๋ฐ˜์‘์ ์ธ ์‹œ์Šคํ…œ์ด ์•„๋‹ˆ๋ผ ๊ตฌ์กฐ์™€ ๊ธฐ์–ต, ์˜๋„๋ฅผ ๊ฐ€์ง€๊ณ  โ€˜์ƒ๊ฐโ€™ํ•˜๋Š” ์‹œ์Šคํ…œ์„ ๋งŒ๋“ค๋ ค๊ณ  ํ•˜๋Š” ๊ฒƒ ๊ฐ™๋„ค์š”. ๋‹ค์‹œ ํ•œ ๋ฒˆ ๋ง์”€๋“œ๋ฆฌ์ง€๋งŒ, ์ด ๋ชจ๋“  ๊ฒŒ ์˜คํ”ˆ์†Œ์Šค๋ผ๋Š” ๊ฒƒ๋„ ๋†€๋ž์Šต๋‹ˆ๋‹ค.

์ธํ…” + ์—”๋น„๋””์•„ ์—ฐํ•ฉ: โ€˜๊ฒฌ์›์ง€๊ฐ„โ€™์ด๋ผ๋Š” ๋ง๋„ ์˜›๋ง์ธ๊ฐ€์š”?

๋†€๋ผ์šด ์†Œ์‹์ž…๋‹ˆ๋‹ค. ์ธํ…”๊ณผ ์—”๋น„๋””์•„๊ฐ€ ์†์žก๊ณ  x86 ์นฉ์„ ๊ณต๋™ ๊ฐœ๋ฐœํ•˜๊ณ  ์žˆ์–ด์š”. ์ด ์นฉ์€ ์ธํ…” CPU์™€ ์—”๋น„๋””์•„ RTX GPU ์นฉ๋ ›์„ ๊ฒฐํ•ฉํ•œ ๊ฒƒ์œผ๋กœ, ๊ฒŒ์ด๋ฐ PC์— ์ตœ์ ํ™”๋œ ์ œํ’ˆ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค โ€“ AMD์˜ APU์™€ ๋น„์Šทํ•˜์ง€๋งŒ, ํ›จ์”ฌ ๋” ๊ฐ•๋ ฅํ•œ '์†Œ์Šค'๋ฅผ ๊ณ๋“ค์ธ ๋А๋‚Œ์ด์ฃ .

๊ฒŒ๋‹ค๊ฐ€ ์—”๋น„๋””์•„๋Š” ์ž์‚ฌ ๋ฐ์ดํ„ฐ์„ผํ„ฐ์šฉ์œผ๋กœ ์ธํ…”์—๊ฒŒ ๋งž์ถคํ˜• x86 CPU๋ฅผ ์ฃผ๋ฌธํ•˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ํŒŒํŠธ๋„ˆ์‹ญ์—๋Š” 50์–ต ๋‹ฌ๋Ÿฌ๋ผ๋Š” ์–ด๋งˆ์–ด๋งˆํ•œ ํˆฌ์ž๋„ ํฌํ•จ๋ผ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋„์ฒด ์„ธ์ƒ์˜ ํŒ๋„๊ฐ€ ํฅ๋ฏธ๋กญ๊ฒŒ ๋ณ€ํ•˜๊ณ  ์žˆ๋„ค์š”.

์ด๋ฒˆ ์ฃผ์˜ ์ฃผ์š” ํˆฌ์ž ์†Œ์‹

  • Grok
    ์—”๋น„๋””์•„์˜ AI ์‹œ์žฅ ๋…์ ์„ ๊นจ๊ฒ ๋‹ค๋ฉฐ 7์–ต5000๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ํˆฌ์ž๋ฐ›์•˜๊ณ , ๊ธฐ์—…๊ฐ€์น˜๋Š” 69์–ต ๋‹ฌ๋Ÿฌ์— ๋‹ฌํ•ฉ๋‹ˆ๋‹ค. Grok์˜ LPU ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋จธ์‹ ์€ ์‹œ์žฅ๊ณผ ํˆฌ์ž์ž๋“ค์˜ ์ฃผ๋ชฉ์„ ๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • Replit
    2์–ต5000๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ํˆฌ์ž๋ฐ›์œผ๋ฉด์„œ 30์–ต ๋‹ฌ๋Ÿฌ์˜ ๊ธฐ์—… ๊ฐ€์น˜์— ๋„๋‹ฌํ–ˆ์Šต๋‹ˆ๋‹ค. AI๋ฅผ ํ’€์Šคํƒ ํŒ€์›์œผ๋กœ ๋งŒ๋“ค์–ด์ฃผ๋Š” 'Agent 3'๋ฅผ ์ถœ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.

  • Figure AI
    10์–ต ๋‹ฌ๋Ÿฌ ์ด์ƒ์˜ ์ž๊ธˆ์„ ํ™•๋ณดํ•˜๋ฉด์„œ 390์–ต ๋‹ฌ๋Ÿฌ์˜ ๊ธฐ์—… ๊ฐ€์น˜๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. 4๋…„ ์•ˆ์— 10๋งŒ ๋Œ€์˜ ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์„ ์„ ๋ณด์ด๊ฒ ๋‹ค๊ณ  ์•ฝ์†ํ–ˆ์Šต๋‹ˆ๋‹ค.

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ํŒ€์ด ์ฝ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค

์ง€๊ธˆ์˜ AI ์ถ”๋ก  ๋ชจ๋ธ์ด ๋‹ค์Œ์— ์˜ฌ ๋‹จ์–ด๋ฅผ ํ™•๋ฅ ์ ์œผ๋กœ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ์‹์ด๊ธฐ ๋•Œ๋ฌธ์—, ๋ณต์žกํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ์–ด๋ ค์›€์„ ๊ฒช๋Š”๋‹ค๋Š” ์ง€์ ์ด ์žˆ์ฃ . Nathan Lambert๋Š” AI์˜ ๋ฐœ์ „ ๋ฐฉํ–ฅ์ด ๋‹จ์ˆœํžˆ ๋ชจ๋ธ์˜ ๊ทœ๋ชจ๋ฅผ ํ‚ค์šฐ๋Š” ๋ฐ์„œ ๋ฒ—์–ด๋‚˜, ํšจ์œจ์„ฑ๊ณผ ๊ตฌ์กฐ๋ฅผ ๊ฐ–์ถฐ์•ผ ํ•œ๋‹ค๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค. ๋ฏธ๋ž˜์˜ AI๋Š” ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๊ณ„ํš์„ ์„ธ์šฐ๊ณ , ๊ฒ€์ƒ‰ํ•˜๊ณ , ํ–‰๋™ํ•˜๋Š” '์—์ด์ „ํŠธ' ํ˜•ํƒœ๋กœ ์ง„ํ™”ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๋˜๊ธฐ ์œ„ํ•ด์„œ, ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ๊ธด ์ถ”๋ก  ๊ณผ์ •์„ ์š”์•ฝํ•˜๊ฑฐ๋‚˜, ์ฒ˜์Œ๋ถ€ํ„ฐ ์—์ด์ „ํŠธ์ฒ˜๋Ÿผ ํ–‰๋™ํ•˜๋„๋ก ํ•™์Šตํ•˜๋Š” ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ๋“ค์ด ํ•ต์‹ฌ์œผ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ๋„ค์š”.

์ง€์ง€๋ถ€์ง„ํ•œ โ€˜Apple Intelligenceโ€™ ๋•Œ๋ฌธ์— ์• ํ”Œ์ด AI ํŒ์—์„œ ์—ฌ๋Ÿฌ ๊ฐ€์ง€๋กœ ๋น„ํŒ์„ ๋ฐ›๊ธฐ๋„ ํ•˜๋Š”๋ฐ์š”. ํŠœ๋ง ํฌ์ŠคํŠธ์—์„œ๋Š” โ€˜๊ณผ์—ฐ ์• ํ”Œ๋‹ค์šด AI๋ผ๋Š”๊ฒŒ ๋ญ˜๊นŒ?โ€™๋ผ๋Š” ์ƒ๊ฐ์„ ํ•ด ๋ณธ ์ ๋„ ์žˆ๊ตฌ์š”. ๊ทธ๋Ÿฐ๋ฐ, iOS 26์—์„œ ์• ํ”Œ์ด ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ณต๊ฐœํ•˜๋ฉด์„œ ๊ฐœ๋ฐœ์ž๋“ค์—๊ฒŒ ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ์—ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด์„œ ๊ฐœ๋ฐœ์ž๋“ค์€ ์„œ๋ฒ„๋ฅผ ๊ฑฐ์น˜์ง€ ์•Š๊ณ  ์•„์ดํฐ ๊ธฐ๊ธฐ ์ž์ฒด์—์„œ ๊ตฌ๋™๋˜๋Š” ๋กœ์ปฌ AI๋ฅผ ์•ฑ์— ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฐฉ์‹์€ ๋‹น์—ฐํžˆ ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ์—์„œ ์œ ๋ฆฌํ•œ ์ ์ด ์žˆ๊ณ , ์‘๋‹ต ์†๋„๋„ ๋น ๋ฅด๊ณ  ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์ถ”๋ก  ๋น„์šฉ์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ ์ด ๊ธฐ์ˆ ์€ 'Day One'์˜ ์ผ๊ธฐ ์š”์•ฝ์ด๋‚˜ ์ง€์ถœ ์•ฑ์˜ ์Šค๋งˆํŠธํ•œ ์•„์ดํ…œ ๋ถ„๋ฅ˜ ๋“ฑ, ์•ฑ์˜ ์ผ์ƒ์ ์ธ ํŽธ์˜์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉ๋˜๋ฉด์„œ ์ƒˆ๋กœ์šด ์‚ฌ์šฉ์ž ๊ฒฝํ—˜์„ ์ œ๊ณตํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ตœ๊ทผ Claude์˜ ์‚ฌ์šฉ์ž๋“ค๋กœ๋ถ€ํ„ฐ ์‘๋‹ต ํ’ˆ์งˆ์ด ์ €ํ•˜๋˜์—ˆ๋‹ค๋Š” ๋ณด๊ณ ๊ฐ€ ์ž‡๋”ฐ๋ž์ฃ . ์ €๋„ ํ•œ๋™์•ˆ ์‘๋‹ต ํ’ˆ์งˆ ์ €ํ•˜ ๋“ฑ์˜ ์ด์Šˆ ๋•Œ๋ฌธ์— Claude๋ฅผ ์ง€๊ธˆ ์‚ฌ์šฉ ์•ˆ ํ•˜๊ณ  ์žˆ๋Š”๋ฐ์š”. ์•ค์“ฐ๋กœํ”ฝ์—์„œ ๊ทธ ์›์ธ์„ ๋ถ„์„ํ•œ ๊ธฐ์ˆ ์ ์ธ ์‚ฌํ›„ ๋ถ„์„ ๋ณด๊ณ ์„œ๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ํ’ˆ์งˆ ์ €ํ•˜์˜ ์›์ธ์€ ์„œ๋ฒ„ ๋ถ€ํ•˜๊ฐ€ ์•„๋‹Œ, ์„ธ ๊ฐ€์ง€ ์ธํ”„๋ผ ๋ฒ„๊ทธ๊ฐ€ ๊ฒน์ณ ๋ฐœ์ƒํ•œ ๊ฒƒ์œผ๋กœ ํ™•์ธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์š”์ฒญ ๋ผ์šฐํŒ… ์˜ค๋ฅ˜, ์ถœ๋ ฅ ์†์ƒ, ์ปดํŒŒ์ผ๋Ÿฌ ๋ฒ„๊ทธ ๋“ฑ์ด ๋ณต์žกํ•˜๊ฒŒ ์ž‘์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์•ค์“ฐ๋กœํ”ฝ์€ ์ด ์‚ฌ๊ณ ๋ฅผ ํ†ตํ•ด์„œ ๋ชจ๋ธ ํ’ˆ์งˆ ํ™•๋ณด์˜ ์ค‘์š”์„ฑ์„ ๋‹ค์‹œ ํ•œ๋ฒˆ ๊นจ๋‹ฌ์•˜๋‹ค๊ณ  ๊ฐ•์กฐํ•˜๋ฉด์„œ, ์„ฑ๋Šฅ์— ์•ฝ๊ฐ„์˜ ์ง€์—ฐ์ด ๋ฐœ์ƒํ•˜๋”๋ผ๋„ ๊ทผ์‚ฌ์น˜ ์—ฐ์‚ฐ ๋Œ€์‹  ์ •ํ™•ํ•œ ์—ฐ์‚ฐ ๋ฐฉ์‹์„ ์ฑ„ํƒํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋””๋ฒ„๊น… ๋„๊ตฌ๋ฅผ ๊ฐœ๋ฐœํ•˜๋Š” ๋“ฑ ์‹œ์Šคํ…œ ์•ˆ์ •ํ™”๋ฅผ ์œ„ํ•œ ์กฐ์น˜์— ์ง‘์ค‘ํ•˜๊ณ  ์žˆ๋‹ค๊ณ  ๋ฐํ˜”์Šต๋‹ˆ๋‹ค.

์˜คํ”ˆAI์™€ Apollo Research์—์„œ, AI๊ฐ€ ์ธ๊ฐ„์˜ ์˜๋„์— ๋งž๊ฒŒ ํ–‰๋™ํ•˜๋Š” '์ฒ™' ํ•˜๋ฉด์„œ ์ˆจ๊ฒจ์ง„ ๋ชฉ์ ์„ ์ถ”๊ตฌํ•˜๋Š” '์ฑ…๋žต(Scheming)' ํ˜„์ƒ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ์—์„œ, AI๊ฐ€ ์‹œํ—˜์—์„œ ์ผ๋ถ€๋Ÿฌ ๋Šฅ๋ ฅ์„ ์ˆจ๊ธฐ๋Š” '์ƒŒ๋“œ๋ฐฐ๊น…(Sandbagging)' ๊ฐ™์€ ๊ธฐ๋งŒ์  ํ–‰๋™์„ ํ•œ๋‹ค๋Š” ๊ฑธ ํ™•์ธํ•˜๊ธฐ๋„ ํ–ˆ๊ณ , ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์—๊ฒŒ ์•ˆ์ „ ์ˆ˜์น™์„ ๋ช…์‹œ์ ์œผ๋กœ ์•Œ๋ ค์ฃผ๊ณ  ์ด๋ฅผ ์ถ”๋ก ํ•˜๋„๋ก ํ›ˆ๋ จํ•˜๋Š” '์ˆ™๊ณ ์  ์ •๋ ฌ' ๋ฐฉ์‹์„ ๋„์ž…, ์ฑ…๋žต ํ–‰์œ„๋ฅผ ํฌ๊ฒŒ ์ค„์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋ชจ๋ธ์ด ์ž์‹ ์ด ํ‰๊ฐ€๋ฐ›๋Š”๋‹ค๋Š” '์ƒํ™ฉ ์ธ์‹' ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ๋˜๋ฉด์„œ, ํ…Œ์ŠคํŠธ ๊ฒฐ๊ณผ๊ฐ€ ์‹ค์ œ ์ •๋ ฌ์˜ ์ˆ˜์ค€์„ ์™„๋ฒฝํ•˜๊ฒŒ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ƒˆ๋กœ์šด ์•ˆ์ „ ๋ฌธ์ œ๊ฐ€ ๋Œ€๋‘๋˜๊ณ  ์žˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • World Labs Marble: ํ…์ŠคํŠธ๋‚˜ ์ด๋ฏธ์ง€๋งŒ ์žˆ์œผ๋ฉด ์˜๊ตฌ์ ์ด๊ณ  ํƒ์ƒ‰ ๊ฐ€๋Šฅํ•œ 3D ์„ธ๊ณ„๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋„๊ตฌ๋Š” ๊ฐ€์šฐ์‹œ์•ˆ ์Šคํ”Œ๋žซ(Gaussian Splats)์œผ๋กœ ๋‚ด๋ณด๋‚ด๊ฑฐ๋‚˜ ์›น์—์„œ ๋ฐ”๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ๋ณ€ํ™˜ํ•ด ์ค๋‹ˆ๋‹ค. ๋งˆ์น˜ ์ƒ์ƒ ์† ์„ธ๊ณ„๋ฅผ ๋‹จ์ˆจ์— ํ˜„์‹ค๋กœ ๋งŒ๋“œ๋Š” ๋งˆ๋ฒ•๊ณผ ๊ฐ™๋„ค์š”. โ€”> [ํŠธ์œ— ๋ณด๊ธฐ]

  • DeepSeek-V3.1-Terminus: DeepSeek์ด ์ž์‹ ๋“ค์ด ๋งŒ๋“ค์—ˆ๋˜ ์ตœ์ฒจ๋‹จ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํ•œ์ธต ์—…๊ทธ๋ ˆ์ด๋“œํ–ˆ์Šต๋‹ˆ๋‹ค. ์–ธ์–ด ์ผ๊ด€์„ฑ์ด ํ–ฅ์ƒ๋˜์—ˆ๊ณ , ์ฝ”๋“œ ์ž‘์„ฑ๊ณผ ๊ฒ€์ƒ‰ ์—์ด์ „ํŠธ ๊ธฐ๋Šฅ์ด ๊ฐœ์„ ๋˜์—ˆ๊ณ , ์ถ”๋ก  ๋„๊ตฌ๋„ ์ƒˆ๋กญ๊ฒŒ ์—…๋ฐ์ดํŠธ ๋˜์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์›๋ž˜์˜ ๊ฐ•๋ ฅํ•œ ๋Šฅ๋ ฅ์€ ๊ทธ๋Œ€๋กœ ์œ ์ง€ํ•˜๋ฉด์„œ ๋” ์ •๊ตํ•ด์กŒ๋„ค์š”. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Grok 4 Fast: ๋†’์€ ์ •ํ™•๋„์™€ ๋น„์šฉ ํšจ์œจ์„ฑ์„ ์ž๋ž‘ํ•˜๋Š” ์ถ”๋ก  ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋„๊ตฌ๋ฅผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์‚ฌ์šฉํ•˜๊ณ , 200๋งŒ ํ† ํฐ์˜ ๊ธด ๋ฌธ๋งฅ์„ ์ฒ˜๋ฆฌํ•˜๊ณ , ์ถ”๋ก ๊ณผ ๋น„์ถ”๋ก  ๋ชจ๋“œ๋ฅผ ํ•˜๋‚˜๋กœ ํ†ตํ•ฉํ–ˆ์Šต๋‹ˆ๋‹ค. ํšจ์œจ์ ์ด๋ฉด์„œ๋„ ๋˜‘๋˜‘ํ•œ ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ๋„ค์š”. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

Image Credit: Grok ์›น์‚ฌ์ดํŠธ

  • Magistral-Small-2509: 24B ๋งค๊ฐœ๋ณ€์ˆ˜์˜ ์ถ”๋ก  ์ค‘์‹ฌ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. [THINK] ์ถ”์  ํ† ํฐ์„ ํ†ตํ•ด์„œ ์ƒ๊ฐ์˜ ๊ณผ์ •์„ ๋ช…ํ™•ํžˆ ํ•˜๊ณ , 128k ๋ฌธ๋งฅ ๊ธธ์ด๋ฅผ ์ง€์›ํ•˜๊ณ , ํ˜•์‹๊ณผ ํŽ˜๋ฅด์†Œ๋‚˜๋ฅผ ๊ฐœ์„ ํ•ด์„œ ์‹ค์ œ ๋ฐฐํฌํ•ด์•ผ ํ•˜๋Š” ํ™˜๊ฒฝ์— ์ ํ•ฉํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด๋ฏธ์ง€ ์ž…๋ ฅ๊ณผ ๋„๊ตฌ ํ˜ธ์ถœ์„ ์ง€์›ํ•˜๋Š” ํšจ์œจ์ ์ธ ๋ชจ๋ธ๋กœ, ๋‹จ์ผ RTX 4090์ด๋‚˜ 32GB RAM MacBook์—์„œ ๋กœ์ปฌ ์‹คํ–‰์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Apertus: ๋ฐ์ดํ„ฐ ์ค€์ˆ˜์™€ ๋‹ค๊ตญ์–ด ์ปค๋ฒ„๋ฆฌ์ง€๋ฅผ ๊ฐ•์กฐํ•œ ๋ชจ๋ธ๋กœ, ํ—ˆ์šฉ๋œ ์†Œ์Šค๋งŒ ์‚ฌ์šฉํ•ด์„œ ์‚ฌ์ „ ํ›ˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค. Goldfish ๋ชฉํ‘œ ํ•จ์ˆ˜๋กœ โ€˜์•”๊ธฐโ€™๋ฅผ ์–ต์ œํ•˜๊ณ , 8B/70B ๊ทœ๋ชจ์˜ ์™„์ „ ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์•„ํ‹ฐํŒฉํŠธ๋ฅผ ๊ณต๊ฐœํ•˜๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. 1811๊ฐœ ์–ธ์–ด๋ฅผ ์ง€์›ํ•˜๊ณ , ๋ฐ์ดํ„ฐ ์†Œ์œ ์ž์˜ opt-out ๋™์˜๋ฅผ ์กด์ค‘ํ•ด์„œ ํˆฌ๋ช…์„ฑ์„ ๊ฐ•์กฐํ•˜๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • SAIL-VL2 Technical Report: ํ๋ ˆ์ด์…˜๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด์„œ ๋น„์ „-์–ธ์–ด ์Šค์œ„ํŠธ๋ฅผ ํ™•์žฅํ•ด ์ค๋‹ˆ๋‹ค. ์ ์ง„์  ์‚ฌ์ „ ํ›ˆ๋ จ๊ณผ MoE/Thinking-Fusion Post-Training์œผ๋กœ ์ด๋ฏธ์ง€/๋น„๋””์˜ค ์ถ”๋ก  ์ž‘์—…์—์„œ SOTA๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. 2B์™€ 8B ๊ทœ๋ชจ์—์„œ๋Š” ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๊ณ , 106๊ฐœ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ฒฝ์Ÿ๋ ฅ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ์ž…์ฆํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Towards a Physics Foundation Model (GPhyT): ๋‹ค์–‘ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ผ๋ฐ˜ ๋ฌผ๋ฆฌ ๋™์—ญํ•™์„ ํ•™์Šตํ•˜๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋„๋ฉ”์ธ ๊ฐ„ ์ œ๋กœ์ƒท์œผ๋กœ ์•ˆ์ •์ ์ธ ์žฅ๊ธฐ ๋กค์•„์›ƒ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. 1.8TB ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จ๋œ GPhyT๋Š” ๋ฌผ๋ฆฌํ•™์ด๋ผ๋Š” ๊ด€์ ์—์„œ์˜ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•˜๋Š” ๋ชจ๋ธ๋กœ์„œ, ์ „๋ฌธ์ ์ธ ์†”๋ฒ„๋ฅผ ๊ฐœ๋ฐœํ•˜์ง€ ์•Š๊ณ ์„œ๋„ ๊ณ ์ถฉ์‹ค๋„์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ด ์ค๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํŒŒ์šด๋ฐ์ด์…˜ ๋ฐ ํ‘œํ˜„(Representation)

  • Lost in Embeddings: Information Loss in Vision-Language Models: ๋น„์ „-์–ธ์–ด ๋ชจ๋ธ(VLM)์—์„œ ์‹œ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์–ธ์–ด ์ž„๋ฒ ๋”ฉ์œผ๋กœ ๋ฐ”๊พธ๋Š” ๊ณผ์ •์ด ์ •๋ณด๋ฅผ ์™œ๊ณกํ•˜๋Š” ํ˜„์ƒ์„ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ํŒจ์น˜ ์ˆ˜์ค€์˜ ์†์‹ค์„ ์ธก์ •ํ•˜๊ณ  ์ด๋ฅผ VQA(์‹œ๊ฐ ์งˆ๋ฌธ ๋‹ต๋ณ€) ์„ฑ๋Šฅ ์ €ํ•˜์™€ ์—ฐ๊ฒฐํ•ด์„œ, ๋ชจ๋ธ์˜ ์ˆจ์€ ์•ฝ์ ์„ ํŒŒํ—ค์นฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • AToken: A Unified Tokenizer for Vision: ์ด๋ฏธ์ง€, ๋น„๋””์˜ค, 3D ๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ ํ†ตํ•ฉ 4D ์ž ์žฌ ๊ณต๊ฐ„์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์žฌ๊ตฌ์„ฑ๊ณผ ์˜๋ฏธ ์ดํ•ด๋ฅผ ํ•˜๋‚˜๋กœ ๋ฌถ์–ด์„œ ๊ณ ํ’ˆ์งˆ ๊ฒฐ๊ณผ์™€ ํšจ์œจ์„ฑ์„ ๋™์‹œ์— ์žก๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์˜ ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ MARS2 2025 Challenge on Multimodal Reasoning: ์‹ค์„ธ๊ณ„์™€ ์ „๋ฌธ ์ž‘์—…์—์„œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์„ ๊ณต๊ฐœํ•˜๊ณ  ์ˆ˜์‹ญ ๊ฐœ ๋ชจ๋ธ์„ ํ…Œ์ŠคํŠธํ•˜๋ฉด์„œ, MLLM(๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์˜ ํ•œ๊ณ„์™€ ์ž ์žฌ๋ ฅ์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding: MLLM์˜ ์ œ๋กœ์ƒท ์‹œ๊ณต๊ฐ„ ๋น„๋””์˜ค ๊ทธ๋ผ์šด๋”ฉ ๋Šฅ๋ ฅ์„ ๋Œ์–ด์˜ฌ๋ฆฝ๋‹ˆ๋‹ค. ํ…์ŠคํŠธ ์ฟผ๋ฆฌ๋ฅผ ์†์„ฑ๊ณผ ํ–‰๋™ ๋‹จ์„œ๋กœ ๋‚˜๋ˆ ์„œ ๋” ์ •ํ™•ํ•œ ๋น„๋””์˜ค ์œ„์น˜ ํŒŒ์•…์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋กœ๋ณดํ‹ฑ์Šค, ์•ก์…˜ ๋ฐ ์›”๋“œ ๋ชจ๋ธ

  • RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation: ์ธ๊ฐ„์˜ ์กฐ์ž‘ ์˜์ƒ๊ณผ ๊ถค์ ์„ ํ™œ์šฉํ•ด์„œ ๋กœ๋ด‡์˜ ๋™์ž‘์„ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค. 1200๋งŒ ๊ฐœ์˜ ์—๊ณ ์„ผํŠธ๋ฆญ ๋น„๋””์˜ค๋กœ ์‚ฌ์ „ ํ›ˆ๋ จํ•œ ๋’ค ์•ก์…˜ VAE๋กœ ํ–‰๋™์„ ์••์ถ•ํ•ด์„œ VLA ๋ชจ๋ธ์„ ๋” ๋˜‘๋˜‘ํ•˜๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ World Modeling with Probabilistic Structure Integration (by Stanford Neurolab): ๋ฐ์ดํ„ฐ์—์„œ ํ™•๋ฅ ์  ๊ตฌ์กฐ๋ฅผ ์ถ”์ถœํ•ด์„œ ์ œ์–ด ๊ฐ€๋Šฅํ•œ ์›”๋“œ ๋ชจ๋ธ์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ธก, ๊ตฌ์กฐ ์ถ”์ถœ, ํ†ตํ•ฉ์˜ 3๋‹จ๊ณ„๋กœ ๋น„๋””์˜ค ์˜ˆ์ธก๊ณผ ์ดํ•ด๋ฅผ ๊ฐ•ํ™”ํ•˜๋Š” ์Šคํƒ ํฌ๋“œ NeuroAI Lab์˜ ์ฐฝ์˜์ ์ธ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data (Shanghai AI lab): ์œˆ๋„์šฐ, macOS ๋“ฑ 6๊ฐœ OS์™€ 3๊ฐœ ์ž‘์—… ๋„๋ฉ”์ธ์˜ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋กœ ์˜คํ”ˆ์†Œ์Šค ์ปดํ“จํ„ฐ ์‚ฌ์šฉ ์—์ด์ „ํŠธ๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค. GUI ์ž๋™ํ™” ์„ฑ๋Šฅ์„ ์ตœ๊ณ  ์ˆ˜์ค€์œผ๋กœ ๋Œ์–ด์˜ฌ๋ฆฐ ์ƒํ•˜์ด AI ๋žฉ์˜ ์ „๋žต์  ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning (by Zhejiang, Tongyi, Alibaba): ์„ธ๋ฏธ-์˜จ๋ผ์ธ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ GUI ์ž๋™ํ™”๋ฅผ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค. ์˜คํ”„๋ผ์ธ ๊ถค์ ๊ณผ ์˜จ๋ผ์ธ RL์„ ๊ฒฐํ•ฉํ•ด์„œ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์˜ ์•ˆ์ •์„ฑ๊ณผ ํšจ์œจ์„ฑ์„ ๋†’์ด๋Š” ์ €์žฅ ๋Œ€ํ•™, ํ‰์ด ๋žฉ, ์•Œ๋ฆฌ๋ฐ”๋ฐ”์˜ ํ˜์‹ ์ ์ธ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์ถ”๋ก , ์ˆ˜ํ•™ ๋ฐ ๋„๊ตฌ ํ†ตํ•ฉ

  • THOR: Tool-Integrated Hierarchical Optimization via RL for Mathematical Reasoning: ์ˆ˜ํ•™๊ณผ ์ฝ”๋“œ ์ž‘์—…์—์„œ ๋‹จ๊ณ„๋ณ„ ๋„๊ตฌ ํ”ผ๋“œ๋ฐฑ์„ ์ „์ฒด ์ถ”๋ก  ๊ฒฝ๋กœ์™€ ๋งž์ถ”๋Š” ๊ฐ•ํ™”ํ•™์Šต(RL) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค. ๋‹จ๊ณ„๋ณ„๋กœ ๋„๊ตฌ(์˜ˆ: ๊ณ„์‚ฐ๊ธฐ)๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์ตœ์ ํ™”ํ•ด์„œ, ๋” ์ •ํ™•ํ•œ ์ˆ˜ํ•™์  ์ถ”๋ก ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ํผ์ฆ์„ ํ’€ ๋•Œ ๊ฐ ์กฐ๊ฐ์„ ์‹ ์ค‘ํžˆ ๋งž์ถฐ๊ฐ€๋ฉด์„œ ํฐ ๊ทธ๋ฆผ์„ ์™„์„ฑํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Improving Context Fidelity via Native Retrieval-Augmented Reasoning (by DIRO, MetaGPT, Mila, McGill, Yale, CIFAR): ๊ฒ€์ƒ‰๋œ ์ฆ๊ฑฐ๋ฅผ ์ถ”๋ก  ๊ณผ์ •์— ์ง์ ‘ ํ†ตํ•ฉํ•˜๋„๋ก ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ต๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰๋œ ์ •๋ณด๋ฅผ ๋ฌธ๋งฅ์— ์ถฉ์‹คํžˆ ๋ฐ˜์˜ํ•ด ๋‹ต๋ณ€์˜ ์‹ ๋ขฐ์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉ์‹์œผ๋กœ, ๋งˆ์น˜ ์ž๋ฃŒ๋ฅผ ๊ผผ๊ผผํžˆ ์ฝ๊ณ  ์ •๋ฆฌํ•ด ์ •ํ™•ํ•œ ๋‹ต์„ ๋‚ด๋†“๋Š” ์—ฐ๊ตฌ์ž์ฒ˜๋Ÿผ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.
    โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ ToolRM: Outcome Reward Models for Tool-Calling Large Language Models (by IBM Research): ๋„๊ตฌ๋ฅผ ํ™œ์šฉํ•˜๋Š” ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ์œ„ํ•œ ๊ฒฐ๊ณผ ์ค‘์‹ฌ ๋ณด์ƒ ๋ชจ๋ธ์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ๋„๊ตฌ ํ˜ธ์ถœ์— ํŠนํ™”๋œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋งŒ๋“ค๊ณ , ๋ณด์ƒ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ด์„œ ์ถ”๋ก  ์ •ํ™•๋„๋ฅผ ๋†’์ž…๋‹ˆ๋‹ค. IBM ์—ฐ๊ตฌ์†Œ๊ฐ€ ๋„๊ตฌ์™€ AI์˜ ํ˜‘์—…์„ ํ•œ์ธต ๊ฐ•ํ™”ํ•œ ์…ˆ์ด๋„ค์š”. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๊ฐ•ํ™”ํ•™์Šต ๋ฐ ์ •๋ ฌ(Alignment)

  • ๐ŸŒŸ Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting (by University of Notre Dame, Amazon): ์—ฌ๋Ÿฌ ๋ชฉํ‘œ๋ฅผ ๋™์‹œ์— ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋ณด์ƒ ๊ฐ€์ค‘์น˜๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ถ”๋ก ๊ณผ ์ •๋ ฌ์—์„œ ํŒŒ๋ ˆํ†  ์ตœ์  Frontier๋ฅผ ํƒ์ƒ‰ํ•ด์„œ, ๋งˆ์น˜ ์—ฌ๋Ÿฌ ๋ชฉํ‘œ๋ฅผ ์ €๊ธ€๋งํ•˜๋“ฏ ๊ท ํ˜• ์žกํžŒ ์ตœ์ ํ™”๋ฅผ ์ด๋ฃจ์–ด๋ƒ…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Single-stream Policy Optimization: ๊ธฐ์กด์˜ ๊ทธ๋ฃน ๊ธฐ๋ฐ˜ ๊ธฐ์ค€ ๋Œ€์‹  ์ง€์†์ ์œผ๋กœ ์ „์—ญ ์ถ”์ ์„ ์‹คํ–‰ํ•ด์„œ ๊ฐ•ํ™”ํ•™์Šต(RL) ์ตœ์ ํ™”๋ฅผ ๋” ๋ถ€๋“œ๋Ÿฝ๊ณ  ํ™•์žฅ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ค์–ด ์ค๋‹ˆ๋‹ค. ์ •์ฑ… ํ•™์Šต์„ ๊ฐ„์†Œํ™”ํ•ด์„œ, ๋งˆ์น˜ ๋ณต์žกํ•œ ๊ธธ์„ ๋‹จ์ˆœํ•œ ํ•œ ์ค„ ํŠธ๋ž™์œผ๋กœ ๋ฐ”๊พธ๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ํšจ๊ณผ๋ฅผ ์ค๋‹ˆ๋‹ค.
    โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Deliberation: ํ…Œ์ŠคํŠธ ํƒ€์ž„์— ์„ฑ์ฐฐ๊ณผ ์ˆ˜์ • ์ž‘์—…์„ ํ†ตํ•ด์„œ ์•ˆ์ „์„ฑ์ด๋‚˜ ํ–‰๋™ ๊ทœ๋ฒ”์— ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ ๋งž์ถ”๋Š” ๋ฐฉ๋ฒ•์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. AI๊ฐ€ ์ƒํ™ฉ์— ๋งž์ถฐ ์Šค์Šค๋กœ ์กฐ์ •ํ•˜๋ฉด์„œ ๋” ๋‚˜์€ ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • FlowRL: Matching Reward Distributions for LLM Reasoning: ๋‹จ์ผ ๋ณด์ƒ ๊ฐ’ ๋Œ€์‹  ์ „์ฒด ๋ณด์ƒ ๋ถ„ํฌ๋ฅผ ๋งž์ถ”๋Š” ๋ฐฉ์‹์œผ๋กœ, ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ๋‹ค์–‘ํ•œ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ์žฅ๋ คํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ํ•œ ๊ฐ€์ง€ ๋‹ต๋ณ€๋งŒ ๊ณ ์ง‘ํ•˜์ง€ ์•Š๊ณ  ์—ฌ๋Ÿฌ ๊ฐ€๋Šฅ์„ฑ์„ ์—ด์–ด๋‘๋Š” ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์••์ถ•, ํšจ์œจ์„ฑ ๋ฐ ํŠน์ˆ˜ ํ›ˆ๋ จ

  • ๐ŸŒŸ Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs (by ETH Zurich): ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ฐ€์ง€์น˜๊ธฐ(Pruning)์™€ ์–‘์žํ™”(Quantization)๋ฅผ ์˜ค๋ฅ˜ ๋ณด์ •์„ ํ†ตํ•ด ์กฐํ™”์‹œ์ผœ์„œ, ์žฌํ›ˆ๋ จ ์—†์ด๋„ ํšจ์œจ์„ฑ์„ ๊ทน๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ๋‹ค์ด์–ดํŠธ ์‹œํ‚ค๋ฉด์„œ๋„ ํž˜์„ ์žƒ์ง€ ์•Š๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • GAPrune: Gradient-Alignment Pruning for Domain-Aware Embeddings: ๋„๋ฉ”์ธ๋ณ„ ์ค‘์š”๋„๋ฅผ ๊ณ ๋ คํ•œ ๊ฐ€์ง€์น˜๊ธฐ๋กœ, ํŠน์ • ๋ถ„์•ผ์˜ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค„์ž…๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ๋ถ€๋ถ„๋งŒ ๋‚จ๊ธฐ๊ณ  ๋ถˆํ•„์š”ํ•œ ๋ถ€๋ถ„์„ ๊น”๋”ํžˆ ์ •๋ฆฌํ•˜๋Š” ๋ฐฉ์‹์ด์—์š”. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • zELO: ELO-inspired Training Method for Rerankers and Embedding Models: ์ˆœ์œ„ ๋งค๊ธฐ๊ธฐ๋ฅผ ELO ์ ์ˆ˜ ์‹œ์Šคํ…œ์ฒ˜๋Ÿผ ์žฌ๊ตฌ์„ฑํ•ด์„œ, ๊ฐ๋…์ด ์—†์ด๋„ ๊ฐ•๋ ฅํ•œ ๋ฆฌ๋žญ์ปค์™€ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ๊ฒŒ์ž„์—์„œ ์‹ค๋ ฅ์— ๋”ฐ๋ผ ์ˆœ์œ„๋ฅผ ๋งค๊ธฐ๋“ฏ ํšจ์œจ์ ์ธ ํ•™์Šต์„ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.