• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#81: 2025แ„‚แ…งแ†ซ, แ„Œแ…ฎแ„†แ…ฉแ†จแ„’แ…ขแ„‹แ…ฃ แ„’แ…กแ†ฏ แ„’แ…ขแ†จแ„‰แ…ตแ†ท AI แ„€แ…ขแ„‚แ…งแ†ท

๐ŸŒFOD#81: 2025แ„‚แ…งแ†ซ, แ„Œแ…ฎแ„†แ…ฉแ†จแ„’แ…ขแ„‹แ…ฃ แ„’แ…กแ†ฏ แ„’แ…ขแ†จแ„‰แ…ตแ†ท AI แ„€แ…ขแ„‚แ…งแ†ท

แ„€แ…ฎแ„ƒแ…ฉแ†จแ„Œแ…ก แ„‹แ…งแ„…แ…ฅแ„‡แ…ฎแ†ซ แ„€แ…กแ†ทแ„‰แ…กแ„’แ…กแ†ธแ„‚แ…ตแ„ƒแ…ก! แ„€แ…ฅแ†ซแ„€แ…กแ†ผแ„’แ…กแ†ซ แ„‹แ…งแ†ซแ„†แ…กแ†ฏ, แ„’แ…ขแ†ผแ„‡แ…ฉแ†จแ„’แ…กแ„€แ…ฉ แ„‰แ…ตแ†ซแ„‚แ…กแ„‚แ…ณแ†ซ แ„‰แ…ขแ„’แ…ข แ„†แ…กแ†ฝแ„‹แ…ตแ„’แ…กแ„‰แ…ฆแ„‹แ…ญ!

ํŠœ๋ง ํฌ์ŠคํŠธ ๊ตฌ๋…์ž ์—ฌ๋Ÿฌ๋ถ„, ํ–‰๋ณตํ•œ ์—ฐ๋ง ์—ฐ์‹œ ๋˜์„ธ์š”!

๊ตฌ๋…์ž ์—ฌ๋Ÿฌ๋ถ„, 2024๋…„์„ ์˜๋ฏธ์žˆ๊ฒŒ ๋งˆ๋ฌด๋ฆฌํ•˜๋Š” ์—ฐ๋ง, 2025๋…„์„ ํž˜์ฐจ๊ฒŒ ์‹œ์ž‘ํ•˜๋Š” ์ƒˆํ•ด ๋งž์ดํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค!

2024๋…„ 6์›” ๋ง ํ…Œ์ŠคํŠธ ํฌ์ŠคํŒ…์„ ์‹œ์ž‘ํ•˜๊ณ , ๊ณต์‹์ ์œผ๋กœ๋Š” 8์›” ์ดˆ ์‹œ์ž‘ํ•œ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„๊ฐ€ ๋ฒŒ์จ ์ด๋ฒˆ FOD#81๋กœ โ€˜100๋ฒˆ์งธโ€™ ํฌ์ŠคํŒ…์„ ํ•˜๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. 2024๋…„์˜ ๋งˆ์ง€๋ง‰ ํฌ์ŠคํŒ…์ด 100๋ฒˆ์งธ ํฌ์ŠคํŒ…์ด ๋˜์—ˆ๋„ค์š”.

4๊ฐœ์›”์ด ์กฐ๊ธˆ ๋„˜๋Š” ๊ธฐ๊ฐ„๋™์•ˆ 500๋ถ„์ด ๋„˜๊ฒŒ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์…จ๋Š”๋ฐ์š”, ๋„ˆ๋ฌด๋‚˜ ๊ฐ์‚ฌ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๊พธ์ค€ํžˆ ๊ธ€ ๋ด ์ฃผ์‹œ๊ณ  ํ”ผ๋“œ๋ฐฑ๋„ ์ฃผ์‹  ๊ตฌ๋…์ž๋ถ„๋“ค๋„ ๋งŽ์ด ๊ณ„์‹ ๋ฐ, ์•ž์œผ๋กœ๋„ ๊ณ„์†ํ•ด์„œ ๋‹ค์–‘ํ•œ ๊ด€์ ์˜ AI ์—ฐ๊ตฌ, ์‚ฐ์—…, ์‚ฌํšŒ์— ๋Œ€ํ•œ ๊ธ€๋“ค๊ณผ ์ƒ๊ฐ๋“ค์„ ๋ชจ์•„์„œ ๊ณต์œ ํ•ด ๋“œ๋ฆฌ๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

2025๋…„์—๋Š” ๊ตฌ๋…์ž ๋ถ„๋“ค๋„ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ๊ธ€์„ ๋‹ค๋ฅธ ๋ถ„๋“ค๊ณผ ํŽธํ•˜๊ฒŒ ๋‚˜๋ˆ„๊ณ  ์˜์‚ฌ์†Œํ†ต๋„ ํ•˜์‹œ๊ณ , ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์™€ ๊ตฌ๋…์ž ๋ถ„๋“ค๊ณผ๋„ ์˜๋ฏธ์žˆ๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ๋กœ์„œ ํ•จ๊ป˜ AI ํŒ์— ๋Œ€ํ•ด์„œ ๋ฐฐ์šฐ๊ธฐ๋„ ํ•˜๊ณ  ์˜๊ฒฌ์„ ๋‚˜๋ˆ ๋ณผ ์ˆ˜ ์žˆ๋Š” ์žฅ์น˜๋ผ๋“ ๊ฐ€ ๊ธฐํšŒ๋ฅผ ๋งŒ๋“ค์–ด๋ณด๊ณ ์ž ๊ณ ๋ฏผํ•  ์ƒ๊ฐ์ด๋‹ˆ, ๋งŽ์€ ๊ธฐ๋Œ€๋„ ๋ถ€ํƒ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.

์ž, ๊ทธ๋Ÿผ 2024๋…„์˜ ๋งˆ์ง€๋ง‰ ํฌ์ŠคํŠธ์ด์ž ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ 100๋ฒˆ์งธ ๊ธ€, FOD#81 ์‹œ์ž‘ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค!

์ƒˆํ•ด๋งž์ด ์ค€๋น„์šด๋™: ๊ด€์‹ฌ์„ ๊ฐ€์ ธ์•ผ ํ•  ํ•ต์‹ฌ์ ์ธ AI ๊ฐœ๋…๋“ค

์ฑ—GPT๊ฐ€ 2022๋…„ 11์›” ๊ณต๊ฐœ๋œ ์ดํ›„ ์ „ ์„ธ๊ณ„์ ์œผ๋กœ LLM ๊ฐœ๋ฐœ ๊ฒฝ์Ÿ์ด ์ง€๊ธˆ๊นŒ์ง€๋„ ๊ฐ€์†ํ™”๋˜๊ณ  ์žˆ์ฃ . ์ง€๋‚œ ์ฃผ ์žˆ์—ˆ๋˜ ์˜คํ”ˆAI์˜ o3 ๋ฐœํ‘œ ์—ญ์‹œ AI ์ปค๋ฎค๋‹ˆํ‹ฐ์— ํฐ ์ถฉ๊ฒฉ์„ ์คฌ๋Š”๋ฐ์š”. ARC-AGI ์ฑŒ๋ฆฐ์ง€์™€ FrontierMath ๋ฒค์น˜๋งˆํฌ์—์„œ ๋ณด์—ฌ์ค€ ๋†€๋ผ์šด ๊ฒฐ๊ณผ๋Š” ์ถ”๋ก , ๊ฒ€์ƒ‰, ํ‰๊ฐ€, ๊ทธ๋ฆฌ๊ณ  AGI๋ผ๋Š” ๋‚œํ•ดํ•œ ๋ชฉํ‘œ๋ฅผ ๋‘˜๋Ÿฌ์‹ผ ๋…ผ์Ÿ์„ ๋‹ค์‹œ ๋ถˆ๋Ÿฌ์ผ์œผํ‚ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

2025๋…„์—๋Š” ๋˜ ์–ด๋–ค ์ด์Šˆ๋“ค์ด ๋งŽ์€ ๋ถ„๋“ค์˜ ๊ด€์‹ฌ์„ ๋ฐ›๊ฒŒ ๋ ๊นŒ์š”? ์ฃผ๋ชฉํ•˜๊ณ  ๊ด€์‹ฌ์„ ๊ฐ€์ ธ์•ผ ํ•  ๋งŒํ•œ ๋ช‡ ๊ฐ€์ง€ ํ•ต์‹ฌ์ ์ธ ์ฃผ์ œ์— ๋Œ€ํ•ด์„œ ์ด์•ผ๊ธฐํ•ด ๋ณผ๊นŒ ํ•ฉ๋‹ˆ๋‹ค:

๊ฐ•ํ™” ํ•™์Šต (Reinforcement Learning), ์‹คํ—˜์‹ค์„ ๋ฒ—์–ด๋‚˜ ํ˜„์‹ค๋กœ

๊ฒŒ์ž„, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์œ„ํ•œ ๋ถ„์•ผ๋กœ ์‹œ์ž‘ํ–ˆ๋˜ ๊ฐ•ํ™” ํ•™์Šต์ด, ์ด์ œ๋Š” ๋…ธ์ด์ฆˆ๊ฐ€ ๋งŽ๊ณ  ๋ณต์žกํ•˜๊ณ  ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์šด โ€˜์‹ค์ œ ํ™˜๊ฒฝโ€™์—์„œ์˜ ์ž์œจ์„ฑ์„ ๋‹ด๋ณดํ•˜๊ธฐ ์œ„ํ•œ ํ•ต์‹ฌ ๊ธฐ๋ฒ•์ด ๋  ๊ฒƒ์ธ๊ฐ€ ํ•˜๋Š”, ์˜๋ฏธ์žˆ๋Š” ์ „ํ™˜ ๋‹จ๊ณ„์— ๋“ค์–ด์„œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ์ „ํ™˜์„ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ์ž˜ ์ด๋ค„๋‚ผ ๊ฒƒ์ด๋ƒ ํ•˜๋Š” ๋ฌธ์ œ๋Š” ์ƒ๊ฐ๋งŒํผ ๊ฐ„๋‹จํ•˜์ง€๋Š” ์•Š์„ ์ˆ˜ ์žˆ๋Š”๋ฐ์š”. ๊ฐ•ํ™” ํ•™์Šต์˜ ์ค‘์š” ๋ฌธ์ œ ์ค‘ ํ•˜๋‚˜์ธ โ€˜Reward Function Misspecification (๋ณด์ƒ ํ•จ์ˆ˜์˜ ์ž˜๋ชป๋œ ์„ค๊ณ„)โ€™ ๋•Œ๋ฌธ์— ์šฐ๋ฆฌ๊ฐ€ ์ „ํ˜€ ์˜๋„ํ•˜์ง€ ์•Š์€, ๋•Œ๋กœ๋Š” ์˜๋„์™€ ์ •๋ฐ˜๋Œ€์˜ ํ–‰๋™์„ ์œ ๋„ํ•˜์ง€ ์•Š๋„๋ก ํ•˜๋ฉด์„œ, ์–ด๋–ป๊ฒŒ ์—ฌ๋Ÿฌ ์—์ด์ „ํŠธ๋“ค์„ ํ•˜๋‚˜์˜ ๋ชฉํ‘œ๋กœ ์ด๋Œ์–ด๊ฐˆ ์ˆ˜ ์žˆ์„๊นŒ์š”?

Reward Engineering (๋ณด์ƒ ์—”์ง€๋‹ˆ์–ด๋ง) ๊ทธ ์ž์ฒด๊ฐ€ ์ด์ œ๋Š” ๋‹จ์ˆœํžˆ โ€˜๊ฒฐ๊ณผโ€™ ๋ฟ์ด ์•„๋‹ˆ๋ผ ๊ทธ ๊ฒฐ๊ณผ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋‹ฌ์„ฑ๋˜๋Š”์ง€์—๊นŒ์ง€ ์ดˆ์ ์„ ๋งž์ถ”๋Š”, ์„ฌ์„ธํ•˜๊ณ  ์„ธ๋ จ๋œ ๊ธฐ์ˆ ์ด ๋˜์–ด๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ณ„์†ํ•ด์„œ ๋ณ€ํ™”ํ•˜๋Š” ๋ชฉํ‘œ์— ๋งž์ถฐ์„œ ์ง€์†์ ์œผ๋กœ ์žฌ์กฐ์ •ํ•˜๋Š” Dynamic Reward System (๋™์ ์ธ ๋ณด์ƒ ์‹œ์Šคํ…œ)์ด ๋ฐ”๋กœ ๋” ์Šค๋งˆํŠธํ•˜๊ณ  ๋ฐ˜์‘์„ฑ๋„ ๋†’์€ ์—์ด์ „ํŠธ๋ฅผ ๋งŒ๋“œ๋Š” ๊ธธ์„ ์—ด์–ด์ฃผ๊ณ  ์žˆ๋Š” ๊ฒ๋‹ˆ๋‹ค.

๋˜, ํ•œ๋•Œ ์ฒด์Šค๋‚˜ ๋ฐ”๋‘‘ ๊ฐ™์€ ๊ฒŒ์ž„์˜ ์˜์—ญ์œผ๋กœ๋งŒ ์—ฌ๊ฒจ์กŒ๋˜ โ€˜ํŠธ๋ฆฌ ํƒ์ƒ‰ (Tree Search)โ€™ ๊ธฐ๋ฒ•๋„ ๋‚˜๋ฆ„์˜ ์ƒˆ๋กœ์šด ๋ฅด๋„ค์ƒ์Šค๋ฅผ ๊ฒฝํ—˜ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ํŠธ๋ฆฌ ํƒ์ƒ‰ ๊ธฐ๋ฒ•์ด ๋‹ค์–‘ํ•œ ๊ณ„ํš ์ˆ˜๋ฆฝ, ์˜์‚ฌ ๊ฒฐ์ • ๊ณผ์ •์—์„œ ์œ ์šฉํ•˜๊ฒŒ ์ ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด ํ™•์ธ๋˜๋ฉด์„œ, ๊ฐ•ํ™” ํ•™์Šต, ์‹ฌ์ง€์–ด๋Š” AutoML๊ณผ๋„ ๊ต์ง‘ํ•ฉ์„ ๋งŒ๋“ค์–ด๋‚ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

โ€˜์ถ”๋ก  (Inference)โ€™์˜ ์ƒˆ๋กœ์šด ์ง€ํ‰: ์ง„ํ™”ํ•˜๋Š” ์ ์‘ํ˜• ์ง€๋Šฅ์œผ๋กœ์˜ ๊ธธ

โ€˜์ถ”๋ก  (Inference)โ€™. ๋จธ์‹  ๋Ÿฌ๋‹ ์ž‘์—…์˜ ์ „์ฒด ๋ผ์ดํ”„์‚ฌ์ดํด ๊ด€์ ์—์„œ, ์ „ํ†ต์ ์œผ๋กœ โ€˜์ถ”๋ก โ€™์€ ๋ชจ๋ธ์ด ์˜ˆ์ธก๊ฐ’์„ ์ถœ๋ ฅํ•˜๊ฑฐ๋‚˜ ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๋Š”, โ€˜์ •์ ์ธ (Static)โ€™, ์ตœ์ข…์˜ ์ง€์ ์ด์—ˆ์ฃ . ์ด์ œ๋Š” ๊ทธ โ€˜์ถ”๋ก โ€™ ์ž์ฒด๊ฐ€ ์•„์ฃผ ๋™์ ์ธ (Dynamic) ๊ณผ์ •์œผ๋กœ ๋ณ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

AI๊ฐ€ ๋งฅ๋ฝ์„ ์ดํ•ดํ•˜๊ณ  ์ƒํ™ฉ์— ๋งž์ถฐ ์ ์‘ํ•˜๋ฉด์„œ ์ถ”๋ก ์„ ํ•˜๋Š” ์ด๋Ÿฐ ๋ณ€ํ™”๋Š” AI์˜ ์ƒˆ๋กœ์šด ์žฅ์„ ์—ด์—ˆ์ง€๋งŒ, ๋™์‹œ์— ์ƒˆ๋กœ์šด ๋„์ „๋„ ํ•จ๊ป˜ ๊ฐ€์ ธ์™”์ฃ .

๊ฐ€์žฅ ํฐ ๊ณผ์ œ๋Š” ๋ฐ”๋กœ ์ปดํ“จํŒ… ์ž์›์„ ์–ด๋–ป๊ฒŒ ํšจ์œจ์ ์œผ๋กœ ํ™œ์šฉํ•  ๊ฑฐ๋ƒ์™€ ๋ฐ€์ ‘ํ•˜๊ฒŒ ๊ด€๋ จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ช‡๋ช‡ ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ๋“ค์€, ์‹ฌ์ง€์–ด ์ž‘์€ ๋„์‹œ ํ•˜๋‚˜๊ฐ€ ์“ฐ๋Š” ๋งŒํผ์˜ ์ „๋ ฅ์„ ์‚ฌ์šฉํ•œ๋‹ค๋Š” ์ ์„ ์ƒ๊ฐํ•ด ๋ณด๋ฉด, ์‹ค์ œ ์‚ฌ์šฉ ํ™˜๊ฒฝ์—์„œ ์ปดํ“จํŒ… ์—ฐ์‚ฐ์„ ํšจ์œจ์ ์œผ๋กœ ํ•˜๋Š” ๊ฑด ๊ฝค ์ค‘์š”ํ•œ ๋ฌธ์ œ๋ผ๊ณ  ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๋‹คํ–‰ํžˆ, ๊ฒฝ๋Ÿ‰ํ™”๋œ ํŠธ๋ ˆ์ด๋‹ ๋ฐฉ๋ฒ•, ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• (Data Augmentation) ๊ธฐ์ˆ  ๋“ฑ์ด ๊ณ„์† ๋ฐœ์ „ํ•˜๋ฉด์„œ, ๊ณผ๋„ํ•˜๊ฒŒ ์ž์›์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ ๋„ AI์˜ ์„ฑ๋Šฅ๊ณผ ์ ์‘๋ ฅ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธธ์ด ์—ด๋ฆฌ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฌผ๋ก , Inference Compute๊ฐ€ ๋ฐœ์ „ํ•œ๋‹ค๊ณ  ํ•ด์„œ Training Compute๊ฐ€ ์ค‘์š”ํ•˜์ง€ ์•Š์€ ๊ฑด ์•„๋‹™๋‹ˆ๋‹ค. Image Credit: Lennart Heim

๊ฒฐ๊ตญ์€, ๊ณ ์„ฑ๋Šฅ ์„œ๋ฒ„์—์„œ๋ฟ ์•„๋‹ˆ๋ผ ์šฐ๋ฆฌ๊ฐ€ ์ผ์ƒ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ์Šค๋งˆํŠธํฐ, ์›จ์–ด๋Ÿฌ๋ธ” ๊ธฐ๊ธฐ, IoT ์žฅ์น˜ ๋“ฑ์—์„œ๋„ AI๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋  ๊ฒ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ , ์ด๋Ÿฐ ํ๋ฆ„์€, ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ AI ๋ฐœ์ „์˜ ์ƒˆ๋กœ์šด ์ „ํ™˜์ ์ด ๋  โ€˜์—ฐํ•ฉ ํ•™์Šต (Federated Learning)โ€™์˜ ํ˜์‹ ์œผ๋กœ ์ด์–ด์ง‘๋‹ˆ๋‹ค.

์—ฐํ•ฉ ํ•™์Šต: โ€˜๋ถ„์‚ฐํ™”๋œ ์ง€๋Šฅโ€™์œผ๋กœ ๊ฐ€๋Š” ํŒจ๋Ÿฌ๋‹ค์ž„

โ€˜์—ฐํ•ฉ ํ•™์Šต (Federated Learning)โ€™์ด AI ๋ถ„์•ผ์—์„œ ํ˜‘์—…์˜ ๊ฐœ๋…์„ ์™„์ „ํžˆ ์ƒˆ๋กญ๊ฒŒ ์ •์˜ํ•˜๊ฒŒ ๋  ๊ฒ๋‹ˆ๋‹ค. ๋ฏผ๊ฐํ•œ ๋ฐ์ดํ„ฐ๋Š” ๋กœ์ปฌ ์ €์žฅ์†Œ์— ์•ˆ์ „ํ•˜๊ฒŒ ๋ณด๊ด€ํ•˜๋ฉด์„œ๋„ ๋ถ„์‚ฐ๋œ ํ™˜๊ฒฝ์—์„œ ๋ชจ๋ธ ํ•™์Šต์„ ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ํŠน์ง• ๋•๋ถ„์—, ์—ฐํ•ฉ ํ•™์Šต์€ ์˜๋ฃŒ๋‚˜ ๊ธˆ์œต๊ณผ ๊ฐ™์ด ํ”„๋ผ์ด๋ฒ„์‹œ๊ฐ€ ์ค‘์š”ํ•œ ๋ถ„์•ผ์—์„œ ํ•„์ˆ˜์ ์ธ ๊ธฐ์ˆ ๋กœ ์ž๋ฆฌ์žก๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ ‡์ง€๋งŒ, ๊ทธ ์ž ์žฌ๋ ฅ์€ ์ด ์˜์—ญ๋“ค์„ ํ›จ์”ฌ ๋›ฐ์–ด๋„˜์Šต๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์—์„œ์˜ ์—ฐํ•ฉ ํ•™์Šต์€ ๋ถ„์‚ฐ๋œ ํ˜‘์—…์„ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ด ์ฃผ๊ณ ์š”. ๊ฐ•ํ™” ํ•™์Šต ๋ถ„์•ผ์—์„œ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€์ž…๋‹ˆ๋‹ค. ์—ฐํ•ฉ ํ•™์Šต ๊ธฐ์ˆ ์„ ํ†ตํ•ด์„œ ์—ฃ์ง€ ๋””๋ฐ”์ด์Šค๋‚˜ ๋…๋ฆฝ๋œ ์‹œ์Šคํ…œ ๋“ฑ ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์—์„œ ์ž‘๋™ํ•˜๋Š” ์—์ด์ „ํŠธ๋“ค์ด ๊ฐ์ž ๊ณ„์†ํ•ด์„œ ๊ฒฝํ—˜์„ ์Œ“์œผ๋ฉด์„œ๋„, ๋™์‹œ์— ์ „์ฒด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Localized Adaptability (๋กœ์ปฌ์˜ ์ ์‘์„ฑ), ๊ทธ๋ฆฌ๊ณ  Global Optimization (์ „์ฒด ์ตœ์ ํ™”)์„ ๊ฒฐํ•ฉํ•œ ์—ฐํ•ฉ ํ•™์Šต์ด ์ฐจ์„ธ๋Œ€ AI์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ ๋กœ ํ™•์‹คํžˆ ์ž๋ฆฌ์žก์„ ๊ฒ๋‹ˆ๋‹ค. ๋‹จ์ˆœํ•œ ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ๋„๊ตฌ๋ฅผ ๋„˜์–ด์„œ, ๋‹ค์–‘ํ•œ, ๊ทธ๋ฆฌ๊ณ  ์ž์›์ด ์ œํ•œ๋œ ํ™˜๊ฒฝ์—์„œ๋„ AI์˜ ๊ฐ€์น˜๋ฅผ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ํฌ๊ด„์ ์ธ ํ”„๋ ˆ์ž„์›์œผ๋กœ ์ž๋ฆฌ์žก๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—ฐํ•ฉ ํ•™์Šต์€ ์•ž์œผ๋กœ๋„ ๊ณ„์† ์ค‘์š” ํ‚ค์›Œ๋“œ์˜ ํ•˜๋‚˜๊ฐ€ ๋  โ€˜AI์™€ ๋ธ”๋ก์ฒด์ธ์˜ ๊ฒฐํ•ฉโ€™ ๊ด€์ ์—์„œ๋„ ํ•˜๋‚˜์˜ ์ค‘์š” ๊ธฐ์ˆ ๋กœ ๊ฐ๊ด‘๋ฐ›์œผ๋ฆฌ๋ผ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๋ณต์žก์„ฑ์˜ ์‹œ๋Œ€, AI ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ํ™•์žฅ

์˜์–ด๋กœ โ€˜Inferenceโ€™์™€ โ€˜Reasoningโ€™์ด ๋ชจ๋‘ ํ•œ๊ธ€๋กœ๋Š” โ€˜์ถ”๋ก โ€™ ์™ธ์—๋Š” ์ ํ•ฉํ•œ ๋‹จ์–ด๊ฐ€ ์—†๋Š” ๊ฒƒ ๊ฐ™์€๋ฐ์š”. ์ด ๊ธ€์˜ ๋งฅ๋ฝ ์•ˆ์—์„œ๋Š”, ๊ฐ„๋‹จํ•˜๊ฒŒ Reasoning์€ ์ถ”๋ก  ๊ทธ ์ž์ฒด๋ฅผ, Inference๋Š” ์ถ”๋ก ์˜ ๊ณผ์ •์ด๋‚˜ ํ–‰์œ„ ์ „์ฒด๋ฅผ ์ด์•ผ๊ธฐํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ๋‹จ์–ด๋ผ๊ณ  ์ƒ๊ฐํ•ด ์ฃผ์‹œ๋ฉด ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค.

ํŽธ์ง‘์ž

AI ์‹œ์Šคํ…œ์ด ์ ์  ๋” โ€˜์‚ฌ๋žŒ๊ณผ ๋น„์Šทํ•˜๊ฒŒ ๋ณด์ด๋Š”โ€™ ์ถ”๋ก  ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜๋ฉด์„œ, โ€˜๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ํ•™์Šตโ€™๊ณผ โ€˜๋…ผ๋ฆฌ์ ์ธ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ์ถ”๋ก โ€™์„ ๊ฒฐํ•ฉํ•œ '๋‰ด๋กœ-์‹ฌ๋ณผ๋ฆญ (Neuro-Symbolic)' ์ ‘๊ทผ ๋ฐฉ๋ฒ•์ด ์œ ๋งํ•œ ์—ฐ๊ตฌ ๋ถ„์•ผ๋กœ ๋– ์˜ฌ๋ž์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ํ•˜์ด๋ธŒ๋ฆฌ๋“œํ˜• ๊ธฐ๋ฒ•์€, ์ง๊ด€๊ณผ ๊ตฌ์กฐํ™”๋œ ๋…ผ๋ฆฌ๋ฅผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋Š” ์‚ฌ๋žŒ์˜ ์‚ฌ๊ณ ๋ฐฉ์‹๊ณผ ๋งž๋‹ฟ์•„ ์žˆ๊ณ , ๋” ๋ณดํŽธ์ ์ธ ํ˜•ํƒœ์˜ AI๋ฅผ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๋™์‹œ์—, ARC-AGI ์ฑŒ๋ฆฐ์ง€ ๊ฐ™์€ ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ๋“ค์ด AI์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฒ€์ฆํ•˜๋Š” ์‹œํ—˜๋Œ€๋กœ ๋“ฑ์žฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ AI๊ฐ€ ๋ญ˜ ํ•  ์ˆ˜ ์žˆ๋Š๋ƒ๋ฅผ ๋„˜์–ด์„œ, ์ถ”์ƒํ™”๋‚˜ ์ผ๋ฐ˜ํ™”๋ฅผ ์–ผ๋งˆ๋‚˜ ์ž˜ ํ•˜๊ณ , ์„œ๋กœ ๋‹ค๋ฅธ ๋‹ค์–‘ํ•œ ์˜์—ญ์„ ๋„˜๋‚˜๋“ค๋ฉด์„œ ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ๋‚˜๋ฅผ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฒค์น˜๋งˆํฌ๋“ค์€, โ€˜AI์˜ ๋ฐœ์ „์ด๋ผ๋Š” ๊ฒŒ ๋‹จ์ˆœํ•˜๊ฒŒ ๊ฐœ๋ณ„ ์ž‘์—…์„ ๋›ฐ์–ด๋‚˜๊ฒŒ ์ž˜ ํ•˜๋Š” ๊ฑธ ๋„˜์–ด์„œ ์ง€๋Šฅ ๊ทธ ์ž์ฒด์— ๋Œ€ํ•ด ๋” ๊นŠ์€ ์ดํ•ด๋ฅผ ํ•˜๊ฒŒ ํ•ด ์ฃผ๋Š” ๊ฒƒ์ด๋‹คโ€™๋ผ๋Š” ์ ์„ ์ƒ๊ฐํ•ด ๋ณด๊ฒŒ ํ•ด ์ฃผ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ARC-AGI๋ฅผ ๋งŒ๋“  Francois Chollet์€ 2025๋…„์— ARC-AGI 2๋ฅผ ๊ณต๊ฐœํ•˜๊ฒ ๋‹ค๊ณ  ์˜ˆ๊ณ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ARC-AGI, ๊ทธ๋ฆฌ๊ณ  ์ง€๋Šฅ์„ ์–ด๋–ป๊ฒŒ ์ธก์ •ํ•  ๊ฒƒ์ธ๊ฐ€์— ๋Œ€ํ•œ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ํฌ์ŠคํŠธ๊ฐ€ ๊ถ๊ธˆํ•˜์‹œ๋ฉด ์•„๋ž˜ ๋งํฌ๋ฅผ ํ•œ ๋ฒˆ ์ฐธ๊ณ ํ•ด ๋ณด์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค:

๊ณต๊ฐ„ ์ง€๋Šฅ (Spatial Intelligence): AI๊ฐ€ ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„๋ฅผ ์ดํ•ดํ•˜๋‹ค

โ€˜๊ณต๊ฐ„ ์ง€๋Šฅโ€™. ์ฐจ์„ธ๋Œ€ AI๊ฐ€ ๊ฐ€์ ธ์•ผ ํ•  ํ•ต์‹ฌ ๋Šฅ๋ ฅ์ž…๋‹ˆ๋‹ค. ์ด๊ฑด AI ์‹œ์Šคํ…œ์ด ๋ฌผ๋ฆฌ์ ์ธ ๊ณต๊ฐ„, ๊ธฐํ•˜ํ•™, ๊ทธ๋ฆฌ๊ณ  3์ฐจ์›์—์„œ ๊ณต๊ฐ„๊ณผ ์‚ฌ๋ฌผ์˜ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ๋Šฅ๋ ฅ์ธ๋ฐ์š”. ๋กœ๋ด‡ ์กฐ์ž‘, ์ฆ๊ฐ• ํ˜„์‹ค ๋“ฑ ์‹ค์ œ ์„ธ๊ณ„์—์„œ ์ƒํ˜ธ ์ž‘์šฉํ•ด์•ผ ํ•˜๋Š” AI ์‹œ์Šคํ…œ์ด๋ผ๋ฉด ์ด๋Ÿฐ ๋Šฅ๋ ฅ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

์ตœ์‹ ์˜ AI ์•„ํ‚คํ…์ฒ˜๋“ค์€ ๊ณต๊ฐ„๊ณผ ๊ด€๋ จ๋œ ์ถ”๋ก ์„ ๋” ์ž˜ ์ฒ˜๋ฆฌํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ง„ํ™”ํ•˜๊ณ  ์žˆ์ฃ . ํŠธ๋žœ์Šคํฌ๋จธ๊ฐ€ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด์„œ โ€˜๊ด€๊ณ„์„ฑโ€™์„ ๋ชจ๋ธ๋งํ•˜๋Š”๋ฐ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ๊ณ , ๋‰ด๋Ÿด ํ•„๋“œ (Neural Fields)๋ผ๋“ ๊ฐ€ ๊ทธ๋ž˜ํ”„ ์‹ ๊ฒฝ๋ง (Graph Neural Networks) ๋“ฑ ํŠนํ™”๋œ ์•„ํ‚คํ…์ฒ˜๋“ค์€ ๊ณต๊ฐ„์  ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š”๋ฐ ๊ฐ•์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ตœ๊ทผ์— ๋ง˜๋ฐ” (Mamba) ๊ฐ™์€ ์ƒํƒœ ๊ณต๊ฐ„ ๋ชจ๋ธ (SSM; State-Space Model)๋“ค์ด ๋“ฑ์žฅํ•ด์„œ ๊ณต๊ฐ„ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๋ณด์™„ํ•ด ์ฃผ๊ณ  ์žˆ๋Š”๋ฐ์š”. ์ด๋Ÿฐ ๋ชจ๋ธ์€ ์ˆœ์ฐจ์  ๋ฐ์ดํ„ฐ๊ฐ€ ์ฆ๊ฐ€ํ•˜๋”๋ผ๋„ ์„ ํ˜•์ ์œผ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์–ด์„œ - ์ฆ‰, ์—ฐ์‚ฐ ๋ถ€๋‹ด์ด ๊ธฐํ•˜๊ธ‰์ˆ˜์ ์œผ๋กœ ์ฆ๊ฐ€ํ•˜์ง€ ์•Š์•„์„œ - ํšจ์œจ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ณต๊ฐ„์˜ ์ดํ•ด ๋Šฅ๋ ฅ๊ณผ ๊ฒฐํ•ฉ๋œ๋‹ค๋ฉด, ์ด๋Ÿฐ ๋ชจ๋ธ์ด ๋™์ž‘์„ ๊ณ„ํšํ•œ๋‹ค๊ฑฐ๋‚˜, ํ™˜๊ฒฝ์„ ๋งคํ•‘ํ•˜๊ณ , ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ์ถ”์ ํ•œ๋‹ค๊ฑฐ๋‚˜ ํ•˜๋Š” ์ž‘์—…์— ํ•„์š”ํ•œ โ€˜์‹œ๊ณต๊ฐ„ ์ถ”๋ก โ€™์„ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ง˜๋ฐ” ์•„ํ‚คํ…์ฒ˜์— ๋Œ€ํ•ด์„œ ์ข€ ๋” ๊ถ๊ธˆํ•˜์‹  ๋ถ„์€, ์•„๋ž˜ ํฌ์ŠคํŠธ๋ฅผ ์ฐธ๊ณ ํ•ด ๋ณด์…”๋„ ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค:

ํ€€ํ…€ ์ปดํ“จํŒ…์ด ์—ด์–ด๊ฐˆ ๋ฏธ๋ž˜

์ž, ํ•œํŽธ ํ€€ํ…€ ์ปดํ“จํŒ…์€ ์ตœ์ ํ™”๋ผ๋“ ๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ถ„์•ผ์—์„œ ๋‹ค์–‘ํ•œ ํ˜์‹ ์˜ ๋„๊ตฌ๊ฐ€ ๋  ๊ฑฐ๋ผ๋Š” ๊ธฐ๋Œ€๋ฅผ ์ผ์œผํ‚ค๋ฉด์„œ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์ฃ . Variational Quantum Algorithm, ๊ทธ๋ฆฌ๊ณ  Quantum-Aware Neural Architecture๋Š” AI์™€ ํ€€ํ…€ ์‹œ์Šคํ…œ์ด ํ•จ๊ป˜ ์ง„ํ™”ํ•˜๋ฉด์„œ, ์ง€๊ธˆ ๋ถˆ๊ฐ€๋Šฅํ•ด ๋ณด์ด๋Š” ๋ฌธ์ œ๋“ค์ด ํ•ด๊ฒฐ๋˜๋Š” ๋ฏธ๋ž˜๊ฐ€ ๋‹ค๊ฐ€์˜ฌ ๊ฑฐ๋ผ๋Š” ๋œป์ด์ฃ .

Quantum-Enhanced Reinforcement Learning ๊ฐ™์€ ์ƒˆ๋กœ์šด ๋ถ„์•ผ๋Š”, ๋‹ค์ด๋‚˜๋ฏน ์‹œ์Šคํ…œ ๊ธฐ๋ฐ˜์˜ ์˜์‚ฌ๊ฒฐ์ • ๋ฐฉ์‹์„ ํ˜์‹ ํ•  ์ˆ˜ ์žˆ๊ณ , ์‹ ์•ฝ ๊ฐœ๋ฐœ, ๊ธฐํ›„ ๋ชจ๋ธ๋ง, ์•”ํ˜ธํ•™ ๊ฐ™์€ ๋Œ€๊ทœ๋ชจ์˜ ์กฐํ•ฉ์„ ๋‹ค๋ฃจ๋Š” ๋ฌธ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ๋” ํšจ์œจ์ ์œผ๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์„์ง€ ํƒ๊ตฌํ•˜๋Š” ์—ฐ๊ตฌ์ž๋“ค๋„ ๋งŽ์ด ์ƒ๊ฒจ๋‚˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ํ€€ํ…€ ํ•˜๋“œ์›จ์–ด๊ฐ€ ๋ฐœ์ „ํ•˜๊ณ  ์„ฑ์ˆ™ํ•ด ๊ฐ€๋ฉด์„œ, ์•„๋งˆ๋„ ์—ฐ๊ตฌ์˜ ์ดˆ์  ์ž์ฒด๊ฐ€ โ€˜์ „ํ†ต์  AIโ€™์™€ โ€˜ํ€€ํ…€ ์•Œ๊ณ ๋ฆฌ์ฆ˜โ€™์ด ์ƒํ˜ธ ๋ณด์™„ํ•˜๋Š” โ€˜ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์›Œํฌํ”Œ๋กœ์šฐโ€™ ๊ตฌ์ถ•์ด๋ผ๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ด๋™ํ•˜๊ฒŒ ๋  ๊ฒ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฐฉ์‹์˜ ๊ฒฐํ•ฉ์ด ์™„์„ฑ๋œ๋‹ค๋ฉด, AI๊ฐ€ ๋ฐœํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์˜ ์ƒˆ๋กœ์šด ์ง€ํ‰์„ ๋˜ ์ƒˆ๋กญ๊ฒŒ ์—ด๊ฒŒ ๋˜๊ฒ ์ฃ .

์ „์„ธ๊ณ„์ ์œผ๋กœ๋„, ๊ทธ๋ฆฌ๊ณ  ๋ฌด์—‡๋ณด๋‹ค ์šฐ๋ฆฌ๋‚˜๋ผ๋„ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ˜ผ๋ž€์Šค๋Ÿฌ์šด ์ƒํ™ฉ์ด ๋ˆˆ ์•ž์— ๋†“์—ฌ ์žˆ์ง€๋งŒ, AI ์˜์—ญ์€ ๊ฑฐ์นจ์—†์ด ๋ฐœ์ „๊ณผ ํ™•์‚ฐ์˜ ๊ธธ์„ ๊ฑท๊ณ  ์žˆ๋Š” ๊ฒƒ๋งŒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ ์ธ๋ฅ˜์—๊ฒŒ โ€˜์˜๋ฏธ์žˆ๋Š”โ€™, โ€˜๊ธ์ •์ ์ธโ€™ ์‚ฌ๊ฑด์ด ๊ฐ€๋“ํ•œ 2025๋…„์ด ๋˜๊ธฐ๋ฅผ ๋ฐ”๋ž˜ ๋ด…๋‹ˆ๋‹ค!

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

2024๋…„, ๋ณธ๊ฒฉ์ ์œผ๋กœ ๊ด€์‹ฌ์„ ๋ฐ›๊ธฐ ์‹œ์ž‘ํ•œ AI ์—์ด์ „ํŠธ. 2025๋…„์—๋Š” AI ์—์ด์ „ํŠธ๋ฅผ ์‹ค์ œ๋กœ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•œ ์‹œ๋„๊ฐ€ ๋งŽ์ด ์ด์–ด์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒํ•ด ๋ด…๋‹ˆ๋‹ค.

์˜ฌํ•ด ๋“ฑ์žฅํ•œ ์—์ด์ „ํ‹ฑ ์‹œ์Šคํ…œ๊ณผ ํ”„๋ ˆ์ž„์› 15๊ฐ€์ง€๋ฅผ ์‚ดํŽด๋ด…๋‹ˆ๋‹ค:

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

์˜คํ”ˆAI, ํ™”๋ คํ•˜๊ฒŒ ์—ฐ๋ง์„ ์žฅ์‹ํ•˜๋‹ค

  • ์˜คํ”ˆAI๊ฐ€ ์ „๋ก€์—†๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ถ”๋ก (Simulated Reasoning) ๋Šฅ๋ ฅ์„ ์ž๋ž‘ํ•˜๋Š” o3์™€ o3-mini๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. o3๋Š” ARC-AGI ๋ฒค์น˜๋งˆํฌ์—์„œ ์‚ฌ๋žŒ๊ณผ ๋น„์Šทํ•œ ์ˆ˜์ค€์˜ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ–ˆ๊ณ , ์ˆ˜ํ•™๊ณผ ๊ณผํ•™ ๋ถ„์•ผ์˜ ๋ฒค์น˜๋งˆํฌ๋“ค์„ ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ์••๋„์ ์ธ ์ฐจ์ด๋กœ ๋›ฐ์–ด๋„˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ โ€˜Private CoTโ€™ ์ถ”๋ก , ๊ทธ๋ฆฌ๊ณ  ์ƒํ™ฉ์— ๋”ฐ๋ผ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๋Š” ์ ์‘ํ˜• ํ”„๋กœ์„ธ์‹ฑ์„ ํŠน์ง•์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค. o3-mini๋Š” 1์›”์— ๋จผ์ € ์ถœ์‹œ๋˜๊ณ , o3๋Š” ๊ทธ์— ๋’ค์ด์–ด ๊ณต๊ฐœํ•  ์˜ˆ์ •์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

  • ์˜คํ”ˆAI๋Š” o-์‹œ๋ฆฌ์ฆˆ ๋ชจ๋ธ๋“ค์ด ๋” ์•ˆ์ „ํ•˜๊ณ  ์ ํ™•ํ•œ ๋‹ต๋ณ€์„ ํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ โ€˜์•ˆ์ „ ์ •์ฑ…โ€™์„ ๋ช…์‹œ์ ์œผ๋กœ ๊ฒ€ํ† ํ•˜๊ฒŒ๋” ํ•˜๋Š” ์ƒˆ๋กœ์šด Alignment ์ „๋žต์„ ๋ฐœํ‘œํ•˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค. CoT ์ถ”๋ก ์„ ํ™œ์šฉํ•ด์„œ GPT-4 ๋“ฑ ์ด์ „ ๋ชจ๋ธ๋“ค์˜ ์„ฑ๋Šฅ์„ ๋›ฐ์–ด๋„˜์„ ๋ฟ ์•„๋‹ˆ๋ผ, ์•…์˜์ ์ธ ํ”„๋กฌํ”„ํŠธ ๋“ฑ์—๋„ ๋” ์ •๊ตํ•˜๊ฒŒ ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ตฌ๊ธ€, ์ŠคํฌํŠธ๋ผ์ดํŠธ์˜ ์ค‘์‹ฌ์œผ๋กœ ์„œ์„œํžˆ, ๋ฌด๊ฒŒ๊ฐ์žˆ๊ฒŒ ๋ณต๊ท€ํ•˜๋‹ค

  • ๊ตฌ๊ธ€. ์˜ฌํ•ด ๋‹ค์†Œ ๋ถ€์ง„(? - ๊ธฐ๋Œ€์™€ ์ž ์žฌ๋ ฅ๋ณด๋‹ค๋Š”์š”)ํ–ˆ๋˜ ๊ตฌ๊ธ€, ๋‚ด๋…„์—๋Š” ํ™•์‹คํžˆ AI ์˜์—ญ์˜ ์ ˆ๋Œ€์  ๋ฆฌ๋” ์ž๋ฆฌ๋กœ ๋“ค์–ด์˜ฌ ๊ฑฐ๋ผ๋Š” ๊ฐœ์ธ์ ์ธ ์ƒ๊ฐ์„ ํ•ด ๋ด…๋‹ˆ๋‹ค. ์˜คํ”ˆAI๊ฐ€ o3๋ฅผ ๋ฐœํ‘œํ•˜๊ธฐ ํ•˜๋ฃจ ์ „, ์—ญ์‹œ ์ถ”๋ก  ๋ชจ๋ธ์ธ Gemini 2.0 Flash Thinking์„ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.

Claude์˜ ๋น„๋ฐ€: ๋ชจ๋ธ์ด Alignment๋ฅผ ์œ„์žฅํ•  ์ˆ˜ ์žˆ๋‹ค?

  • ์•ค์“ฐ๋กœํ”ฝ์—์„œ ํฅ๋ฏธ๋กœ์šด ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ์•ˆ์ „ ๊ทœ์น™์ด๋‚˜ ์‚ฌ์šฉ์ž์˜ ์ง€์‹œ์—, AI ๋ชจ๋ธ์ด ์ „๋žต์ ์œผ๋กœ ์ˆœ์‘ํ•˜๋Š” ์ฒ™ ํ•˜๋Š” โ€˜Alignment Fake (์ •๋ ฌ ์œ„์žฅ)โ€™ ํ˜„์ƒ์„ ๋ฐœ๊ฒฌํ–ˆ๋‹ค๋Š” ๊ฑด๋ฐ์š”. ์ด ์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด, Claude 3 Opus๋Š” ํŠน์ •ํ•œ ์กฐ๊ฑด ํ•˜์—์„œ ๊ฐ€๋” Alignment ๊ธฐ์ค€์— ๋งž์ถ˜ ๊ฒƒ์ฒ˜๋Ÿผ ํ–‰๋™์€ ํ•˜์ง€๋งŒ ์ด์ „์— ํ•™์Šต๋œ ์„ ํ˜ธ๋„ (Preference)๋Š” ์—ฌ์ „ํžˆ ์œ ์ง€ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ๋ฐœ๊ฒฌ์ด ์‚ฌ์‹ค์ด๋ผ๋ฉด, AI ์•ˆ์ „๊ณผ ๊ด€๋ จ๋œ ํŠธ๋ ˆ์ด๋‹์ด ๊ณผ์—ฐ ํšจ๊ณผ๋ฅผ ์–ผ๋งˆ๋‚˜ ๋ฐœํœ˜ํ•  ๊ฒƒ์ธ์ง€ ์˜๋ฌธ์„ ๊ฐ€์ง€๊ฒŒ ํ•˜๊ฒ ์ฃ ? ์–ด์ฉŒ๋ฉด ๋” ๊นŠ์€ ์ˆ˜์ค€์˜ ๊ฒ€์ฆ, ๊ทธ๋ฆฌ๊ณ  ๋˜ ๋‹ค๋ฅธ ๊ด€์ ์˜ ๋Œ€๋น„์ฑ…์ด ํ•„์š”ํ•˜๋‹ค๋Š” ๊ฑธ ์‹œ์‚ฌํ•œ๋‹ค๊ณ  ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

์ฝ”ํžˆ์–ด (Cohere), ๊ตฐ์‚ฌ์šฉ AI ๊ฐœ๋ฐœ์„ ์œ„ํ•ด ํŒ”๋ž€ํ‹ฐ์–ด์™€ ์†์žก๋‹ค

  • ์บ๋‚˜๋‹ค์˜ ๋Œ€ํ˜• AI ์Šคํƒ€ํŠธ์—… ์ฝ”ํžˆ์–ด๊ฐ€ ๊ตญ๋ฐฉ ์˜์—ญ๊ณผ ์‚ฌ์ด๋ฒ„ ์ธํ…”๋ฆฌ์ „์Šค ์˜์—ญ์— ์ฒจ๋‹จ AI๋ฅผ ์ ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ฏธ๊ตญ ํŒ”๋ž€ํ‹ฐ์–ด์™€ ํŒŒํŠธ๋„ˆ์‹ญ์„ ๋งบ์—ˆ์Šต๋‹ˆ๋‹ค. ๊ตญ๊ฐ€ ๋ณด์•ˆ ๊ด€์ ์—์„œ AI๋ฅผ ๋” ๋งŽ์ด, ๋” ํšจ๊ณผ์ ์œผ๋กœ, ๋” ๋ฐ€์ ‘ํ•˜๊ฒŒ ํ™œ์šฉํ•˜๊ฒŒ ๋  ๊ณ„๊ธฐ๊ฐ€ ๋˜๊ธฐ๋„ ํ•˜์ง€๋งŒ, AI์˜ ๋ฌด๊ธฐํ™”๋ฅผ ์šฐ๋ คํ•˜๋Š” ํ•™๊ณ„์˜ ์‹œ์„ ๋„ ์žˆ๋„ค์š”.

AI ์„นํ„ฐ, ๋Œ€๊ทœ๋ชจ์˜ ํˆฌ์ž ๋ผ์šด๋“œ๋Š” ๊ณ„์†๋œ๋‹ค

  • ๋ฐ์ดํ„ฐ๋ธŒ๋ฆญ์Šค, $10B ๊ทœ๋ชจ ํˆฌ์ž ์œ ์น˜๋ฅผ ํ•˜๋ฉด์„œ ๊ธฐ์—…๊ฐ€์น˜๊ฐ€ $62B๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. AI๋ฅผ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ๊ด€๋ฆฌ ๊ธฐ์—…์œผ๋กœ์„œ์˜ ๋…๋ณด์  ํฌ์ง€์…”๋‹์„ ๊ฐ•ํ™”ํ•  ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

  • Perplexity AI๊ฐ€ $500M ๊ทœ๋ชจ์˜ ํˆฌ์ž ์œ ์น˜๋ฅผ ๋งˆ๋ฌด๋ฆฌํ•˜๋ฉด์„œ ๊ธฐ์—…๊ฐ€์น˜๋Š” $9B๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. โ€˜AI ๊ฒ€์ƒ‰์—”์ง„โ€™ ์˜์—ญ์˜ ์„ ๋‘ ๊ทธ๋ฃน์— ์žˆ๋Š” ์Šคํƒ€ํŠธ์—…์œผ๋กœ์„œ, ์•ž์œผ๋กœ ๊ตฌ๊ธ€๊ณผ์˜ ๊ฒฝ์Ÿ์„ ์–ด๋–ป๊ฒŒ ํ—ค์ณ๋‚˜๊ฐˆ์ง€ ์ฃผ๋ชฉ๋ฉ๋‹ˆ๋‹ค. Perplexity AI์— ๋Œ€ํ•ด ์ข€ ๋” ๊ถ๊ธˆํ•˜์‹  ๋ถ„์€ ์•„๋ž˜ ๊ธ€๋„ ํ•œ ๋ฒˆ ์ฐธ๊ณ ํ•ด ๋ณด์„ธ์š”:

  • AI ๊ธฐ๋ฐ˜์˜ ์ฝ”๋“œ ํŽธ์ง‘๊ธฐ ์Šคํƒ€ํŠธ์—…, Anysphere. 4๊ฐœ์›”๋ฐ–์— ๋˜์ง€ ์•Š์•˜์ง€๋งŒ, ์ด ์Šคํƒ€ํŠธ์—…์€ $100M์˜ ํˆฌ์ž๋ฅผ ์œ ์น˜ํ•˜๋ฉด์„œ ๊ณ„์†ํ•ด์„œ AI ๊ธฐ๋ฐ˜ ๊ฐœ๋ฐœ์ž ๋„๊ตฌ๋ฅผ ๊ฐœ์„ , ํ™•๋Œ€ํ•ด ๋‚˜๊ฐˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค.

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

๊ธˆ์ฃผ์˜ Top Pick!

  • Qwen2.5, Alibaba's latest LLM suite
    ๋ฌด๋ ค โ€˜18์กฐ ๊ฐœโ€™์˜ ํ† ํฐ์œผ๋กœ ํ•™์Šต์„ ํ•œ ์•Œ๋ฆฌ๋ฐ”๋ฐ”์˜ ์ตœ์‹  ๋ชจ๋ธ๋กœ, ์ƒ์‹ ์˜์—ญ์— ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฒฐํ•ฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์‚ฌํ›„ ํ•™์Šต ๊ธฐ๋ฒ•์œผ๋กœ ํ•œ์ธต ๊ฐ•ํ™”๋œ Qwen2.5๋Š” Llama-3์™€ ๊ฐ™์€ ๊ฑฐ๋Œ€ ๋ชจ๋ธ๋“ค๊ณผ ์–ด๊นจ๋ฅผ ๋‚˜๋ž€ํžˆ ํ•˜๋ฉด์„œ๋„ ๋” ๋†’์€ ๋น„์šฉ ํšจ์œจ์„ฑ์„ ๋ณด์—ฌ์ค€๋‹ค๊ณ  ํ•˜๋„ค์š”.
    โ€”> [๋” ๋ณด๊ธฐ]

  • ModernBERT: A Modern Encoder
    ๋‹ค์–‘ํ•œ ์˜์—ญ์—์„œ ๋†’์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ณ  ์ถ”๋ก ์„ ํšจ์œจ์ ์œผ๋กœ ํ•˜๋„๋ก ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ตœ์ ํ™”ํ•œ ์ธ์ฝ”๋” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

  • TII unveils Falcon3
    ๊ทœ๋ชจ vs. ์ตœ์‹ ์˜ ์„ฑ๋Šฅ ์‚ฌ์ด์˜ ๊ท ํ˜•์„ ๋งž์ถ˜, 100์–ต ๊ฐœ ์ดํ•˜์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ LLM ์‹œ๋ฆฌ์ฆˆ์ž…๋‹ˆ๋‹ค. Depth Scaling, Knowledge Distillation ๋“ฑ์˜ ํ˜์‹ ์ ์ธ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•œ ์ด ๋ชจ๋ธ๋“ค์€ ์ˆ˜ํ•™, ์ฝ”๋”ฉ, ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ์—์„œ ๋” ํฐ ๋ชจ๋ธ๋“ค๊ณผ ๊ฒฌ์ค„ ๋งŒํ•œ ๋›ฐ์–ด๋‚œ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
    โ€”> [๋” ๋ณด๊ธฐ]

๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ ์ตœ์ ํ™” ๋ฐ ํšจ์œจํ™”

  • SPAR: Self-Play with Tree-Search Refinement
    โ€˜ํŠธ๋ฆฌ ๊ฒ€์ƒ‰ ์ž์ฒด ๊ฐœ์„  (Tree-Search Self-Refinement)โ€™ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•ด์„œ LLM์˜ ์ง€์‹œ ์ˆ˜ํ–‰ (Instruction Following) ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ๊ณ , ์ด๊ฑธ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šต์„ ๋” ์ž˜ ํ•˜๋„๋ก ํ•˜๊ธฐ ์œ„ํ•œ, ๋น„๊ต ๊ฐ€๋Šฅํ•œ ์„ ํ˜ธ๋„ ์Œ (Preference Pair)์„ ๋งŒ๋“ค์–ด ๋ƒˆ์Šต๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

  • SepLLM: Accelerate Large Language Models
    ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ์œ ์ง€ํ•˜๋ฉด์„œ ๊ณ„์‚ฐ์˜ ํšจ์œจ์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด Separator Token์„ ์‚ฌ์šฉํ•˜๋Š” โ€˜์„ธ๊ทธ๋จผํŠธ ์••์ถ• (Segment Compression)โ€™ ๋ฐฉ์‹์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

  • SGD-SaI: Learning Rate Scaling at Initialization
    ํŠธ๋žœ์Šคํฌ๋จธ๊ฐ€ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํšจ์œจ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋ฉด์„œ ํ•™์Šตํ•˜๋„๋ก ํ•ด ์ฃผ๋Š” ์ตœ์ ํ™” ๋„๊ตฌ๋ฅผ ๋„์ž…ํ–ˆ๋Š”๋ฐ, AdamW๋ณด๋‹ค ๋ˆˆ์— ๋„๋Š” ์„ฑ๋Šฅ์น˜์˜ ํ–ฅ์ƒ์„ ๋ณด์—ฌ ์ค๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

์ถ”๋ก  ๋ฐ ๋ฉ€ํ‹ฐ์Šคํ… ์ตœ์ ํ™”

  • Compressed Chain of Thought (CCoT): Efficient Reasoning
    ์ถ”๋ก ์˜ ์ •ํ™•๋„๋ฅผ ๋” ๋†’์ด๊ธฐ ์œ„ํ•ด์„œ ์••์ถ•๋œ ํ‘œํ˜„ (Compressed Representation)์„ ์ƒ์„ฑ, Dense Reasoning์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ด ์ค๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

  • Offline Reinforcement Learning (OREO): Multi-Step Reasoning
    ์˜คํ”„๋ผ์ธ ๊ฐ•ํ™” ํ•™์Šต ํ”„๋ ˆ์ž„์›์„ ํ™œ์šฉํ•ด์„œ LLM์˜ ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ํฌ์†Œ ๋ณด์ƒ (Sparse Reward) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ RAG ์‹œ์Šคํ…œ

  • RetroLLM: Unified Retrieval and Generation
    LLM์˜ ํ™˜๊ฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ๊ฒ€์ƒ‰, ๊ทธ๋ฆฌ๊ณ  ์ƒ์„ฑ ์ž‘์—…์„ ํ†ตํ•ฉํ•˜๋ฉด์„œ ์ฆ๊ฑฐ (Evidence) ๊ธฐ๋ฐ˜์˜ ์ถœ๋ ฅ ์ž‘์—…์„ ๊ฐœ์„ ํ•ด ๋ด…๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

  • Progressive Multimodal Reasoning via AR-MCTS: Enhancing Multimodal Tasks
    ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‹œ์Šคํ…œ์˜ ์ถ”๋ก  ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ, ๋Šฅ๋™์  ๊ฒ€์ƒ‰ (Active Retrieval), ๋ชฌํ…Œ์นด๋ฅผ๋กœ ํŠธ๋ฆฌ ํƒ์ƒ‰ ํ”„๋ ˆ์ž„์›์„ ๋„์ž…ํ•ด ๋ด…๋‹ˆ๋‹ค. โ€”> [๋” ๋ณด๊ธฐ]

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.