• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#108: 2025แ„‚แ…งแ†ซ แ„‰แ…กแ†ผแ„‡แ…กแ†ซแ„€แ…ต, AIแ„‹แ…ด แ„‡แ…กแ†ฏแ„Œแ…ฅแ†ซ แ„‡แ…กแ†ผแ„’แ…ฃแ†ผแ„‹แ…ณแ†ฏ แ„€แ…กแ„…แ…ตแ„แ…ตแ„‚แ…ณแ†ซ แ„‹แ…งแ†ซแ„€แ…ฎ 8้ธ

๐ŸŒFOD#108: 2025แ„‚แ…งแ†ซ แ„‰แ…กแ†ผแ„‡แ…กแ†ซแ„€แ…ต, AIแ„‹แ…ด แ„‡แ…กแ†ฏแ„Œแ…ฅแ†ซ แ„‡แ…กแ†ผแ„’แ…ฃแ†ผแ„‹แ…ณแ†ฏ แ„€แ…กแ„…แ…ตแ„แ…ตแ„‚แ…ณแ†ซ แ„‹แ…งแ†ซแ„€แ…ฎ 8้ธ

แ„ƒแ…กแ†ผแ„‰แ…ตแ†ซแ„‹แ…ต AI แ„‹แ…งแ†ซแ„€แ…ฎแ„Œแ…กแ„‚แ…ก แ„‹แ…ฆแ†ซแ„Œแ…ตแ„‚แ…ตแ„‹แ…ฅแ„€แ…ก แ„‹แ…กแ„‚แ…ตแ„…แ…กแ„ƒแ…ฉ แ„‹แ…กแ†ฏแ„‹แ…กแ„ƒแ…ฎแ†ฏ แ„†แ…กแ†ซแ„’แ…กแ†ซ, แ„€แ…ณแ†ธแ„€แ…งแ†จแ„’แ…กแ„€แ…ฆ แ„ˆแ…กแ†ฏแ„…แ…กแ„Œแ…ตแ„€แ…ฉ แ„‹แ…ตแ†ปแ„‚แ…ณแ†ซ AIแ„‹แ…ด แ„‡แ…กแ†ฏแ„Œแ…ฅแ†ซ แ„‡แ…กแ†ผแ„’แ…ฃแ†ผ

์ง€๋‚œ ์ฃผ ๋ง์”€๋“œ๋ฆฐ ๊ฒƒ์ฒ˜๋Ÿผ, ํŠœ๋ง ํฌ์ŠคํŠธ๋Š” ์ผ๋…„์˜ ์ ˆ๋ฐ˜์ด ์ง€๋‚œ ์‹œ์ , 7์›”์„ ๋งž์•„ ์‚ด์ง ์Šฌ๋กœ์šฐํ•˜๊ฒŒ ์›€์ง์ด๋Š” ๋ชจ๋“œ๋กœ ์ง€๋‚œ ๋ฐ˜ ๋…„๊ฐ„์„ ๋’ค๋Œ์•„๋ณด๊ณ  ํ•˜๋ฐ˜๊ธฐ๋ฅผ ๊ณ„ํšํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋ฒˆ ์ฃผ์—๋Š”, ๊ทธ ๋™์•ˆ FOD์—์„œ ์–ธ๊ธ‰ํ•ด ์™”๋˜ ์ˆ˜๋งŽ์€ โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ๋“คโ€™ ์ค‘์— ๋ณ€ํ™”ํ•˜๋Š” AI์˜ ๋ฐœ์ „ ๋ฐฉํ–ฅ์„ ์ž˜ ๋ณด์—ฌ์ฃผ๋Š” ํ•ต์‹ฌ์ ์ธ ์—ฐ๊ตฌ 8๊ฐ€์ง€๋ฅผ ๋‹ค์‹œ ํ•œ ๋ฒˆ ์—ฌ๋Ÿฌ๋ถ„๋“ค๊ณผ ๋Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋‹ค์‹œ ํ•œ ๋ฒˆ ์–ธ๊ธ‰ํ•˜๊ณ  ๊ธฐ์–ตํ•  ๋งŒํ•œ, 2025๋…„ ์ƒ๋ฐ˜๊ธฐ ํ•ต์‹ฌ ์—ฐ๊ตฌ - 1๋ถ€

๋‹ค์‹œ ๋ง์”€๋“œ๋ฆฌ์ž๋ฉด ์ž…์ด ์•„ํ”Œ ์ •๋„์ž…๋‹ˆ๋‹ค๋งŒ (^.^;), 2025๋…„ AI์˜ ๋ฐœ์ „ ์†๋„๋Š” ์ •๋ง ๋†€๋ผ์šธ ์ •๋„์ž…๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ, ์ƒˆ๋กœ์šด ๋ŒํŒŒ๊ตฌ(Breakthrough)๊ฐ€ ์šฐ๋ฆฌ๋“ค์ด ๋”ฐ๋ผ์žก๊ธฐ๋„ ์ „์— ๋งค์ฃผ ์Ÿ์•„์ง€๊ณ  ์žˆ์ฃ . ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์—์•ผ๋ง๋กœ, ์ง€๊ธˆ ์–ด๋–ค ๋ณ€ํ™”๊ฐ€ ์‹ค์ œ๋กœ ์ด ๊ฑฐ๋Œ€ํ•œ ๋ถ„์•ผ๋ฅผ ๋ฐ”๊ฟ”๊ฐ€๊ณ  ์žˆ๋Š”์ง€, ํ•œ ๊ฑธ์Œ ๋ฌผ๋Ÿฌ์„œ์„œ ์‚ดํŽด๋ณด๊ณ  ๊ธฐ์–ตํ•˜๋Š”๊ฒŒ ์ค‘์š”ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

์˜ฌํ•ด์˜ ์ ˆ๋ฐ˜์ด ์ง€๋‚œ ์ง€๊ธˆ, AI์—์„œ ์ค‘์š”ํ•œ ํ•ต์‹ฌ ์—ญ๋Ÿ‰์ด ๋ญ”์ง€๋ฅผ ์žฌ์ •์˜ํ•œ๋‹ค๊ฑฐ๋‚˜, ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ์—ด๊ฑฐ๋‚˜, ์•ž์œผ๋กœ ์ค‘์š”ํ•ด์งˆ ๊ธฐ์ˆ  ์Šคํƒ์„ ์žฌํŽธํ•  ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ๋Š” ๋…ผ๋ฌธ๋“ค์ด ๋งŽ์ด ๋“ฑ์žฅํ–ˆ๋Š”๋ฐ์š”.

์—ฌ๊ธฐ์— ๊ทธ ์ค‘ ์ผ๋ถ€๋ฅผ ๋ชจ์€ ํ๋ ˆ์ด์…˜ ๋ฆฌ์ŠคํŠธ, 1๋ถ€๋ฅผ ๋จผ์ € ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค - AI๋กœ ๋ญ”๊ฐ€๋ฅผ ์ง์ ‘ ๋งŒ๋“ค๊ณ  ์žˆ๋‹ค๋ฉด ๋‹น์—ฐํžˆ ๊ด€์‹ฌ์ด ๋งŽ์œผ์‹ค ๊ฑฐ๋ผ๊ณ  ๋ณด์ง€๋งŒ, ๊ฐœ๋ฐœ์ž๊ฐ€ ์•„๋‹ˆ๋ผ๋„ โ€˜AI ๊ธฐ์ˆ ์ด ์–ด๋–ค ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ์—ฐ๊ตฌ๋˜๊ณ  ์žˆ๊ตฌ๋‚˜โ€™ํ•˜๋Š” ๊ฐ์„ ์žก์œผ์‹œ๊ธฐ์— ๋„์›€์ด ๋˜๋ฆฌ๋ผ ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

์ด ๋…ผ๋ฌธ์€ Meta-CoT๋ผ๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›์„ ์†Œ๊ฐœํ•˜๋Š”๋ฐ์š”. ์ด ํ”„๋ ˆ์ž„์›์€, ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ์Šค์Šค๋กœ ์ง„ํ–‰ํ•˜๋Š” ์ถ”๋ก  ๊ณผ์ •์„ ๋˜๋Œ์•„๋ณด๋ฉด์„œ ์ƒ๊ฐ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ์„ค๊ณ„๋œ ๊ฒ๋‹ˆ๋‹ค. ์‹ฌ์ธต์ ์ด๊ณ , ๋А๋ฆฐ ์‚ฌ๊ณ ๋ฅผ ๋œปํ•˜๋Š” ๋ง์ด์ฃ ? โ€™System 2โ€™ ์‚ฌ๊ณ  ๋ฐฉ์‹์—์„œ ์˜๊ฐ์„ ๋ฐ›์•„์„œ, ๋ณต์žกํ•œ ๋ฌธ์ œ์— ๋Œ€ํ•ด์„œ๋Š” ์—ฌ๋Ÿฌ ๋ฒˆ ์ƒ๊ฐํ•˜๊ณ  ๊ฒ€ํ† ํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์น  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์ž๋Š” ์•„์ด๋””์–ด์ฃ .

์ด ์—ฐ๊ตฌ๋Š” SynthLabs.ai, ์Šคํƒ ํผ๋“œ, UC ๋ฒ„ํด๋ฆฌ์˜ ์—ฐ๊ตฌ์ง„์ด ๊ณต๋™์œผ๋กœ ์ง„ํ–‰ํ–ˆ๋Š”๋ฐ, ์ถ”๋ก  ๊ณผ์ •์„ ๋งˆ๋ฅด์ฝ”ํ”„ ๊ฒฐ์ • ๊ณผ์ •(MDP)์ด๋ผ๋Š” ํƒ์ƒ‰ ๋ฌธ์ œ๋กœ ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ , ํ”„๋กœ์„ธ์Šค ๊ธฐ๋ฐ˜ ๋ณด์ƒ ๋ชจ๋ธ๊ณผ ๋ฉ”ํƒ€ ๊ฐ•ํ™”ํ•™์Šต(meta-RL)์„ ํ†ตํ•ด์„œ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด, ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜์œผ๋กœ ํ›ˆ๋ จํ•œ ๋ชจ๋ธ์ด, ๊ธฐ์กด์˜ ์ง€์‹œ ๊ธฐ๋ฐ˜(Instruction-Tuned) ๋ชจ๋ธ๋ณด๋‹ค ๋” ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค - ์ด๊ฒŒ ๋ฐ”๋กœ 2025๋…„ AI ์—ฐ๊ตฌ์˜ ์ „๋ฐ˜์—์„œ ๋‚˜ํƒ€๋‚˜๋Š” ๊ฑฐ๋Œ€ํ•œ ํ๋ฆ„, ์ฆ‰, ์กฐ๊ธˆ ๋А๋ฆฌ์ง€๋งŒ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ๋Š” ์ถ”๋ก , ๊ทธ๋ฆฌ๊ณ  ๊ฐ•ํ™”ํ•™์Šต์˜ ์ค‘์š”์„ฑ ํ™•๋Œ€๋ผ๋Š” ํ๋ฆ„๊ณผ๋„ ์ผ์น˜ํ•˜์ฃ .

๊ฒฐ๊ตญ, ์ด ์—ฐ๊ตฌ๋Š” ์šฐ๋ฆฌ๊ฐ€ 2025๋…„ ๋“ค์–ด์„œ ์—„์ฒญ๋‚˜๊ฒŒ ์ž์ฃผ ์–ธ๊ธ‰ํ•ด ์˜จ ์ฃผ์ œ, โ€˜์ด์ œ ์ข€ ๋А๋ฆฌ๋”๋ผ๋„ ํ™•์‹คํ•œ ์ถ”๋ก ์ด ์ค‘์š”ํ•˜๋‹คโ€™๋Š”, AI ๊ธฐ์ˆ  ํ˜์‹ ์˜ ๋ฐฉํ–ฅ์„ ์ž˜ ๋ณด์—ฌ์ฃผ๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ๋Š”, ํ˜„์žฌ AI ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ณผ์ œ ์ค‘ ํ•˜๋‚˜์ธ, ์–ธ์–ด ๋ชจ๋ธ์˜ ์ง„์งœ โ€˜์‚ฌ๊ณ  ๋Šฅ๋ ฅโ€™, ์ฆ‰ โ€˜์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋…ผ๋ฆฌ์ ์ด๊ณ  ์ฒด๊ณ„์ ์œผ๋กœ ์ถ”๋ก ํ•˜๋Š” ๋Šฅ๋ ฅโ€™์„ ํ‚ค์šฐ๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š”๋ฐ์š”. ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ ๋ฟ ์•„๋‹ˆ๋ผ ์†Œํ˜• ์–ธ์–ด ๋ชจ๋ธ์—๋„ ํ•ด๋‹น๋˜๋Š” ์ฃผ์ œ๋กœ, ์ตœ๊ทผ์˜ ํ•ต์‹ฌ์  ์—ฐ๊ตฌ ์„ฑ๊ณผ๋“ค์„ ์•„๋ž˜์™€ ๊ฐ™์ด ์ •๋ฆฌํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

๐Ÿง  rStar-Math

1.5์–ต~7์–ต ๊ฐœ ์ •๋„ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ๊ฐ€ ๋˜๋Š” ์†Œํ˜• ์–ธ์–ด ๋ชจ๋ธ๋„ ์‹ฌ๋„์žˆ๊ฒŒ ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ์„ค๊ณ„๋œ ์‹œ์Šคํ…œ์ธ๋ฐ, ์•„๋ž˜์˜ ๊ธฐ์ˆ ๋“ค์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค:

  • ๋ชฌํ…Œ์นด๋ฅผ๋กœ ํŠธ๋ฆฌ ํƒ์ƒ‰(MCTS)
    ์ฒด์Šค๋‚˜ ๋ฐ”๋‘‘์—์„œ ์ „๋žต์„ ์„ธ์šธ ๋•Œ ์“ฐ๋Š” ๋ฐฉ์‹์ธ๋ฐ, AI๊ฐ€ ๋‹ค์–‘ํ•œ โ€˜์ถ”๋ก ์˜ ๊ฒฝ๋กœโ€™๋ฅผ ํƒ์ƒ‰ํ•˜๊ฒŒ๋” ํ•ด ์ค๋‹ˆ๋‹ค.

  • ํ”„๋กœ์„ธ์Šค ์ค‘์‹ฌ์˜ ํ”ผ๋“œ๋ฐฑ (Process-level Supervision): ๋‹จ์ˆœํ•˜๊ฒŒ ์ •๋‹ต์ด ์•„๋‹ˆ๋ผ, โ€˜์–ด๋–ป๊ฒŒ ์ƒ๊ฐํ–ˆ๋Š”๊ฐ€โ€™์— ๊ธฐ์ค€์„ ๋‘๊ณ  ์ง€๋„ํ•˜๊ณ  ํ”ผ๋“œ๋ฐฑ์„ ์ฃผ๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

  • ๋ฐ˜๋ณต์  ์ž๊ธฐ๊ฐœ์„  (Iterative Self-improvement): ๋ชจ๋ธ์ด ์Šค์Šค๋กœ์˜ ์˜ค๋ฅ˜๋ฅผ ํ•™์Šตํ•˜๋ฉด์„œ, ์ ์  ๋” ๋‚˜์€ ์ถ”๋ก  ๊ฒฝ๋กœ๋ฅผ ์ฐพ์„ ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

Image Credit: New Methods for Boost Reasoning in Small and Large Models

๐Ÿง  Logic-RL ํ”„๋ ˆ์ž„์›

Logic-RL์€, AI๊ฐ€ ๋‹จ์ˆœํžˆ ์ •๋‹ต๋งŒ ๋งžํžˆ๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ, ์ •๋‹ต์— ์ด๋ฅด๋Š” ๊ณผ์ •๊นŒ์ง€ ์ •ํ™•ํ•ด์•ผ๋งŒ ๋ณด์ƒ์„ ๋ฐ›๋Š” ์•„์ฃผ ์—„๊ฒฉํ•œ ํ›ˆ๋ จ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋งŽ์€ AI ๋ชจ๋ธ์€ ์ •๋‹ต๋งŒ ๋งžํžˆ๋ฉด ์„ฑ๊ณต์œผ๋กœ ๊ฐ„์ฃผ๋˜๋‹ˆ๊นŒ, ๊ฐ€๋”์€ ์šฐ์—ฐํžˆ ๋งžํžˆ๊ฑฐ๋‚˜, ์—‰๋šฑํ•œ ๋ฐฉ์‹์œผ๋กœ ๋‹ต์„ ๋‚ด๋„ ๊ทธ๋ƒฅ ๋„˜์–ด๊ฐ€๊ณค ํ–ˆ๊ฒ ์ฃ . ํ•˜์ง€๋งŒ Logic-RL์—์„œ๋Š” โ€˜์™œ ๊ทธ๋ ‡๊ฒŒ ์ƒ๊ฐํ–ˆ๋Š”์ง€โ€™, โ€˜์–ด๋–ค ๋…ผ๋ฆฌ์  ํ๋ฆ„์œผ๋กœ ๋‹ต์„ ๋„์ถœํ–ˆ๋Š”์ง€โ€™๊นŒ์ง€ ๊ผผ๊ผผํžˆ ๋”ฐ์ ธ๋ด…๋‹ˆ๋‹ค.

์ด ๋ฐฉ์‹์€ AI๊ฐ€ ์ œ๋Œ€๋กœ ์‚ฌ๊ณ ํ•˜๋Š” ์Šต๊ด€์„ ๋“ค์ด๊ฒŒ ๋งŒ๋“œ๋Š” ํ›ˆ๋ จ๋ฒ•์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ถ”๋ก  ๊ณผ์ •์ด ์—‰์„ฑํ•˜๋ฉด ๋ณด์ƒ์„ ๋ชป ๋ฐ›๊ณ , ๋…ผ๋ฆฌ์ ์œผ๋กœ ํƒ€๋‹นํ•œ ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ๋งŒ ๊ธ์ •์ ์ธ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์œผ๋‹ˆ๊นŒ, ๊ฒฐ๊ตญ ๋ชจ๋ธ์ด ์ ์  ๋” ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋…ผ๋ฆฌ์ ์ด๊ณ  ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ์‹์œผ๋กœ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ฒŒ ๋œ๋‹ค๋Š” ๊ฑฐ์ฃ . AI์˜ โ€˜์ถ”๋ก  ์‹ ๋ขฐ์„ฑโ€™์„ ๋†’์ด๋Š” ๋ฐ ์•„์ฃผ ์ค‘์š”ํ•œ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.

๐Ÿง  LIPS

LIPS๋Š”, AI๊ฐ€ ์–ด๋ ค์šด ์ˆ˜ํ•™ ๋ฌธ์ œ, ํŠนํžˆ โ€˜ํ•ญ์ƒ ์–ด๋–ค ์ˆ˜๊ฐ€ ๋” ํฌ๊ฑฐ๋‚˜ ์ž‘๋‹คโ€™๋Š” ๋ถˆํ‰๋“ฑ ์ฆ๋ช…(Inequality Proof) ๋ฌธ์ œ๋ฅผ ์ž˜ ํ’€ ์ˆ˜ ์žˆ๊ฒŒ ์„ค๊ณ„ํ•œ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ๋ณดํ†ต ์–ธ์–ด ๋ชจ๋ธ์€ ๊ฒฝํ—˜, ํŒจํ„ด์„ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฑด ์ž˜ ํ•˜์ง€๋งŒ, ์ˆ˜ํ•™์ฒ˜๋Ÿผ ์ •ํ™•ํ•œ ๋…ผ๋ฆฌ์™€ ์ฆ๋ช…์ด ํ•„์š”ํ•œ ๋ถ„์•ผ์—์„œ๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์ฃ . ๊ทธ๋ž˜์„œ LIPS๋Š” ๋‘ ๊ฐ€์ง€ ๋Šฅ๋ ฅ์„ ๊ฒฐํ•ฉํ•ฉ๋‹ˆ๋‹ค: ํ•˜๋‚˜๋Š” ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ์ง๊ด€์ ์œผ๋กœ ๋ฌธ์ œ๋ฅผ ์ดํ•ดํ•˜๋Š” ์–ธ์–ด ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ, ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” ๋…ผ๋ฆฌ์  ๊ทœ์น™์„ ๋”ฐ๋ผ ์ •ํ™•ํ•˜๊ฒŒ ๊ณ„์‚ฐํ•˜๋Š” ๊ธฐํ˜ธ ๊ธฐ๋ฐ˜์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ž…๋‹ˆ๋‹ค.

์ด ๋‘ ๊ฐ€์ง€๋ฅผ ํ•ฉ์น˜๋ฉด, AI๋Š” ๋จผ์ € ๋ฌธ์ œ๋ฅผ ์ „์ฒด์ ์œผ๋กœ ํŒŒ์•…ํ•˜๊ณ (โ€˜์–ด๋–ค ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ• ์ง€โ€™), ๊ทธ ๋‹ค์Œ์— ์ˆ˜ํ•™์ ์œผ๋กœ ์˜ณ์€ ๋ฐฉ์‹์œผ๋กœ ํ•œ ๋‹จ๊ณ„์”ฉ ๋…ผ๋ฆฌ์ ์œผ๋กœ ํ’€์–ด๊ฐ‘๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด์„œ, ์–ธ์–ด ๋ชจ๋ธ์ด โ€œ์ด ๋ฌธ์ œ๋Š” ์ด๋Ÿฐ ์œ ํ˜•์ด์•ผโ€๋ผ๊ณ  ๊ฐ์„ ์žก๊ณ , ๊ธฐํ˜ธ ๋…ผ๋ฆฌ๊ฐ€ โ€œ๊ทธ๋Ÿฌ๋ฉด ์ด๋ ‡๊ฒŒ ์ฆ๋ช…ํ•ด์•ผ ํ•ดโ€๋ผ๊ณ  ์ •ํ™•ํ•˜๊ฒŒ ๋”ฐ์ ธ๋ณด๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•ด์„œ, LIPS๋Š” ๋‹จ์ˆœํžˆ ์ •๋‹ต์„ ๋งžํžˆ๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ, ์™œ ๊ทธ ์ •๋‹ต์ด ๋งž๋Š”์ง€๋ฅผ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” AI๋กœ ๋‚˜์•„๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿง  Chain-of-Reasoning (CoR)

Chain-of-Reasoning(C0R)์€ AI๊ฐ€ ์ž์—ฐ์–ด(๊ธ€), ์ฝ”๋“œ(ํ”„๋กœ๊ทธ๋ž˜๋ฐ), ์ˆ˜ํ•™(๊ธฐํ˜ธ ๋…ผ๋ฆฌ)์ฒ˜๋Ÿผ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐฉ์‹์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํ•˜๋‚˜๋กœ ์—ฐ๊ฒฐํ•ด์„œ ์‚ฌ์šฉํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์‚ฌ๋Š” ์‹ค์ œ ์„ธ์ƒ์˜ ๋ฌธ์ œ๋Š”, ๊ฝค ์—ฌ๋Ÿฌ ์˜์—ญ์„ ๊ฑธ์ณ ์žˆ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์ž–์•„์š”. ์˜ˆ๋ฅผ ๋“ค์–ด์„œ, โ€˜๋ˆ„๊ตฌ์˜ ๊ธ‰์—ฌ๊ฐ€ ๋” ๋†’์€์ง€โ€™๋ฅผ ์ž์—ฐ์–ด๋กœ ์„ค๋ช…ํ•˜๊ณ , ์ค‘๊ฐ„์— ๊ณ„์‚ฐ์€ ์ฝ”๋“œ๋กœ ์‹คํ–‰ํ•˜๊ณ , ๋งˆ์ง€๋ง‰์—๋Š” ์ˆ˜ํ•™์  ๋…ผ๋ฆฌ๋กœ ๊ฒฐ๋ก ์„ ๋‚ด๋ฆฌ๋Š” ์‹์ด์ฃ . ๊ธฐ์กด์˜ AI๋Š” ์ด๊ฑธ ๊ฐ๊ฐ ๋”ฐ๋กœ๋”ฐ๋กœ ์ฒ˜๋ฆฌํ–ˆ์ง€๋งŒ, CoR์€ ์ด ์ „ ๊ณผ์ •์„ ํ•œ ์ค„๊ธฐ ํ๋ฆ„์ฒ˜๋Ÿผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์ด์–ด์„œ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.

์ด ๋ฐฉ์‹์˜ ๊ฐ€์žฅ ํฐ ์žฅ์ ์€, AI๊ฐ€ ๋ฌธ์ œ๋ฅผ ๋” ๋„“๊ฒŒ, ๋” ๊นŠ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค. ์–ด๋–ค ๋ฌธ์ œ๊ฐ€ ๊ธ€๋กœ ์„ค๋ช…๋ผ ์žˆ๋“ , ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„๋ผ ์žˆ๋“ , ์•„๋‹ˆ๋ฉด ํ”„๋กœ๊ทธ๋žจ์ฒ˜๋Ÿผ ์“ฐ์—ฌ ์žˆ๋“ , CoR์€ ๊ทธ๊ฑธ ๊ตฌ๋ถ„ํ•˜์ง€ ์•Š๊ณ  ํ•„์š”ํ•  ๋•Œ๋งˆ๋‹ค ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์–ธ์–ด, ์ฝ”๋“œ, ์ˆ˜ํ•™ ์‚ฌ์ด๋ฅผ ๋„˜๋‚˜๋“ค๋ฉด์„œ ์‚ฌ๊ณ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ CoR์„ ์“ด AI๋Š” ๋ณต์žก ๋‹ค๋‹จํ•œ ๋ฌธ์ œ๋„ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋‹จ๊ณ„์ ์œผ๋กœ ์ถ”๋ก ํ•˜๊ณ , ๋” ์ •ํ™•ํ•˜๊ณ  ์ผ๊ด€๋œ ๋‹ต์„ ๋‚ผ ์ˆ˜ ์žˆ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์œ„์— ์†Œ๊ฐœ๋œ ๋ชจ๋“  ์—ฐ๊ตฌ๋“ค์€, โ€™AI์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์–ด๋–ป๊ฒŒ ์ง„ํ™”ํ•˜๊ณ  ์žˆ๋Š”์ง€โ€™ ์ดํ•ดํ•˜๋Š” ๋ฐ ๊ผญ ์ฐธ๊ณ ํ•  ๋งŒํ•œ ๊ฐ€์น˜๊ฐ€ ์žˆ๋Š” ์ž๋ฃŒ๋“ค์ž…๋‹ˆ๋‹ค. AI๋Š” ์ด์ œ ๋‹จ์ˆœํ•˜๊ฒŒ ์ •๋ณด๋ฅผ ์ƒ์„ฑํ•˜๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ, ์–ด์ฐŒ๋ณด๋ฉด '์ƒ๊ฐํ•˜๋Š” ์กด์žฌ'๋กœ ์ง„ํ™”ํ•˜๋Š” ๋‹จ๊ณ„์— ์ ‘์–ด๋“ค์—ˆ๋‚˜ ํ•˜๋Š” ๋А๋‚Œ์ด ๋“ค๊ธฐ๋„ ํ•˜๋„ค์š”.

์ด ๋…ผ๋ฌธ์— ์ฃผ๋ชฉํ•ด์•ผ ํ•˜๋Š” ์ด์œ ๋Š”, ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ์ด ํ…์ŠคํŠธ์™€ ์ด๋ฏธ์ง€ ์ถ”๋ก  ๊ณผ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ์ผ๋ฐ˜ํ™”(Generalization)ํ•˜๋Š”์ง€์— ๋Œ€ํ•ด์„œ ์ง€๊ธˆ๊นŒ์ง€ ์ค‘ ๊ฐ€์žฅ ๋ช…ํ™•ํ•˜๊ณ ๋„ ํฌ๊ด„์ ์ธ, ์‹ค์ฆ์ ์ธ ๋ถ„์„์„ ๋‹ด๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์ธ๋ฐ์š”. ํ™์ฝฉ๋Œ€, UC ๋ฒ„ํด๋ฆฌ, ๊ตฌ๊ธ€ ๋”ฅ๋งˆ์ธ๋“œ, NYU, ์•จ๋ฒ„ํƒ€๋Œ€ ์—ฐ๊ตฌ์ง„์ด SFT(Supervised Fine-Tuning, ์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜ ํŒŒ์ธํŠœ๋‹)๊ณผ RL(๊ฐ•ํ™”ํ•™์Šต)์„ ๋น„๊ต ๋ถ„์„ํ–ˆ๋Š”๋ฐ, ๊ทธ ๊ฒฐ๊ณผ RL์ด ํ›ˆ๋ จ ๊ณผ์ •์— ์—†๋˜ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ(Out-of-Distribution)์— ๋” ์ž˜ ์ผ๋ฐ˜ํ™”๋  ๋ฟ ์•„๋‹ˆ๋ผ, ์‹œ๊ฐ์ ์ธ ์ธ์‹ ๋Šฅ๋ ฅ๊นŒ์ง€๋„ ๋” ๋งŽ์ด ํ–ฅ์ƒ์‹œํ‚จ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์—, SFT๋Š” ์ฃผ๋กœ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์ž์ฒด๋ฅผ โ€˜์•”๊ธฐโ€™ํ•˜๋„๋ก ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ๊ฐ•ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด์„œ, ๊ฐ•ํ™”ํ•™์Šต ์ค‘์‹ฌ์˜ ์ ‘๊ทผ ๋ฐฉ์‹์ด ์ข€ ๋” ์œ ์—ฐํ•˜๊ณ  ๊ฐ•๊ฑดํ•œ ๋ฒ”์šฉ AI ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ด๋ผ๋Š” ๊ฒƒ์„ ๋‹ค์‹œ ํ•œ ๋ฒˆ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ๊ณผ์ œ์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋Š” AI๋ฅผ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ๋Š”, ๋‹จ์ˆœํžˆ ๋ฐ์ดํ„ฐ๋ฅผ ์ฃผ์ž…ํ•˜๋Š” ๋ฐฉ์‹์—์„œ ๋ฒ—์–ด๋‚˜์„œ, ์Šค์Šค๋กœ ์‚ฌ๊ณ ํ•˜๊ณ  ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋œ ํ•™์Šต ๋ฐฉ์‹, ์ฆ‰ RL ์ค‘์‹ฌ์˜ ํ•™์Šต์ด ํ•„์ˆ˜์ ์ด๋ผ๋Š” ํ๋ฆ„์ด ๋ช…ํ™•ํ•ด์ง€๋Š” ๊ฒƒ ์•„๋‹๊นŒ ์‹ถ์Šต๋‹ˆ๋‹ค - ๊ฐ•ํ™”ํ•™์Šต๋ณด๋‹ค ๋” ํ•ฉ๋ฆฌ์ ์ด๊ณ  ์šฐ์ˆ˜ํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๋ญ”๊ฐ€๊ฐ€ ๋“ฑ์žฅํ•˜์ง€ ์•Š๋Š”๋‹ค๋ฉด์š”.

๊ฐœ์ธ์ ์œผ๋กœ ์•„์ฃผ ์ธ์ƒ์ ์ด๋ผ๊ณ  ์ƒ๊ฐํ•œ ๋…ผ๋ฌธ์ธ๋ฐ์š”. ๋ธŒ๋ผ์šด๋Œ€์™€ ์ฝ”๋„ฌ๋Œ€ ์—ฐ๊ตฌ์ง„์ด, ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์ผ์ข…์˜ ํ†ต๋…, โ€˜GAN์€ ํ•™์Šต์ด ์–ด๋ ต๋‹คโ€™๋Š” ์ƒ๊ฐ์— ๋„์ „์žฅ์„ ๋˜์ง‘๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์ด ์ƒˆ๋กœ์šด ๋Œ€์•ˆ์œผ๋กœ ์ œ์•ˆํ•œ ๊ฑด R3GAN์ด๋ผ๋Š” ๋ชจ๋ธ์ธ๋ฐ, GAN ํ›ˆ๋ จ์˜ ๋ถˆ์•ˆ์ •์„ฑ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ •๊ทœํ™”๋œ ์ƒ๋Œ€์  ์†์‹ค ํ•จ์ˆ˜(Regularized Relativistic Loss)๋ผ๋Š” ๊ฐœ๋…์„ ๋„์ž…ํ–ˆ๊ณ , ์ด ๋•๋ถ„์— ํ›ˆ๋ จ์ด ํ›จ์”ฌ ๋” ์•ˆ์ •์ ์ด๊ณ  ์ˆ˜๋ ด ๊ฐ€๋Šฅํ•ด์กŒ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ฐฉ์‹์˜ ํฐ ์žฅ์ ์€, ์ด์ œ ๋ณต์žกํ•œ ํœด๋ฆฌ์Šคํ‹ฑ(๊ฒฝํ—˜์  ์กฐ์ • ๊ธฐ๋ฒ•)์— ์˜์กดํ•  ํ•„์š” ์—†์ด, ์ตœ์‹ ์˜ ์‹ ๊ฒฝ๋ง ์•„ํ‚คํ…์ฒ˜๋„ GAN์— ์ž์œ ๋กญ๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ฆ‰, R3GAN์€ ๊ธฐ์กด์˜ GAN ํ›ˆ๋ จ ๋ฐฉ์‹์—์„œ ๋ฌธ์ œ๊ฐ€ ๋˜์—ˆ๋˜ ์—ฌ๋Ÿฌ ๋ถˆ์•ˆ์ • ์š”์†Œ๋“ค์„ ํ•ด๊ฒฐํ•˜๋ฉด์„œ, ๋” ์‹ค์šฉ์ ์ด๊ณ  ๋ฒ”์šฉ์ ์ธ GAN ๊ฐœ๋ฐœ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด ์ฃผ๋Š” ์ค‘์š”ํ•œ ์ง„์ „์ด๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ง€๊ธˆ ๋Œ€๋ถ€๋ถ„ AI ๋ชจ๋ธ์˜ ๊ทผ๊ฐ„์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š” ํŠธ๋žœ์Šคํฌ๋จธ(Transformers). 2025๋…„์—๋Š” ์ด ํŠธ๋žœ์Šคํฌ๋จธ ์•„ํ‚คํ…์ฒ˜์—๋„ ๋ณ€ํ™”๊ฐ€ ์ผ์–ด๋‚˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. FAIR(๋ฉ”ํƒ€ AI ์—ฐ๊ตฌ์†Œ), NYU(๋‰ด์š•๋Œ€ํ•™๊ต), MIT, ํ”„๋ฆฐ์Šคํ„ด๋Œ€ํ•™๊ต์˜ ์—ฐ๊ตฌ์ง„์ด ๋ฐœํ‘œํ•œ ์ด ๋…ผ๋ฌธ์—์„œ๋Š”, ์•ˆ์ •์ ์ด๊ณ  ๊ฐ•๋ ฅํ•œ ํŠธ๋žœ์Šคํฌ๋จธ๋ฅผ ํ•™์Šต์‹œํ‚ค๊ธฐ ์œ„ํ•ด์„œ โ€˜์ •๊ทœํ™”(Normalization)โ€™๊ฐ€ ๋ฐ˜๋“œ์‹œ ํ•„์š”ํ•œ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค๋ผ๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค - ์ •๊ทœํ™”๋Š” ์‹ ๊ฒฝ๋ง์ด ์•ˆ์ •์ ์œผ๋กœ ํ•™์Šต๋˜๋„๋ก, ๊ฐ ์ธต์˜ ์ถœ๋ ฅ ๊ฐ’์„ ์ผ์ •ํ•œ ๋ฒ”์œ„๋กœ ์กฐ์ •ํ•ด์ฃผ๋Š” ๊ธฐ์ˆ ์ด์ฃ 

๋ฉ”ํƒ€(Meta)๋Š” Dynamic Tanh(DyT)๋ผ๋Š” ์ƒˆ๋กœ์šด ๊ธฐ๋ฒ•์„ ์ œ์•ˆํ•˜๋Š”๋ฐ์š”. ์ด ํ•จ์ˆ˜๋Š” ์•„์ฃผ ๋‹จ์ˆœํ•˜๊ณ  ๊ณ„์‚ฐ ํšจ์œจ์ด ๋›ฐ์–ด๋‚˜๋ฉด์„œ๋„, ๊ธฐ์กด์˜ ์ •๊ทœํ™” ๊ณ„์ธต์ด ์ˆ˜ํ–‰ํ•˜๋˜ ๊ธฐ๋Šฅ์„ ํ‰๋‚ด๋ƒ…๋‹ˆ๋‹ค.

  • DyT๋Š” ์ตœ์†Œํ•œ ๊ธฐ์กด์˜ ์ •๊ทœํ™” ๊ณ„์ธต๋งŒํผ ์ž˜ ์ž‘๋™ํ•˜๊ณ , ์–ด๋–ค ๊ฒฝ์šฐ์—๋Š” ๊ทธ๋ณด๋‹ค ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

  • ์ถ”๊ฐ€์ ์ธ ๊ณ„์‚ฐ์ด ํ•„์š”์—†๊ธฐ ๋•Œ๋ฌธ์— ์—ฐ์‚ฐ ์ž์›์ด ์ ˆ์•ฝ๋ฉ๋‹ˆ๋‹ค.

  • ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋‚˜ ๋ชจ๋ธ ์„ค์ •์„ ๋ณต์žกํ•˜๊ฒŒ ์กฐ์ •ํ•  ํ•„์š”๊ฐ€ ์ ์–ด์ ธ์„œ, ํŠœ๋‹์˜ ๋ถ€๋‹ด์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.

  • ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ, ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ, ์ง€๋„ ํ•™์Šต(Supervised Learning), ์‹ฌ์ง€์–ด ์ž๊ธฐ์ง€๋„ํ•™์Šต(Self-Supervised Learning)๊นŒ์ง€ ๋‹ค์–‘ํ•œ ํ•™์Šต ์„ธํŒ…์—์„œ ๋ชจ๋‘ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

์ฆ‰, DyT๋Š” ์ •๊ทœํ™” ์—†์ด๋„ ์•ˆ์ •์ ์ธ ํ•™์Šต์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ์‹์œผ๋กœ, ํŠธ๋žœ์Šคํฌ๋จธ์˜ ํšจ์œจ์„ฑ๊ณผ ๋ฒ”์šฉ์„ฑ์„ ๋”์šฑ ๋†’์—ฌ์ค„ ์ˆ˜ ์žˆ๋Š” ์œ ๋งํ•œ ๋Œ€์•ˆ์œผ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Image Credit: Transformers without Normalization ์˜ค๋ฆฌ์ง€๋„ ๋…ผ๋ฌธ

LLM์€ ์šฐ๋ฆฌ๊ฐ€ ์งˆ๋ฌธํ–ˆ์„ ๋•Œ ๋Œ€๋‹ตํ•˜๋Š” ๋‚ด์šฉ๋ณด๋‹ค ์‹ค์ œ ๋‚ด๋ถ€์ ์œผ๋กœ ๋” ๋งŽ์€ ์‚ฌ์‹ค์„ ์•Œ๊ณ  ์žˆ์„๊นŒ์š”? ํ…Œํฌ๋‹ˆ์˜จ(Technion)๊ณผ ๊ตฌ๊ธ€ ๋ฆฌ์„œ์น˜ ์—ฐ๊ตฌ์ง„์€ ์ด โ€˜์•ˆ๋‹ค(Knowing)โ€™๋Š” ๊ฒŒ ๋ญ˜ ์˜๋ฏธํ•˜๋Š” ๊ฑด์ง€ ๋ช…ํ™•ํ•˜๊ฒŒ ์ •์˜ํ•˜๊ณ , ์‹ค์ œ๋กœ ๊ทธ๋Ÿฐ ํ˜„์ƒ์ด ์กด์žฌํ•˜๋Š”์ง€ - ๋‚ด๋ถ€์ ์œผ๋กœ ๋” ๋งŽ์€ ์‚ฌ์‹ค์„ ์•Œ๊ณ  ์žˆ๋Š”์ง€ - ๋ฅผ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ์ ์œผ๋กœ, LLM์€ ๋Œ€๋‹ตํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ์‹ค์ œ๋กœ ์ตœ๋Œ€ 40% ๋” ๋งŽ์€ ์ •๋ณด๋ฅผ ์•Œ๊ณ  ์žˆ๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ทธ ์ •๋ณด๋ฅผ ์ž… ๋ฐ–์œผ๋กœ ๋Œ์–ด๋‚ด๋Š” ๊ฒƒ, ์ฆ‰ ๋ชจ๋ธ์ด ์•Œ๊ณ  ์žˆ๋Š” ๋‚ด์šฉ์„ ์‹ค์ œ ๋‹ต๋ณ€์— ๋ฐ˜์˜ํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ์ผ์€ ์ƒ๊ฐ๋ณด๋‹ค ํ›จ์”ฌ ์–ด๋ ต๊ณ  ์„ฌ์„ธํ•œ ์ž‘์—…์ด๋ผ๋Š” ์ ๋„ ํ•จ๊ป˜ ๋“œ๋Ÿฌ๋‚ฌ์Šต๋‹ˆ๋‹ค. ์žฌ๋ฏธ์žˆ๋Š” ๋…ผ๋ฌธ์ด์ฃ ?

๋ˆ„๊ฐ€ ๋ญ๋ž˜๋„ DeepSeek ๋ชจ๋ธ์€ ์˜ฌํ•ด AI ์˜์—ญ์—์„œ ๊ฐ€์žฅ ์ฃผ๋ชฉ๋ฐ›๊ณ  ์žˆ๋Š” ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜์ฃ . DeepSeek์˜ ๋…ผ๋ฌธ์€, AI ๋ถ„์•ผ์˜ ์ตœ์‹  ํŠธ๋ Œ๋“œ๋ฅผ ๋”ฐ๋ผ์žก๊ณ  ์‹ถ๋‹ค๋ฉด ํ•œ ๋ฒˆ ๊ผญ ์ฝ์–ด๋ด์•ผ ํ•  ํ•„๋… ์ž๋ฃŒ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๊ตฌ์š”. ํŠนํžˆ ์ด ์—ฐ๊ตฌ๋Š”, ํ•˜๋“œ์›จ์–ด์™€ ๋ชจ๋ธ์„ ํ•จ๊ป˜ ์„ค๊ณ„(Co-design)ํ•ด์„œ ์ดˆ๋Œ€ํ˜• LLM์„ ์–ผ๋งˆ๋‚˜ ํšจ์œจ์ ์œผ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๋‹ค๋ฃจ๊ณ  ์žˆ๊ฑฐ๋“ ์š”. ์ค‘์š”ํ•œ ๋ณ‘๋ชฉ ์ง€์ ์ธ ๋ฉ”๋ชจ๋ฆฌ, ์—ฐ์‚ฐ ํšจ์œจ, ๋„คํŠธ์›Œํฌ ๋Œ€์—ญํญ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ง‘์ค‘์ ์œผ๋กœ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค - GPU ๊ณต๊ธ‰์ด ๋ฌธ์ œ์ธ ์ƒํƒœใ…‡์„œ ๊ณ ์œก์ง€์ฑ…์œผ๋กœ ๊ณ ์•ˆํ•œ ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ํ•  ์ˆ˜๋„ ์žˆ๊ฒ ์ง€๋งŒ, โ€˜์ œ์•ฝ ์กฐ๊ฑดโ€™์ด ์—†๋Š” ์‚ฌ๋žŒ์€ ์—†์ž–์•„์š”?

DeepSeek์—์„œ ๋ชจ๋ธ์„ ๋งŒ๋“ค๋ฉด์„œ ๊ณ ์•ˆํ•œ ์ƒˆ๋กœ์šด ๊ธฐ๋ฒ•๋“ค์— ๋Œ€ํ•ด์„œ๋Š” ์ด๋ฏธ ๋ณด์‹  ๋ถ„๋“ค๋„ ๋งŽ๊ธด ํ•˜๊ฒ ์ง€๋งŒ, ์–ด์จŒ๋“  ๋…ผ๋ฌธ์—์„œ ๋‹ค๋ฃจ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค์€ ์ด๋Ÿฐ ๊ฒƒ๋“ค์ž…๋‹ˆ๋‹ค:

  • Multi-head Latent Attention (MLA)
    ๊ธฐ์กด์˜ ์–ดํ…์…˜ ๋ฐฉ์‹๋ณด๋‹ค ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ์ค„์ด๊ธฐ ์œ„ํ•ด ๊ณ ์•ˆ๋œ ์ƒˆ๋กœ์šด ์–ดํ…์…˜ ๊ตฌ์กฐ์ฃ . ๋ณต์žกํ•œ ์ž…๋ ฅ๊ฐ’์„ ๋” ์••์ถ•ํ•˜๋ฉด์„œ ์ฒ˜๋ฆฌํ•ด์„œ, ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์„ ํฌ๊ฒŒ ๋†’์—ฌ์ค๋‹ˆ๋‹ค.

  • Mixture of Experts (MoE)
    ๋ชจ๋ธ์˜ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋™์‹œ์— ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ , ์ž…๋ ฅ๊ฐ’์— ๋”ฐ๋ผ์„œ ์ผ๋ถ€์˜ ์ „๋ฌธ๊ฐ€ ๋„คํŠธ์›Œํฌ๋งŒ ์„ ํƒ์ ์œผ๋กœ ์‚ฌ์šฉํ•ด์„œ, ๊ณ„์‚ฐ๋Ÿ‰๊ณผ ํ†ต์‹ ๋Ÿ‰ ๊ฐ„์˜ ๋ฐธ๋Ÿฐ์Šค๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์กฐ์ ˆํ•ฉ๋‹ˆ๋‹ค.

  • FP8 Mixed-Precision Training
    ๊ธฐ์กด์˜ 16๋น„ํŠธ๋ณด๋‹ค ๋” ๋‚ฎ์€ ์ •๋ฐ€๋„์˜ 8๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์  ์—ฐ์‚ฐ(FP8)์„ ์ผ๋ถ€์— ์ ์šฉํ•ด์„œ, ๋ฉ”๋ชจ๋ฆฌ์™€ ์—ฐ์‚ฐ ์ž์›์„ ์ ˆ์•ฝํ•˜๋ฉด์„œ๋„ ํ•™์Šต ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด ์ค๋‹ค.

  • Multi-Plane Network Topology
    ๋ฐ์ดํ„ฐ ์„ผํ„ฐ์—์„œ์˜ ๋„คํŠธ์›Œํฌ ์ธํ”„๋ผ ๋ถ€ํ•˜๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์—ฐ๊ฒฐ ๊ตฌ์กฐ๋ฅผ ๊ณ ์•ˆํ•ด์„œ, ๋Œ€๊ทœ๋ชจ LLM ํ›ˆ๋ จ์— ํ•„์š”ํ•œ ์ธํ”„๋ผ ์ž์›์˜ ํšจ์œจ์„ ๊ทน๋Œ€ํ™”ํ•ฉ๋‹ˆ๋‹ค.

์‹ ๋ขฐ์„ฑ(Trustworthiness). AI ๋ถ„์•ผ์—์„œ ๋Š์ž„์—†์ด ๋…ผ์˜๋˜๋Š” ํ•ต์‹ฌ ์ฃผ์ œ์ด๋ฉด์„œ๋„, ๊ฐœ์ธ์ ์œผ๋กœ๋Š” - ์˜์‹์ ์ด๋“  ๋ฌด์˜์‹์ ์ด๋“  - ํ˜„์žฅ์—์„œ๋Š” ์•„์ฃผ โ€˜๊ฐ„๊ณผ๋˜๊ณ  ๋งˆ๋Š”โ€™ ๋ถ„์•ผ๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์ƒ์„ฑํ˜• AI ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ์ตœ์ดˆ์˜ โ€˜๋‹ค์ด๋‚˜๋ฏน ๋ฒค์น˜๋งˆํ‚น ํ”Œ๋žซํผโ€™์„ ์ œ์•ˆํ•˜๋Š”๋ฐ์š”. ๊ธฐ์กด์ฒ˜๋Ÿผ ๊ณ ์ •๋œ ํ…Œ์ŠคํŠธ๋งŒ ๊ฐ€์ง€๊ณ  ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฐœ๋…์„ ๋„˜์–ด์„œ, ์–ธ์–ด ๋ชจ๋ธ(LLM), ๋น„์ „-์–ธ์–ด ๋ชจ๋ธ, ํ…์ŠคํŠธ-์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ชจ๋ธ ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ์ƒ์„ฑํ˜• AI๋ฅผ ๋Œ€์ƒ์œผ๋กœ, ์ง„์‹ค์„ฑ(Truthfulness), ์•ˆ์ „์„ฑ(Safety), ๊ณต์ •์„ฑ(Fairness), ๊ฒฌ๊ณ ์„ฑ(Robustness) ๊ฐ™์€ ์—ฌ๋Ÿฌ ํ‰๊ฐ€ ํ•ญ๋ชฉ์„ ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

ํŠนํžˆ ์ด ํ”Œ๋žซํผ์€ ๊ธฐ์ˆ ์  ์„ค๊ณ„ ๋ฐฉํ–ฅ๊ณผ ๋‚ด์šฉ์„ ํ˜„์žฌ๋„ ์ „ ์„ธ๊ณ„์ ์œผ๋กœ ๋…ผ์˜๋˜๋Š” ๊ทœ์ œ ๋™ํ–ฅ, ๊ทธ๋ฆฌ๊ณ  ์œค๋ฆฌ ๊ธฐ์ค€์— ์ž˜ ๋งž์ถ”๋Š”๋ฐ(์ •๋ ฌ; Alignment) ์ค‘์ ์„ ๋‘๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ AI์˜ โ€˜์„ฑ๋Šฅโ€™๋งŒ ๋ณด๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ, ์‹ค์ œ ์ •์ฑ…๊ณผ ์‚ฌํšŒ์  ์š”๊ตฌ์— ๋ถ€ํ•ฉํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋ชจ๋ธ์„ ์„ค๊ณ„ํ•˜๊ณ  ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์ด ๋…ผ๋ฌธ์˜ ์˜๋ฏธ๋Š” ํฝ๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” AI ๊ธฐ์ˆ ์˜ ๊ฐœ๋ฐœ๊ณผ ์‹ค์ œ ๊ทœ์ œใƒป์œค๋ฆฌ์  ์‹ค์ฒœ ์‚ฌ์ด์˜ ๊ฐญ(Gap)์„ ๋ฉ”์šฐ๊ณ ์ž ํ•˜๋Š” ์ค‘์š”ํ•œ ์‹œ๋„๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ด๋ ‡๊ฒŒ, ์˜ฌํ•ด ์ƒ๋ฐ˜๊ธฐ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ AI ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ๋ณด์—ฌ์ฃผ๋Š” 8๊ฐœ์˜ ๋…ผ๋ฌธ์„ ํ•œ ๋ฒˆ ํ•จ๊ป˜ ๋ฆฌ๋งˆ์ธ๋“œํ•ด ๋ดค๋Š”๋ฐ์š”.

2025๋…„ ์ดˆ๋ฐ˜์˜ AI ์—ฐ๊ตฌ๋Š” ๋ชจ๋ธ์˜ โ€˜์‚ฌ๊ณ ๋ ฅโ€™๊ณผ โ€˜์‹ ๋ขฐ์„ฑโ€™์„ ์‹ค์ œ๋กœ ๊ตฌํ˜„ํ•˜๊ณ  ํ™•์žฅํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋น ๋ฅด๊ฒŒ ์›€์ง์ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. LLM๊ณผ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ๋Œ€์ƒ์œผ๋กœ ํ•ด์„œ, ๋‹จ์ˆœํ•˜๊ฒŒ ์ •๋‹ต์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฑธ ๋„˜์–ด์„œ ์ถ”๋ก  ๊ณผ์ •์˜ ์ •ํ™•์„ฑ, ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ๊ฐ„์˜ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ, ์ •๊ตํ•œ ๋ฉ”๋ชจ๋ฆฌยท์—ฐ์‚ฐ ์ตœ์ ํ™”, ๊ทธ๋ฆฌ๊ณ  ์‚ฌํšŒ์  ์ฑ…์ž„ ๊ธฐ์ค€์„ ์ถฉ์กฑํ•˜๋Š” ํ‰๊ฐ€์ฒด๊ณ„๊นŒ์ง€ ํฌํ•จํ•˜๋Š” ์—ฐ๊ตฌ๋“ค์ด ํ™œ๋ฐœํ•˜๊ฒŒ ์ง„ํ–‰ ์ค‘์ž…๋‹ˆ๋‹ค. ํŠนํžˆ ๊ฐ•ํ™”ํ•™์Šต(RL; Reinforcement Learning), ํ”„๋กœ์„ธ์Šค ๊ธฐ๋ฐ˜์˜ ๋ณด์ƒ, ๋‹ค์ด๋‚˜๋ฏน ๋ฒค์น˜๋งˆํฌ, ํ•˜๋“œ์›จ์–ด-๋ชจ๋ธ ๊ณต๋™ ์„ค๊ณ„(Co-design) ๊ฐ™์€ ์ ‘๊ทผ์€, AI๊ฐ€ ๋” ๊นŠ์ด ์‚ฌ๊ณ ํ•˜๊ณ , ๋” ์ ์‘๋ ฅ ์žˆ๊ฒŒ, ๊ทธ๋ฆฌ๊ณ  ๋” ์‹ ๋ขฐ๋ฐ›์„ ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“œ๋Š” ํ•ต์‹ฌ ๊ธฐ์ˆ  ์ถ•์œผ๋กœ ๋ถ€์ƒํ•˜๊ณ  ์žˆ๋‹ค๊ณ  ์ •๋ฆฌํ•ด ๋ด…๋‹ˆ๋‹ค.

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.