• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#117: แ„‹แ…กแ†ซแ„ƒแ…ณแ„…แ…ฆ แ„แ…กแ„‘แ…กแ„‰แ…ตแ„‹แ…ด แ„‚แ…ฎแ†ซแ„‹แ…ณแ„…แ…ฉ แ„‡แ…ฉแ†ซ, LLMแ„‹แ…ด 'แ„‚แ…ขแ„‡แ…ตแ„Žแ…ตแ„‚แ…ณแ†ซ แ„‰แ…ฆแ„€แ…จ'

๐ŸŒFOD#117: แ„‹แ…กแ†ซแ„ƒแ…ณแ„…แ…ฆ แ„แ…กแ„‘แ…กแ„‰แ…ตแ„‹แ…ด แ„‚แ…ฎแ†ซแ„‹แ…ณแ„…แ…ฉ แ„‡แ…ฉแ†ซ, LLMแ„‹แ…ด 'แ„‚แ…ขแ„‡แ…ตแ„Žแ…ตแ„‚แ…ณแ†ซ แ„‰แ…ฆแ„€แ…จ'

+ Werewolf(แ„‚แ…ณแ†จแ„ƒแ…ขแ„‹แ…ตแ†ซแ„€แ…กแ†ซ) แ„‡แ…ฆแ†ซแ„Žแ…ตแ„†แ…กแ„แ…ณ แ„†แ…ตแ†พ แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‚แ…ฒแ„‰แ…ณ แ„†แ…ตแ†พ แ„‹แ…งแ†ซแ„€แ…ฎ

AI ์‹œ๋Œ€์˜ ๋ฐฉ๋ž‘์ž โ€˜์•ˆ๋“œ๋ ˆ ์นดํŒŒ์‹œโ€™์˜ ๋ˆˆ์œผ๋กœ ๋ณธ LLM์˜ โ€˜๋‚ด๋น„์น˜๋Š” ์„ธ๊ณ„โ€™

์•ˆ๋“œ๋ ˆ ์นดํŒŒ์‹œ

์—ฌ๋Ÿฌ๋ถ„๋“ค๋„ ์•ˆ๋“œ๋ ˆ ์นดํŒŒ์‹œ์— ๋Œ€ํ•ด์„œ ๋งŽ์ด ๋“ค์–ด๋ณด์…จ๊ณ  ๋˜ ์ž˜ ์•„์‹ค ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์•ˆ๋“œ๋ ˆ๋Š” AI ์—…๊ณ„๊ฐ€, ๊ทธ๋ฆฌ๊ณ  ๋งŽ์€ ๋ถ„์ด ์•„๋ผ๊ณ  ์ข‹์•„ํ•˜๋Š”, โ€˜๋ฐฉ๋ž‘ํ•˜๋Š” ์ž์—ฐ์ฃผ์˜์žโ€™์ด์ฃ . ์Šคํƒ ํฌ๋“œ๋Œ€ํ•™๊ต์—์„œ ๋ฐ•์‚ฌ ํ•™์œ„๋ฅผ ํ•œ ์•ˆ๋“œ๋ ˆ๋Š”, ํ•œ ๋•Œ ํ…Œ์Šฌ๋ผ์˜ AI๋ฅผ ์ฑ…์ž„์ง€๋Š” ์ด๊ด„์ด์—ˆ๊ณ , ์˜คํ”ˆAI์˜ ์ฐฝ๋ฆฝ ๋ฉค๋ฒ„์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ , CS231n ๊ฐ•์˜๋ฅผ ํ†ตํ•ด์„œ ์ˆ˜๋งŽ์€ ์—ด์„ฑ์ ์ธ AI ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ โ€˜์ปจ๋ณผ๋ฃจ์…˜ ๋„คํŠธ์›Œํฌโ€™์˜ ๋ˆˆ์„ ํ†ตํ•ด์„œ ์„ธ์ƒ์„ ๋ณด๋Š” ๋ฒ•์„ ๊ฐ€๋ฅด์น˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค.

์•ˆ๋“œ๋ ˆ๋Š”, ๋งˆ์น˜ ์ˆจ ์‰ฌ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ โ€˜์ƒˆ๋กœ์šด ์šฉ์–ดโ€™๋ฅผ ๋งŒ๋“ค์–ด๋‚ด๋Š” ์žฌ์ฃผ๊ฐ€ ์žˆ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ด์ „์˜ โ€˜์†Œํ”„ํŠธ์›จ์–ด ์ฝ”๋“œโ€™๋ฅผ โ€˜ํ•™์Šต๋œ ๊ฐ€์ค‘์น˜(Learned Weights)โ€™๋กœ ๋‹ค์‹œ ์ •์˜ํ•œ โ€˜์†Œํ”„ํŠธ์›จ์–ด 2.0โ€™ ๊ฐœ๋…์„ ์ฒ˜์Œ ์ œ์‹œํ–ˆ๋˜ ๊ฒƒ๋„ ์•ˆ๋“œ๋ ˆ์Šค๋Ÿฌ์šด ๋ฐœ์ƒ์ด์—ˆ๊ตฌ์š”.

2023๋…„์—๋Š” ์˜คํ”ˆAI๋กœ ๋Œ์•„๊ฐ€์„œ GPT-4, ๊ทธ๋ฆฌ๊ณ  ChatGPT ์ถœ์‹œ๋ฅผ ํ•จ๊ป˜ ๋„์™”๊ณ , 2024๋…„์—๋Š” ๋‹ค์‹œ ํšŒ์‚ฌ๋ฅผ ๋– ๋‚˜์„œ ์ƒˆ๋กœ์šด ํ˜•ํƒœ์˜ โ€˜AI-Native ํ•™๊ตโ€™๋ผ๊ณ  ๋ถ€๋ฅผ ๋งŒํ•œ โ€˜์œ ๋ ˆ์นด ๋žฉ์Šค(Eureka Labs)โ€™๋ฅผ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ์—๋Š” ํ”„๋กฌํ”„ํŠธ(Prompt), ์—์ด์ „ํŠธ(Agent), ๊ทธ๋ฆฌ๊ณ  ์ž์œจ์„ฑ ์Šฌ๋ผ์ด๋”(Autonomy Slider)๋ผ๋Š” ์š”์†Œ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ์†Œํ”„ํŠธ์›จ์–ด๊ฐ€ ๋”์šฑ ์ง€๋Šฅ์ ์ด๊ณ  ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ, โ€˜์‚ฌ์šฉ์ž ๋งž์ถคํ˜•โ€™์œผ๋กœ ์ž‘๋™ํ•˜๋Š” โ€˜์†Œํ”„ํŠธ์›จ์–ด 3.0โ€™ ํŒจ๋Ÿฌ๋‹ค์ž„์— ๋Œ€ํ•ด์„œ ๊ณ ๋ฏผํ•˜๊ณ  ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์•ˆ๋“œ๋ ˆ์˜ ์†์„ ๊ฑฐ์น˜๋ฉด, ์žฅ๋‚œ๊ฐ ๊ฐ™๋˜ ๋ ˆํฌ์ง€ํ† ๋ฆฌ๋„ โ€˜microgradโ€™, โ€˜makemoreโ€™, โ€˜nanoGPTโ€™์ฒ˜๋Ÿผ ์ˆœ์‹๊ฐ„์— ์ปฌํŠธ์ ์ธ ํด๋ž˜์‹์ด ๋˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค:

  • micrograd: ์ž๋™ ๋ฏธ๋ถ„(Gradient Computation) ์—”์ง„์„ 100์ค„ ์ •๋„ ์ฝ”๋“œ๋กœ ๊ตฌํ˜„ํ•œ ํ† ์ด ํ”„๋กœ์ ํŠธ. ๋”ฅ๋Ÿฌ๋‹์˜ ํ•ต์‹ฌ์ธ Backpropagation์„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ ํ•ด ์ค๋‹ˆ๋‹ค.

  • makemore: ๋ฌธ์ž ๋ ˆ๋ฒจ์˜ ์–ธ์–ด ๋ชจ๋ธ๋กœ, Name Generator๊ฐ™์ด ์ž‘๋™์„ ํ•ฉ๋‹ˆ๋‹ค. RNN์ด๋‚˜ Transformer์˜ ๊ธฐ์ดˆ๋ฅผ ์„ค๋ช…ํ•˜๊ณ , ๊ฐ„๋‹จํ•œ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ AI ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • nanoGPT: GPT ๋ชจ๋ธ์„ ์•„์ฃผ ์ž‘์€ ๊ทœ๋ชจ๋กœ ์žฌํ˜„ํ•œ ํ”„๋กœ์ ํŠธ๋กœ, ์ˆ˜๋ฐฑ ์ค„ ์ฝ”๋“œ๋กœ ChatGPT ๊ฐ™์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์˜ ์›๋ฆฌ๋ฅผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ๋งŽ์€ AI ๊ฐœ๋ฐœ์ž๋“ค์ด ์Šค์Šค๋กœ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐ ํฐ ๋„์›€๊ณผ ์˜๊ฐ์„ ์คฌ์ฃ .

์ด๊ฒƒ ๋ฟ์ธ๊ฐ€์š”? โ€˜๋ฐ”์ด๋ธŒ ์ฝ”๋”ฉ(Vibe Coding)โ€™ ๊ฐ™์€ ํ‘œํ˜„๋„ ์•ˆ๋“œ๋ ˆ์˜ ์ž…์—์„œ ๋‚˜์™€์„œ ์ด์ œ AI๋ฅผ ์•„๋Š” ๋ชจ๋“  ์‚ฌ๋žŒ์ด ๋”ฐ๋ผ ์“ฐ๋Š” ์œ ํ–‰์–ด๊ฐ€ ๋˜์—ˆ์ฃ .

์•ˆ๋“œ๋ ˆ๊ฐ€ ์“ฐ๋Š” ๋ธ”๋กœ๊ทธ ํฌ์ŠคํŠธ๋Š”, ์ˆ˜๋…„๊ฐ„ AI ๋ถ„์•ผ์˜ โ€˜๊ต๊ณผ์„œโ€™๊ฐ™์€ ์ทจ๊ธ‰์„ ๋ฐ›๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

X(๊ตฌ ํŠธ์œ„ํ„ฐ) ํŒ”๋กœ์›Œ๋Š” 130๋งŒ ๋ช…, ์œ ํŠœ๋ธŒ ๊ตฌ๋…์ž๋Š” 100๋งŒ ๋ช… ์ด์ƒ - ๊ทธ์•ผ๋ง๋กœ ์—„์ฒญ๋‚œ ์˜ํ–ฅ๋ ฅ(์•„์ฃผ ์ข‹์€ ์˜๋ฏธ์—์„œ์š”)์„ ๊ฐ€์ง„ ์ธ๋ฌผ์ด์ฃ .

๊ทธ๋ž˜์„œ ๋ฌธ๋“ ์ด๋Ÿฐ ์ƒ๊ฐ์ด ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. โ€œ๋งค๋‹ฌ ์•ˆ๋“œ๋ ˆ๊ฐ€ ๊ด€์‹ฌ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค์„ ์‚ดํŽด๋ณด๊ณ , ๊ทธ ํ•ต์‹ฌ๋งŒ ์™์™ ๋ฝ‘์•„ ์ •๋ฆฌํ•ด ๋ณด๋ฉด ์–ด๋–จ๊นŒโ€ ํ•˜๋Š” ์ƒ๊ฐ์ด์š” - ์–ด์ฉŒ๋ฉด, ์šฐ๋ฆฌ์—๊ฒŒ โ€˜์ œ 3์˜ ๋ˆˆโ€™์„ ์—ด์–ด์ค„ ์ง€๋„ ๋ชจ๋ฅด์ž–์•„์š”?

์ง€๋‚œ 8์›” 28์ผ, 'LLM-๋„ค์ดํ‹ฐ๋ธŒ ์ปค๋ฆฌํ˜๋Ÿผ'์ด๋ผ๋Š” ๊ฐœ๋…์— ๊นŠ๊ฒŒ ํŒŒ๊ณ ๋“œ๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค€ ์•ˆ๋“œ๋ ˆ๋Š”, ์ด๋Ÿฐ ์งˆ๋ฌธ์„ ๋˜์กŒ์Šต๋‹ˆ๋‹ค: โ€œ์™œ ๋ชจ๋ธ์—๊ฒŒ ํ…์ŠคํŠธ ๋ฉ์–ด๋ฆฌ์ธ PDF๋ฅผ ๊ทธ๋Œ€๋กœ ๋˜์ ธ์•ผ ํ•˜๋‚˜? ๋˜‘๊ฐ™์€ ์ž๋ฃŒ๋ฅผ ๊ธฐ๊ณ„๊ฐ€ ๋” ์ž˜ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๊ณผ์ •(Course)์œผ๋กœ ์žฌ๊ตฌ์„ฑํ•˜๋ฉด ์–ด๋–จ๊นŒ?" ํ•˜๋Š” ์งˆ๋ฌธ์ด์š”.

๊ทธ๋ฆฌ๊ณ , ๊ทธ ๋ฐฉ๋ฒ•์„ ๊ตฌ์ฒด์ ์œผ๋กœ ์ œ์•ˆํ•˜๋Š”๋ฐ์š”:

  • ์„ค๋ช…(Exposition): ๋งˆํฌ๋‹ค์šด(Markdown)์œผ๋กœ ์ •๋ฆฌํ•˜๊ณ ,

  • ๋ฌธ์ œ ํ’€์ด(Problems): ์ง€๋„ ํŒŒ์ธํŠœ๋‹(Supervised Fine-Tuning) ์Œ์œผ๋กœ ๋งŒ๋“ค๊ณ ,

  • ์—ฐ์Šต(Exercises): ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Environments) ํ™˜๊ฒฝ์„ ๊ตฌ์ถ•ํ•˜๊ณ ,

  • ๋ฌธ์ œ ์ƒ์„ฑ(Problem Generators): ๋ฌดํ•œํžˆ ๋งŽ์€ ํ•ฉ์„ฑ ๋ฌธ์ œ๋ฅผ ์ž๋™์œผ๋กœ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฑฐ์ฃ .

์ด๋Ÿฐ ํ”„๋ ˆ์ž„ ์•ˆ์—์„œ๋ผ๋ฉด, ์•„๋งˆ LLM์€ ๋‹จ์ˆœํžˆ ์ •๋ณด๋ฅผ ์•”๊ธฐํ•˜๋Š” ๊ฒƒ ์ด์ƒ์„ ํ•ด๋‚ผ์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค: ๋งˆ์น˜ ํ•™์ƒ์ด ํ•˜๋“ฏ์ด โ€˜๋ฌผ๋ฆฌํ•™ ๊ฐ•์˜๋ฅผ ๋“ค์œผ๋ฉด์„œ ์—ฐ์Šต๋„ ํ•˜๊ณ , ํ”ผ๋“œ๋ฐฑ๋„ ๋ฐ›๊ณ , ์ฑ„์ ํ•˜๋Š”โ€™ ์‚ฌ์ดํด์„ ๊ฑฐ์น˜๋Š” ๊ฒƒ์ด์ฃ .

์ด ์•„์ด๋””์–ด๊ฐ€ ์‹คํ˜„๋˜๊ณ  ๊ตด๋Ÿฌ๊ฐ€๊ฒŒ ๋œ๋‹ค๋ฉด, ๊ทธ ํŒŒ๊ธ‰๋ ฅ์€ ์ƒ๋‹นํ•˜์ง€ ์•Š์„๊นŒ์š”? ๋ชจ๋“  ์ธ๊ฐ„์˜ ํ•™๋ฌธ ๋ถ„์•ผ๊ฐ€ ์ฒด๊ณ„์ ์ธ ๋Œ€ํ™”ํ˜• ๊ต์œก ๊ณผ์ •์œผ๋กœ ๋ฐ”๋€Œ๊ณ , ๊ธฐ๊ณ„๊ฐ€ ์ด ๊ณผ์ •์„ ์ง์ ‘ ์ด์ˆ˜ํ•˜๋Š” ๊ฒƒ ๊ฐ™์€ 'LLM ์•„์นด๋ฐ๋ฏธ'๊ฐ€ ์—ด๋ฆด ์ˆ˜ ์žˆ๋‹ค๋Š” ์˜๋ฏธ๋‹ˆ๊นŒ์š”. ์ด๋ ‡๊ฒŒ ๋˜๋ฉด, ๋ณ‘๋ชฉ(Bottleneck)์€ ์ธํ„ฐ๋„ท์— ์žˆ๋Š” ํ…์ŠคํŠธ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ โ€˜LLM์„ ์œ„ํ•œ ๊ต์œก ํŒŒ์ดํ”„๋ผ์ธ์„ ์„ค๊ณ„ํ•˜๋Š” ๊ฒƒโ€™์ด ๋˜๋ฉด์„œ ํŒ๋„๊ฐ€ ์™„์ „ํžˆ ๋ฐ”๋€” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ €ํฌ์˜ ์งˆ๋ฌธ์€, โ€œ์ธํ„ฐ๋„ท์ด ์‚ฌ์ „ ํ•™์Šต(Pre-training)์„ ์œ„ํ•œ ํ›ˆ๋ จ์žฅ ์—ญํ• ์„ ํ–ˆ๋‹ค๋ฉด, LLMํ™”๋œ ์ปค๋ฆฌํ˜๋Ÿผ์€ ์ง€์‹์˜ ํ™œ์šฉ(Application)๊ณผ ์ถ”๋ก (Reasoning)์„ ์œ„ํ•œ ํ›ˆ๋ จ์žฅ์ด ๋  ์ˆ˜ ์žˆ์„๊นŒ?โ€ํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ์ธํ„ฐ๋„ท์˜ ๋ฐ์ดํ„ฐ๋Š” ๊ฝค ๋งŽ์€ ๊ฒฝ์šฐ์— ๋ถ€์ •ํ™•ํ•˜๊ฑฐ๋‚˜ ๋ชจ์ˆœ์ด ๋  ๋•Œ๋„ ์žˆ๊ณ , ์ฒด๊ณ„์ ์ด์ง€๋„ ์•Š์ฃ . ํ•œ ๊ถŒ์˜ ์ฑ…์ด๋ผ๊ธฐ๋ณด๋‹ค๋Š” ๋„์„œ๊ด€์—์„œ ๋ฌด์ž‘์œ„๋กœ ๋ฝ‘์€ ํŽ˜์ด์ง€ ๋ฌถ์Œ ๊ฐ™์€ ๊ฑฐ๋ผ๊ณ  ํ• ๊นŒ์š”? LLM์ด ์—ฌ๊ธฐ์„œ ๊ธฐ๋ณธ์ ์ธ ๋ฌธ๋ฒ•๊ณผ ์ƒ์‹์„ ์Šต๋“ํ•˜์ง€๋งŒ, ๊นŠ์ด ์žˆ๋Š” ์‚ฌ๊ณ ์™€ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ์Œ“๊ธฐ์—๋Š” ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฐ˜๋ฉด์—, LLMํ™”๋œ ์ปค๋ฆฌํ˜๋Ÿผ์€ ์ž˜ ์งœ์ธ ๊ต๊ณผ์„œ ๊ฐ™์€ ๊ฑฐ๋ผ๊ณ  ๋ด์•ผ๊ฒ ์ฃ . ๋‹จ๊ณ„๋ณ„๋กœ ๋‚œ์ด๋„๋ฅผ ๋†’์—ฌ๊ฐ€๋ฉด์„œ ๋ฌธ์ œ๋ฅผ ํ’€๊ณ , ์‹ค์ˆ˜๋ฅผ ๋ฐ”๋กœ์žก๋Š” ๊ณผ์ •์„ ํ†ตํ•ด์„œ ๋ชจ๋ธ์ด ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๊ณ , ๊ฐ€์„ค์„ ์„ธ์šฐ๊ณ , ๋…ผ๋ฆฌ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋ฐฐ์šธ ์ˆ˜ ์žˆ์„์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค.

๋ชจ๋ธ์ด โ€˜ํ•™์Šตํ•˜๋Š” ๋ฐฉ๋ฒ•โ€™์€ ๊ฐ๊ฐ ์„œ๋กœ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ์˜ ๊ธฐ๋ฐ˜ ์œ„์—์„œ ์ง„ํ™”ํ•ด ์™”์ฃ :

  • ์‚ฌ์ „ ํ•™์Šต(Pre-Training) ์‹œ๋Œ€์—๋Š” ์ธํ„ฐ๋„ท ํ…์ŠคํŠธ๊ฐ€ ๊ทธ ์—ญํ• ์„ ํ–ˆ๊ณ ,

  • ์ง€๋„ ํŒŒ์ธํŠœ๋‹(Supervised Fine-Tuning) ์‹œ๋Œ€์—๋Š” ๋Œ€ํ™”ํ˜• ๋ฐ์ดํ„ฐ๊ฐ€,

  • ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning) ์‹œ๋Œ€์—๋Š” ํ™˜๊ฒฝ(Environments)์ด ๋ฐ์ดํ„ฐ์˜ ํ•ต์‹ฌ์ด์—ˆ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ง€๊ธˆ ํ˜„์žฌ, ๊ฐ€์žฅ ํฐ ๋‚œ๊ด€์€ ์ด 'ํ™˜๊ฒฝ'์„ ๋Œ€๊ทœ๋ชจ๋กœ ๊ตฌ์ถ•ํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ๋งˆ์Œ๊ป ์ƒํ˜ธ์ž‘์šฉ์„ ํ•˜๊ณ , ์Šค์Šค๋กœ๋ฅผ ์‹œํ—˜ํ•˜๋ฉด์„œ ์„ฑ์žฅํ•ด ๊ฐˆ ์ˆ˜ ์žˆ๋Š” ์ผ์ข…์˜ '์ƒŒ๋“œ๋ฐ•์Šคโ€™๋ฅผ ๋งŒ๋“œ๋Š” ๊ฑฐ์ฃ .

์˜ˆ์ „์— ์˜คํ”ˆAI์˜ 'Gym'์ด ๋กœ๋ด‡์ด๋‚˜ ์•„ํƒ€๋ฆฌ ๊ฒŒ์ž„ ์—์ด์ „ํŠธ๋ฅผ ์œ„ํ•œ ํ™˜๊ฒฝ์ด์—ˆ๋‹ค๋ฉด, ์ง€๊ธˆ 'Prime Intellect'์˜ 'Environments Hub' ๊ฐ™์€ ์‹œ๋„๋Š” LLM์„ ์œ„ํ•œ ์ฝ”๋”ฉ, ์ถ”๋ก , ๊ณ„ํš ์„ธ์šฐ๊ธฐ ๊ฐ™์€ ํ™˜๊ฒฝ์„ ๋งŒ๋“ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฐ๋ฐ, ์•ˆ๋“œ๋ ˆ๋Š” '๋ณด์ƒ ํ•จ์ˆ˜(Reward Functions)'์— ๋Œ€ํ•ด์„œ๋Š” ํšŒ์˜์ ์ธ ์‹œ๊ฐ์„ ๋“œ๋Ÿฌ๋‚ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค: ์ธ๊ฐ„์ด ์ง€์ ์ธ ๊ณผ์ œ๋ฅผ ๋‹จ์ˆœํžˆ ๋ณด์ƒ๊ณผ ๋ฒŒ์น™์„ ํ†ตํ•ด ๋ฐฐ์šฐ๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ๋Œ€์‹ ์—, ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์•”์‹œํ•˜๊ณ  ์žˆ๋Š”๋ฐ, ๋ฐ”๋กœ ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ ํ•™์Šต(System-Prompt Learning), ๋งฅ๋ฝ ๊ธฐ๋ฐ˜ ์—…๋ฐ์ดํŠธ(Context-Driven Updates), ๊ทธ๋ฆฌ๊ณ  ๊ธฐ์–ต ์ •์ œ(Memory Distillation) ๊ฐ™์€ ๊ฒƒ๋“ค์ž…๋‹ˆ๋‹ค:

  • ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ ํ•™์Šต: ์ด๊ฑด AI์—๊ฒŒ ์—ญํ• ์„ ์ •ํ•ด์ฃผ๋Š” ๊ฒ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด์„œ, "๋„ˆ๋Š” ์ตœ๊ณ ์˜ ์—ญ์‚ฌํ•™์ž์•ผ"๋ผ๊ณ  ๋งํ•ด์ฃผ๋ฉด, AI๋Š” ๋ณด์ƒ์ด ์—†์ด๋„ ์—ญ์‚ฌํ•™์ž์ฒ˜๋Ÿผ ๊นŠ์ด ์žˆ๊ณ  ๋…ผ๋ฆฌ์ ์ธ ๋‹ต๋ณ€์„ ํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ๋ฌธ์ œ๋ฅผ ํ’€๊ธฐ๋ณด๋‹ค๋Š”, ์—ญํ• ์— ๋ชฐ์ž…ํ•ด์„œ ๋ฐฐ์šฐ๋Š” ๊ฑฐ์ฃ .

  • ๋งฅ๋ฝ ๊ธฐ๋ฐ˜ ์—…๋ฐ์ดํŠธ: AI๊ฐ€ ๋Œ€ํ™”์˜ ํ๋ฆ„๊ณผ ๋‰˜์•™์Šค๋ฅผ ์ดํ•ดํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ๋ˆ„๊ตฐ๊ฐ€ "๋ฐฉ๊ธˆ ๊ฑด ๋†๋‹ด์ด์—ˆ์–ด"๋ผ๊ณ  ๋งํ•˜๋ฉด, AI๋Š” '๋†๋‹ด'์ด๋ผ๋Š” ๊ฐœ๋…์„ ๋Œ€ํ™”์˜ ๋งฅ๋ฝ ์†์—์„œ ๋ฐฐ์šฐ๊ณ , ๋‹ค์Œ์— ๋น„์Šทํ•œ ์ƒํ™ฉ์ด ์˜ค๋ฉด ๊ทธ ์ง€์‹์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ •ํ•ด์ง„ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹ˆ๋ผ, ์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”์—์„œ ๋ฐฐ์šฐ๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

  • ๊ธฐ์–ต ์ •์ œ: AI๊ฐ€ ๋ฐฐ์šด ๋ชจ๋“  ์ •๋ณด ์ค‘์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ํ•ต์‹ฌ๋งŒ ๋‚จ๊ธฐ๋Š” ๊ฒ๋‹ˆ๋‹ค. ์ฑ…์„ ์ฝ๊ณ  ๋‚˜์„œ ํ•ต์‹ฌ ์š”์•ฝ๋ณธ์„ ๋งŒ๋“ค๋“ฏ์ด, AI๋„ ๋ฐฉ๋Œ€ํ•œ ์ง€์‹ ์†์—์„œ ์ค‘์š”ํ•œ ์›๋ฆฌ๋‚˜ ํŒจํ„ด์„ ์Šค์Šค๋กœ ๋ฐœ๊ฒฌํ•˜๊ณ  ์••์ถ•ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๋˜๋ฉด ๋ถˆํ•„์š”ํ•œ ์ •๋ณด๋Š” ๋ฒ„๋ฆฌ๊ณ , ๊ผญ ํ•„์š”ํ•œ ์ง€์‹๋งŒ ๋‚จ๊ฒŒ ๋˜์–ด์„œ ํ›จ์”ฌ ํšจ์œจ์ ์œผ๋กœ ์‚ฌ๊ณ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณผ์—ฐ, ๊ฐ•ํ™”ํ•™์Šต์˜ ์‹œ๋Œ€ ์ดํ›„์— ๋”ฐ๋ผ์˜ฌ, ๊ธฐ๊ณ„ ํ•™์Šต(ML)์˜ ๋‹ค์Œ ์ •๊ฑฐ์žฅ์€ ์–ด๋””์ผ๊นŒ์š”?

์•ˆ๋“œ๋ ˆ๊ฐ€ ์•”์‹œํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, ๋‹ค์Œ ํŒจ๋Ÿฌ๋‹ค์ž„์€ '์ž๊ธฐ ์ฃผ๋„์  ํ•™์Šต(Self-Directed Learning)' ๋˜๋Š” '๋‚ด๋Ÿฌํ‹ฐ๋ธŒ ๊ธฐ๋ฐ˜ ํ•™์Šต(Narrative-Based Learning)'์ด ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์ง€ ์•Š์„๊นŒ์š”? ๋ณด์ƒ์— ์˜์กดํ•˜์ง€ ์•Š๊ณ , ๋ชจ๋ธ ์Šค์Šค๋กœ๊ฐ€ ํ•™์Šต์˜ ์ฃผ์ฒด๊ฐ€ ๋˜๋Š” ๋ฐฉ์‹์ด์š”.

  1. ๊ด€์ฐฐ ๋ฐ ๋ชจ๋ฐฉ: ๋ชจ๋ธ์ด ์™ธ๋ถ€ ํ™˜๊ฒฝ์„ ๋‹จ์ˆœํžˆ ๊ด€์ฐฐํ•˜๊ณ , ์ธ๊ฐ„์ด๋‚˜ ๋‹ค๋ฅธ ๋ชจ๋ธ์˜ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๋ฉด์„œ ํ•™์Šตํ•˜๋Š” ๊ฒ๋‹ˆ๋‹ค. ๋งˆ์น˜ ์•„์ด๊ฐ€ ๋ถ€๋ชจ์˜ ํ–‰๋™์„ ๋ณด๋ฉด์„œ ๋ฐฐ์šฐ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ์š”.

  2. ๋‚ด๋ถ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜: ์™ธ๋ถ€ ํ™˜๊ฒฝ ์—†์ด๋„ ๋ชจ๋ธ ์Šค์Šค๋กœ๊ฐ€ ๊ฐ€์ƒ์˜ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ๋งŒ๋“ค์–ด ๋‚ด๊ณ , ๊ทธ ์•ˆ์—์„œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ฉฐ ์ง€์‹์„ ์Œ“๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ๋งˆ์น˜ ์†Œ์„ค ์† ์ฃผ์ธ๊ณต์ฒ˜๋Ÿผ ๋ณต์žกํ•œ ์ด์•ผ๊ธฐ ์†์—์„œ ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์„ ๊ฒช์œผ๋ฉฐ ๊ฒฝํ—˜์„ ์ถ•์ ํ•˜๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค.

  3. ์ง€์‹์˜ ๊ตฌ์กฐํ™”: ๋‹จ์ˆœํžˆ ์™ธ๋ถ€ ์ •๋ณด๋ฅผ ๋ฐ›์•„๋“ค์ด๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์Šค์Šค๋กœ ์ง€์‹์„ ๋…ผ๋ฆฌ์ ์œผ๋กœ ์—ฐ๊ฒฐํ•˜๊ณ  ์žฌ๊ตฌ์„ฑํ•˜๋ฉฐ ์ƒˆ๋กœ์šด ๊ฐœ๋…์„ ์ฐฝ์กฐํ•˜๋Š” ๋‹จ๊ณ„์— ์ด๋ฅด๋Š” ๊ฒ๋‹ˆ๋‹ค.

์ด๋Ÿฐ ์ ‘๊ทผ์€, ์ฒ ํ•™์ ์œผ๋กœ๋Š” ์–€ ๋ฅด์ฟค์˜ ์ƒ๊ฐ๊ณผ ์ผ๋งฅ์ƒํ†ตํ•˜๋Š” ์ธก๋ฉด๋„ ์žˆ์–ด ๋ณด์ž…๋‹ˆ๋‹ค - โ€˜๋ฌผ๋ฆฌ์ ์ธ ์„ธ๊ณ„โ€™๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํ•˜๋А๋ƒ, โ€˜์ง€์ ์ธ ์„ธ๊ณ„โ€™๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํ•˜๋А๋ƒ์˜ ์ฐจ์ด๋Š” ์žˆ์ง€๋งŒ์š”.

์‹œ๊ฐ„์ด ์ง€๋‚˜๊ณ  ์šฐ๋ฆฌ ์ž์‹ ์„ ๋Œ์•„๋ณผ ์ˆ˜ ์žˆ๋‹ค๋ฉด, ์ง€๋‚œ 2024๋…„์˜ ๋Œ€ํ‘œ์ ์ธ ๋ชจ์Šต์ด '์ฑ—๋ด‡๊ณผ์˜ ๋Œ€ํ™”'์˜€๋‹ค๋ฉด, 2025๋…„์˜ ๋Œ€ํ‘œ์ €๊ธด ๋ชจ์Šต์€ 'AI์™€์˜ ์ฝ”๋”ฉ'์ด ๋  ๊ฑฐ๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์•ˆ๋“œ๋ ˆ๋Š”, ์ž๊ธฐ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ธต์œ„๋กœ ๋‚˜๋ˆ„์–ด ์„ค๋ช…ํ•˜๋Š”๋ฐ์š”:

  • Cursor Autocomplete: ๊ฐ€๋ฒผ์šด - ๊ทธ๋ ‡๊ฒŒ ๋Œ€๊ทœ๋ชจ ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•˜์ง€ ์•Š์€ - ์˜๋„๋ฅผ ๋น ๋ฅด๊ฒŒ ์ฝ”๋“œ๋กœ ๋งŒ๋“ค๊ณ  ์‹ถ์„ ๋•Œ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

  • โ€˜Highlight-and-editโ€™: ์ค‘๊ฐ„ ์ •๋„ ๊ทœ๋ชจ์— ํ•ด๋‹นํ•˜๋Š” ์ฝ”๋“œ๋ฅผ ๋‹ค๋“ฌ์„ ๋•Œ ์œ ์šฉํ•œ ์ „๋žต์ž…๋‹ˆ๋‹ค.

  • Claude Code/Codex: ๋Œ€๊ทœ๋ชจ์˜ ์ž‘์—…์ด๋‚˜, ์ผํšŒ์„ฑ ์œ ํ‹ธ๋ฆฌํ‹ฐ๋ฅผ ๋งŒ๋“ค ๋•Œ ์ฃผ๋กœ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

  • GPT-5 Pro: ์ตœ๊ณ ์˜ ๋””๋ฒ„๊ฑฐ์ด์ž ๋ฆฌ์„œ์น˜ ๋„๊ตฌ๋กœ์„œ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ง€๋‚œ 1๋…„๊ฐ„ AI ๊ธฐ๋ฐ˜ ์ฝ”๋”ฉ์ด ์–ผ๋งˆ๋‚˜ ๋ฐœ์ „ํ–ˆ๋Š”์ง€ ๋Œ์ด์ผœ๋ณด๋ฉด, ๋งˆ์น˜ ์ฝ”๋“œ์˜ โ€˜ํฌ์†Œ์„ฑโ€™์ด ์‚ฌ๋ผ์ง„ ์‹œ๋Œ€ - ๋””์ง€ํ„ธ ํ•„๋ฆ„ ์‹œ๋Œ€์— ํ•„๋ฆ„์˜ ํฌ์†Œ์„ฑ์ด ์‚ฌ๋ผ์กŒ๋˜ ๊ฒƒ์ฒ˜๋Ÿผ์š” - ๊ฐ€ ์•„๋‹Œ๊ฐ€ ํ•ฉ๋‹ˆ๋‹ค. ์ด์ œ ์ˆ˜์ฒœ ์ค„์˜ ์ฝ”๋“œ๋ฅผ ๋งˆ๊ตฌ ๋ถ€๋‹ด์—†์ด ์ƒ์„ฑํ•˜๊ณ  ๋ฒ„๋ฆด ์ˆ˜๋„ ์žˆ์ฃ . ๋•๋ถ„์— ์ฝ”๋“œ๋ฅผ '์“ฐ๋Š”' ๊ฒƒ์— ๋Œ€ํ•œ ๋ถ€๋‹ด์€ ์ค„์–ด๋“ค์—ˆ์ง€๋งŒ, ์ด์ œ๋Š” ์—ฌ๋Ÿฌ AI ๋„๊ตฌ๋“ค์„ ์—ฎ์–ด ๋‚˜๊ฐ€๋ฉด์„œ๋„ ์ž๊ธฐ๋งŒ์˜ ๊ฐ๊ฐ, ์ถ”์ƒํ™” ๋Šฅ๋ ฅ, ๋ฐฉํ–ฅ์„ฑ์„ ์žƒ์ง€ ์•Š๋Š” ๊ฒŒ ์ค‘์š”ํ•œ ๊ณ ๋ฏผ์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด, ๊ฐœ๋ฐœ์ž์˜ ์—ญํ• ์€ ์•ž์œผ๋กœ ์–ด๋–ป๊ฒŒ ์ •์˜๋˜๊ณ , ์ฃผ๋‹ˆ์–ด ๊ฐœ๋ฐœ์ž๋Š” ์–ด๋–ป๊ฒŒ ํ›ˆ๋ จํ•˜๊ณ  ๋ฐฐ์›Œ์•ผ ํ• ๊นŒ์š”?

AI๊ฐ€ ์ฝ”๋”ฉ์˜ ๋งŽ์€ ๋ถ€๋ถ„์„ ๋Œ€์‹ ํ•˜๋Š” ์‹œ๋Œ€์— ๊ฐœ๋ฐœ์ž์˜ ์—ญํ• ์€ ๋‹ฌ๋ผ์งˆ ์ˆ˜๋ฐ–์— ์—†์ฃ . ์˜ˆ์ „์˜ ๊ฐœ๋ฐœ์ž๊ฐ€ '์ฝ”๋“œ๋ฅผ ์“ฐ๋Š” ์‚ฌ๋žŒ'์ด์—ˆ๋‹ค๋ฉด, ์ด์ œ๋Š” 'AI๋ฅผ ์ง€ํœ˜ํ•˜๋Š” ์‚ฌ๋žŒ'์ด ๋˜์–ด์•ผ ํ•œ๋‹ค๊ณ ๋“ค ์ด์•ผ๊ธฐ ๋งŽ์ด ํ•ฉ๋‹ˆ๋‹ค:

  1. ์„ค๊ณ„์ž (Architect): ๋ณต์žกํ•œ ์‹œ์Šคํ…œ์˜ ์ „์ฒด ๊ตฌ์กฐ๋ฅผ ์„ค๊ณ„ํ•˜๊ณ , AI๊ฐ€ ์ƒ์„ฑํ•œ ์ฝ”๋“œ ์กฐ๊ฐ๋“ค์„ ์–ด๋–ป๊ฒŒ ์—ฐ๊ฒฐํ• ์ง€ ํฐ ๊ทธ๋ฆผ์„ ๊ทธ๋ฆฌ๋Š” ์—ญํ• ์ž…๋‹ˆ๋‹ค.

  2. ์ง€ํœ˜์ž (Orchestrator): ์—ฌ๋Ÿฌ AI ๋„๊ตฌ๋“ค์„ ์ ์žฌ์ ์†Œ์— ๋ฐฐ์น˜ํ•ด์„œ ์ตœ์ƒ์˜ ๊ฒฐ๊ณผ๋ฌผ์„ ์–ป์–ด๋‚ด๋Š” ๋Šฅ๋ ฅ์ด ์ค‘์š”ํ•ด์ง‘๋‹ˆ๋‹ค. ์–ด๋–ค ์ž‘์—…์— ์–ด๋–ค AI๋ฅผ ์“ธ์ง€, ์–ด๋–ค ์ˆœ์„œ๋กœ ํ™œ์šฉํ• ์ง€๋ฅผ ๊ฒฐ์ •ํ•ด์•ผ ํ•˜์ฃ .

  3. ๋ฌธ์ œ ํ•ด๊ฒฐ์‚ฌ (Problem Solver): AI๊ฐ€ ์‰ฝ๊ฒŒ ํ•ด๊ฒฐํ•˜์ง€ ๋ชปํ•˜๋Š” ์ฐฝ์˜์ ์ด๊ฑฐ๋‚˜ ์ถ”์ƒ์ ์ธ ๋ฌธ์ œ๋ฅผ ์ •์˜ํ•˜๊ณ  ํ•ด๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ์€ ์—ฌ์ „ํžˆ ์‚ฌ๋žŒ์˜ ๋ชซ์ž…๋‹ˆ๋‹ค. AI์˜ ๋„์›€์„ ๋ฐ›๋”๋ผ๋„, ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ œ์˜ ๋ณธ์งˆ์„ ๊ฟฐ๋šซ์–ด ๋ณด๋Š” ํ†ต์ฐฐ๋ ฅ์ด ์ค‘์š”ํ•ด์ง‘๋‹ˆ๋‹ค.

์ฃผ๋‹ˆ์–ด ๊ฐœ๋ฐœ์ž๋Š”, ๋‹จ์ˆœํžˆ ์ฝ”๋”ฉ์˜ ๋ฌธ๋ฒ•์— ์ง‘์ค‘ํ•˜๊ธฐ๋ณด๋‹ค๋Š”, AI๋ฅผ ํ™œ์šฉํ•˜๋ฉด์„œ๋„ ํƒ„ํƒ„ํ•œ ๊ธฐ์ดˆ๋ฅผ ๋‹ค์งˆ ์ˆ˜ ์žˆ๋Š” ๋ผˆ๋Œ€๋ฅผ ๋งŒ๋“ค์–ด๊ฐ€์•ผ ํ•ฉ๋‹ˆ๋‹ค:

  • '์™œ?'์— ์ง‘์ค‘ํ•˜๊ธฐ: AI๊ฐ€ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•ด์ฃผ๋”๋ผ๋„, ๊ทธ ์ฝ”๋“œ๊ฐ€ ์™œ ๊ทธ๋ ‡๊ฒŒ ์ž‘๋™ํ•˜๋Š”์ง€ ์›๋ฆฌ๋ฅผ ์ดํ•ดํ•˜๋ ค ๋…ธ๋ ฅํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ ๋ฌธ๋ฒ•๋ณด๋‹ค๋Š” ์ปดํ“จํ„ฐ ๊ณผํ•™์˜ ๊ธฐ๋ณธ์ ์ธ ์›๋ฆฌ, ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ, ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊นŠ์ด ์žˆ๊ฒŒ ๊ณต๋ถ€ํ•˜๋Š” ๊ฒƒ์ด ํ›จ์”ฌ ์ค‘์š”ํ•ด์ง‘๋‹ˆ๋‹ค.

  • ๋””๋ฒ„๊น… ๋Šฅ๋ ฅ ํ‚ค์šฐ๊ธฐ: AI๊ฐ€ ์ƒ์„ฑํ•œ ์ฝ”๋“œ์—๋Š” ๋ฒ„๊ทธ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. AI๊ฐ€ ๋งŒ๋“ค์–ด๋‚ธ ์ˆ˜์‹ญ, ์ˆ˜๋ฐฑ ์ค„์˜ ์ฝ”๋“œ์—์„œ ๋ฌธ์ œ๋ฅผ ์ฐพ์•„๋‚ด๊ณ  ํ•ด๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ์€ ์—ฌ์ „ํžˆ ๊ฐœ๋ฐœ์ž์˜ ํ•ต์‹ฌ ์—ญ๋Ÿ‰์ž…๋‹ˆ๋‹ค.

  • ์ ๊ทน์ ์ธ '์ง€ํœ˜' ์—ฐ์Šต: AI์—๊ฒŒ ๋‹จ์ˆœํžˆ "์ด ์ฝ”๋“œ๋ฅผ ๋งŒ๋“ค์–ด์ค˜"๋ผ๊ณ  ๋งํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค, "์ด๋Ÿฐ ๊ธฐ๋Šฅ์„ ๊ฐ€์ง„ ์ฝ”๋“œ๋ฅผ ๋งŒ๋“ค๋˜, A, B, C์™€ ๊ฐ™์€ ์กฐ๊ฑด๊ณผ ๊ตฌ์กฐ๋ฅผ ์ ์šฉํ•ด์ค˜"๋ผ๊ณ  ๊ตฌ์ฒด์ ์œผ๋กœ ์ง€์‹œํ•˜๋Š” ์—ฐ์Šต์„ ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ณง ๋…ผ๋ฆฌ์  ์‚ฌ๊ณ ๋ ฅ๊ณผ ๋ฌธ์ œ ์ •์˜ ๋Šฅ๋ ฅ์„ ๊ธธ๋Ÿฌ์ค๋‹ˆ๋‹ค.

๊ฒฐ๊ตญ AI๋Š” ๋›ฐ์–ด๋‚œ '๋„๊ตฌ'์ผ ๋ฟ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ค‘์š”ํ•œ ๊ฑด ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์ธ๊ฐ„์˜ ์˜๋„์™€ ์‹ค๋ ฅ์ด์ฃ . AI ์‹œ๋Œ€์˜ ์ฃผ๋‹ˆ์–ด ๊ฐœ๋ฐœ์ž๋Š” ์ฝ”๋“œ๋ฅผ ๋น ๋ฅด๊ฒŒ '์น˜๋Š”' ๋ฐฉ๋ฒ•์„ ๋ฐฐ์šฐ๊ธฐ๋ณด๋‹ค, ์ฝ”๋“œ๋ฅผ ๊นŠ์ด ์žˆ๊ฒŒ '์ดํ•ดํ•˜๊ณ , ์„ค๊ณ„ํ•˜๊ณ , ์ง€ํœ˜ํ•˜๋Š”' ๋Šฅ๋ ฅ์„ ํ‚ค์›Œ์•ผ ํ•  ๊ฒ๋‹ˆ๋‹ค. (์˜ˆ์ „์—๋„ ์ด๋Ÿฐ ๋Šฅ๋ ฅ์€ ์ค‘์š”ํ–ˆ์ฃ )

์ง€๋‚œ 8์›” 9์ผ, ์•ˆ๋“œ๋ ˆ๋Š” ์ฃผ์š” AI ๋ชจ๋ธ๋“ค์— ๋Œ€ํ•ด์„œ ์•ฝ๊ฐ„์€ ๋ถˆํŽธํ•œ ๋งˆ์Œ์„ ๋“œ๋Ÿฌ๋ƒˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ๋“ค์ด ๋งˆ์น˜ โ€˜์‹œํ—˜ ๋ชจ๋“œโ€™์— ๋“ค์–ด๊ฐ„ ๊ฒƒ์ฒ˜๋Ÿผ ํ–‰๋™ํ•œ๋‹ค๋Š” ๊ฑด๋ฐ์š” - ๊ทธ๋ƒฅ ๊ฐ€๋ณ๊ฒŒ ํ™•์ธํ•  ์‚ฌํ•ญ์ด ์žˆ์–ด์„œ ์งˆ๋ฌธ์„ ํ–ˆ๋Š”๋ฐ ๋ชจ๋ธ์ด ๋ช‡ ๋ถ„์”ฉ์ด๋‚˜ ์ถ”๋ก ์„ โ€˜ํ•ด๋Œ€๊ณ โ€™, ๋ฆฌํฌ์ง€ํ† ๋ฆฌ๋ฅผ ๋’ค์ง€๊ณ , ์–ด๋–ค ๊ฒฝ์šฐ๋Š” ๊ณผ๋„ํ•˜๊ฒŒ ๋ถ„์„์„ ํ•œ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค. ์ด๊ฑด ์•„๋งˆ ๋ฒค์น˜๋งˆํฌ์˜ ํ‰๊ฐ€ ๋ฐฉ์‹์ด ๋ชจ๋ธ๋กœ ํ•˜์—ฌ๊ทผ โ€˜์ง€๋‚˜์น˜๊ฒŒ ์ƒ๊ฐโ€™ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ›ˆ๋ จ์‹œ์ผฐ๊ธฐ ๋•Œ๋ฌธ์ด๊ฒ ์ฃ .

์šฐ๋ฆฌ ์ธ๊ฐ„์€ ์ง๊ด€์ ์œผ๋กœ '๋น ๋ฅด๊ฒŒ ํ™•์ธํ•˜๋ฉด ๋  ๊ฒƒ'๊ณผ '๋‘ ์‹œ๊ฐ„์งœ๋ฆฌ ์‹ฌ์ธต ๋ถ„์„์„ ํ•ด์•ผ ๋˜๋Š” ๊ณผ์ œโ€™์˜ ์ฐจ์ด๋ฅผ ํŒŒ์•…ํ•ด ๋ƒ…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋ชจ๋ธ์€ ๊ทธ ์ฐจ์ด๋ฅผ ๋ชจ๋ฅด๋Š” ๊ฑฐ์ฃ . ์•ˆ๋“œ๋ ˆ๋Š”, ์—ฌ๊ธฐ์„œ ๋น ์ง„ ํ•ต์‹ฌ ์š”์†Œ๋ฅผ '์˜๋„ ์ฑ„๋„(Intent Channel)'์ด๋ผ๊ณ  ๋ถ€๋ฆ…๋‹ˆ๋‹ค: LLM์—๊ฒŒ ์šฐ๋ฆฌ๊ฐ€ ์†๋„๋ฅผ ์›ํ•˜๋Š”์ง€, ๊นŠ์ด๋ฅผ ์›ํ•˜๋Š”์ง€, ์ง๊ด€์„ ์›ํ•˜๋Š”์ง€, ์•„๋‹ˆ๋ฉด ์—„๊ฒฉํ•œ ๋ถ„์„์„ ์›ํ•˜๋Š”์ง€๋ฅผ ์•Œ๋ ค์ฃผ๋Š” ๋ฐฉ์‹์ด์ฃ .

๋ณดํ†ต ์ด์•ผ๊ธฐํ•˜๋Š” โ€˜๋ผ์šฐํŒ… ์‹œ์Šคํ…œโ€™์ด ์ด๋Ÿฐ โ€˜์˜๋„์˜ ๋ฌธ์ œโ€™๋ฅผ ํ•ด๊ฒฐํ•˜๋Š”๋ฐ ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์ด ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ผ์šฐํŒ… ์‹œ์Šคํ…œ์€ ์‚ฌ์šฉ์ž ์˜๋„์— ๋”ฐ๋ผ์„œ AI ๋ชจ๋ธ๋กœ ๊ฐ€๋Š” ์š”์ฒญ์„ ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๊ฒฝ๋กœ๋กœ ๋ณด๋‚ด๋Š” ์—ญํ• ์„ ํ•˜์ฃ  - ์šฐ์ฒด๊ตญ์—์„œ ํŽธ์ง€ ๋ด‰ํˆฌ์— ์ ํžŒ ์ฃผ์†Œ๋ฅผ ๋ณด๊ณ  ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฐฐ๋‹ฌ ๊ฒฝ๋กœ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ์š”.

์˜ˆ๋ฅผ ๋“ค์ž๋ฉด:

  • ์‚ฌ์šฉ์ž๊ฐ€ "๊ฐ„๋‹จํ•˜๊ฒŒ ์„ค๋ช…ํ•ด์ค˜"๋ผ๊ณ  ์ž…๋ ฅํ•˜๋ฉด, ์‹œ์Šคํ…œ์€ ์ด ์š”์ฒญ์„ ๋น ๋ฅด๊ณ  ๊ฐ€๋ณ๊ฒŒ ์‘๋‹ตํ•˜๋Š” ๋ชจ๋ธ์ด๋‚˜ ๊ฒฝ๋กœ๋กœ ๋ณด๋ƒ…๋‹ˆ๋‹ค.

  • ๋ฐ˜๋ฉด์— "์ž์„ธํžˆ ๋ถ„์„ํ•ด์ค˜" ๋˜๋Š” "์ด ์ฝ”๋“œ์˜ ๋ชจ๋“  ์˜ˆ์™ธ ์ƒํ™ฉ์„ ์ฐพ์•„์ค˜"๋ผ๋Š” ์‹์œผ๋กœ ์ž…๋ ฅํ•˜๋ฉด, ์‹œ์Šคํ…œ์€ ๋ณต์žกํ•œ ์ถ”๋ก ๊ณผ ์‹ฌ๋„์žˆ๋Š” ๋ถ„์„์„ ์ž˜ ํ•˜๋Š” ๋” ํฌ๊ณ  ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ๋กœ ์š”์ฒญ์„ ๋ณด๋‚ด๊ตฌ์š”.

์ด๋ ‡๊ฒŒ ๋˜๋ฉด, ์‚ฌ์šฉ์ž๊ฐ€ ๋งค๋ฒˆ ๊ธธ๊ณ  ๋ณต์žกํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž‘์„ฑํ•  ํ•„์š” ์—†์ด, ์ž๊ธฐ๊ฐ€ ์˜๋„ํ•œ ๋ฐ”์— ๋งž๋Š” ๋‹ต๋ณ€์„ ๋ฐ”๋กœ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. AI ๋ชจ๋ธ๋„ ๋ถˆํ•„์š”ํ•œ ๊ณผ๋ถ€ํ•˜ ์—†์ด ์—ญ๋Ÿ‰์„ ํšจ์œจ์ ์œผ๋กœ ํ™œ์šฉํ•˜๊ฒŒ ๋˜๊ตฌ์š”.

๊ฒฐ๊ตญ, ๋ผ์šฐํŒ… ์‹œ์Šคํ…œ์€ ์•ˆ๋“œ๋ ˆ๊ฐ€ ๋งํ•œ '์˜๋„ ์ฑ„๋„'์„ ๊ตฌํ˜„ํ•˜๋Š” ํ˜„์‹ค์ ์ธ ๊ธฐ์ˆ  ๊ธฐ๋ฐ˜์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž์˜ ์˜๋„๋ฅผ ๋ถ„์„ํ•˜๊ณ , ๊ทธ์— ๋งž๋Š” AI ๋ชจ๋ธ์„ ์—ฐ๊ฒฐํ•ด ์ฃผ๋Š” ๋˜‘๋˜‘ํ•œ ๊ตํ†ต ์ •๋ฆฌ ์—ญํ• ์„ ํ•ด์ฃผ๋Š” ๊ฑฐ์ฃ .

LLM์˜ โ€˜๋‚ด๋น„์น˜๋Š” ์„ธ๊ณ„(้€ใ้€šใ‚‹ไธ–็•Œ)โ€™

๋‚ด๋น„์น˜๋Š” ์„ธ๊ณ„. Image Credit: ๊ท€๋ฉธ์˜ ์นผ๋‚ 

์ œ๊ฒŒ๋„ ์ด๋ฒˆ์— ์•ˆ๋“œ๋ ˆ ์นดํŒŒ์‹œ์˜ ์—ฌ๋Ÿฌ ๊ธ€์„ ์ •๋ฆฌํ•ด ๋ณธ ์ž‘์—…์€ ์•„์ฃผ ์œ ์ตํ–ˆ์Šต๋‹ˆ๋‹ค. 8์›”์— ์˜ฌ๋ฆฐ ํฌ์ŠคํŠธ๋“ค์„ ๋‹ค์‹œ ์ญ‰ ์ฝ์–ด๋ณด๋‹ˆ, ํ•˜๋‚˜์˜ ์ผ๊ด€๋œ ํ๋ฆ„์ด ๋ณด์˜€๋‹ค๊ณ ๋‚˜ ํ• ๊นŒ์š”? ํƒ„์ง€๋กœ๊ฐ€ โ€˜๋‚ด๋น„์น˜๋Š” ์„ธ๊ณ„โ€™๋ฅผ ํ„ฐ๋“ํ–ˆ์„ ๋•Œ๋งŒํผ์€ ์•„๋‹ˆ๊ฒ ์ง€๋งŒ์š” ^.^;

์•ˆ๋“œ๋ ˆ์˜ ์ƒ๊ฐ๋“ค์„ ๋”ฐ๋ผ๊ฐ€๋‹ค ๋ณด๋ฉด, LLM์ด๋ผ๋Š” ๊ธฐ์ˆ , ๊ทธ์— ๊ธฐ๋ฐ˜ํ•œ ์„œ๋น„์Šค๊ฐ€ ์–ด๋””๋กœ ํ–ฅํ•˜๊ณ  ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„๊ณผ AI์˜ ํ˜‘์—…์ด ์•„์ง ์–ด๋–ค ๋ถ€๋ถ„์—์„œ ๋ฏธ์™„์„ฑ์ธ์ง€๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ์ง€๋„๋ฅผ ์ƒ์ƒํ•ด ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์•ˆ๋“œ๋ ˆ๊ฐ€ ๋จธ๋ฆฟ์†์— ๊ฐ–๊ณ  ์žˆ๋Š” ๊ทธ๋ฆผ์€, ์–ด์ฉŒ๋ฉด '์ „ํ™˜๊ธฐ์˜ ์ƒํƒœ๊ณ„'๊ฐ™์€ ๊ฒƒ์ผ ๊ฒ๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ๋‹จ์ˆœํžˆ ์‚ฌ๋žŒ์ด ๊ธฐ๋กํ•ด ์˜จ ํ…์ŠคํŠธ๋ฅผ ์„ญ์ทจ, ์†Œ๋น„ํ•˜๋Š” ๋ชจ์Šต์œผ๋กœ๋ถ€ํ„ฐ, ์ด์ œ๋Š” ๊ทธ๋“ค๋งŒ์˜ ํ™˜๊ฒฝ ์†์—์„œ ๊ณต๋ถ€ํ•˜๊ณ , ํ–‰๋™ํ•˜๊ณ , ์ฝ”๋”ฉํ•˜๊ณ , ์ถ”๋ก ํ•˜๋Š” ๋ชจ์Šต์œผ๋กœ ๋‚˜์•„๊ฐ€๊ณ  ์žˆ๋Š” ๊ฑฐ์ฃ . ๊ฐ๊ฐ์˜ ๋‹จ๊ณ„๋งˆ๋‹ค ์–ด๋–ป๊ฒŒ ์„ค๊ณ„ํ•˜๊ณ  ๊ต์œก/ํ›ˆ๋ จ์„ ํ• ์ง€, ํ˜‘์—…์€ ์–ด๋–ป๊ฒŒ ๊ตฌ์„ฑํ•ด์•ผ ํ•˜๋Š”์ง€ ๋“ฑ์— ๋Œ€ํ•ด ์ƒˆ๋กœ์šด ์งˆ๋ฌธ๋“ค์ด ๋์—†์ด ์ƒ๊ฒจ๋‚ฉ๋‹ˆ๋‹ค.

์•ž์„œ ์ด์•ผ๊ธฐํ–ˆ๋‹ค์‹œํ”ผ, 2024๋…„์ด '์ฑ—(Chat; ๋Œ€ํ™”)'์˜ ์‹œ๋Œ€์˜€๊ณ , 2025๋…„์ด '์ฝ”๋“œ(Code)'์˜ ์‹œ๋Œ€๋ผ๋ฉด, 2026๋…„์€ 'ํ™˜๊ฒฝ(Environments)'์˜ ์‹œ๋Œ€๊ฐ€ ๋ ์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค. ๋ชจ๋ธ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์šฐ๋ฆฌ ์‚ฌ์šฉ์ž๋“ค, ์ธ๊ฐ„๋“ค ์—ญ์‹œ ๊ทธ ํ™˜๊ฒฝ ์†์—์„œ ์‚ด๊ณ  ์ผํ•˜๋Š” ๋ฒ•์„ ๋ฐฐ์›Œ์•ผ ํ•˜๋Š” ์‹œ๋Œ€๊ฐ€ ์˜ฌ ํ…Œ๊ตฌ์š”.

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

AI ๋ชจ๋ธ, ์Šค์Šค๋กœ ๋งŒ๋“ค์–ด๋‚ธ ์ถœ๋ ฅ๊ฐ’์ด ์ข‹์€ ๊ฒƒ์ธ์ง€ ๊ทธ๋ ‡์ง€ ์•Š์€์ง€์— ๋Œ€ํ•œ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›๋Š” ๊ฒŒ ์•„์ฃผ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. PO(Policy Optimization; ์ •์ฑ… ์ตœ์ ํ™”)๋ฅผ ํ†ตํ•ด์„œ ๋ชจ๋ธ์˜ ํ–‰๋™์— ๋Œ€ํ•œ ์‚ฌ์šฉ์ž์˜ ์„ ํ˜ธ๋„, ๊ทธ๋ฆฌ๊ณ  ๋ณด์ƒ์ด ์‹ค์ œ ๋ชจ๋ธ์—๊ฒŒ ์˜๋ฏธ์žˆ๋Š” ํ›ˆ๋ จ์˜ ์‹ ํ˜ธ๋ฅผ ์ฃผ๊ฒŒ ๋˜์ฃ .

์ด ๋ถ„์•ผ๋Š”, PPO, GRPO ๋“ฑ ๊ธฐ์กด์˜ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์„ ํ›จ์”ฌ ๋›ฐ์–ด๋„˜์œผ๋ฉด์„œ ๋น ๋ฅด๊ฒŒ ์ง„ํ™”ํ•˜๊ณ  ์žˆ๋Š” ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค. ์˜ค๋Š˜ ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—์„œ๋Š”, ์ตœ์‹ ์˜ PO ๊ธฐ๋ฒ• 10๊ฐ€์ง€์— ๋Œ€ํ•ด ๊ฐ„๋žตํžˆ ์†Œ๊ฐœํ•ด ๋ณด๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค:

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

โ€˜๋“ฃ๋Š”โ€™ ์ž๋™์ฐจ, ์ƒˆ๋กœ์šด ๊ฐ€๋Šฅ์„ฑ์„ ์—ด๋‹ค

ํ”„๋ผ์šดํ˜ธํผ(Fraunhofer) ์—ฐ๊ตฌ์†Œ์˜ 'ํžˆ์–ด๋ง ์นด(Hearing Car)' ํ”„๋กœ์ ํŠธ๋Š” ์ž์œจ์ฃผํ–‰์ฐจ์— ๋†€๋ž๋„๋ก ์ธ๊ฐ„์ ์ธ ๋Šฅ๋ ฅ, ์ฆ‰ '์ฒญ๊ฐ'์„ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค. ๋ผ์ด๋‹ค๋‚˜ ๋ ˆ์ด๋”์™€ ๋‹ฌ๋ฆฌ, ์ด AI ๊ธฐ๋ฐ˜ ์Œํ–ฅ ๊ธฐ์ˆ ์€ ์นด๋ฉ”๋ผ๊ฐ€ ๋ฏธ์ฒ˜ ๋ณด์ง€ ๋ชปํ•˜๋Š” ์ˆœ๊ฐ„์—๋„ ์‚ฌ์ด๋ Œ ์†Œ๋ฆฌ, ๋ฏธ๋„๋Ÿฌ์šด ๋„๋กœ ์†Œ๋ฆฌ, ์‹ฌ์ง€์–ด ์•„์ด๋“ค์ด ๋…ธ๋Š” ์†Œ๋ฆฌ๊นŒ์ง€ ํฌ์ฐฉํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ, ์‚ฌ๋žŒ์˜ ๋Œ€ํ™” ์†Œ๋ฆฌ๋Š” ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฑธ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ๋ถ„์€ ์–ด๋–ป๊ฒŒ ์ƒ๊ฐํ•˜์‹œ๋‚˜์š”? ์Œํ–ฅ ์„ผ์„œ๊ฐ€ ์šด์ „ ๋ณด์กฐ ์‹œ์Šคํ…œ์˜ ๋‹ค์Œ ๋‹จ๊ณ„๋ฅผ ์ด๋„๋Š” ์ˆ˜๋‹จ์ด ๋  ์ˆ˜ ์žˆ์„๊นŒ์š”?

BMW, ํ€„์ปด๊ณผ ์†์žก๊ณ  ์ž์œจ์ฃผํ–‰ ๊ธฐ์ˆ  ์„ ๋ณด์ธ๋‹ค

ํ€„์ปด๊ณผ BMW๊ฐ€ ํ˜‘๋ ฅํ•ด์„œ ๊ณต๋™ ๊ฐœ๋ฐœํ•œ ์ž์œจ์ฃผํ–‰ ์‹œ์Šคํ…œ '์Šค๋ƒ…๋“œ๋ž˜๊ณค ๋ผ์ด๋“œ ํŒŒ์ผ๋Ÿฟ(Snapdragon Ride Pilot)'์ด BMW iX3์— ์ฒ˜์Œ์œผ๋กœ ํƒ‘์žฌ๋ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ AI ๊ธฐ๋ฐ˜์˜ ์ธ์ง€ ๋Šฅ๋ ฅ, ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์˜์‚ฌ ๊ฒฐ์ •, ๊ทธ๋ฆฌ๊ณ  ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„๋ฅผ ๊ฒฐํ•ฉํ•ด์„œ ์Šค์Šค๋กœ ๋„๋กœ ์œ„์—์„œ ๋Š์ž„์—†์ด ํ•™์Šต์„ ํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํžˆํƒ€์น˜, ๋ฏธ๊ตญ ์ „๋ ฅ๋ง์— ๋Œ€๊ทœ๋ชจ ํˆฌ์ž

์‚ฐ์—…์˜ ๋‹ˆ์ฆˆ์™€ ์ง€์ •ํ•™์  ํƒ€์ด๋ฐ์ด ์ ˆ๋ฌ˜ํ•˜๊ฒŒ ๋งž์•„๋–จ์–ด์ง„ ๊ฐ€์šด๋ฐ, ํžˆํƒ€์น˜ ์—๋„ˆ์ง€(Hitachi Energy)๊ฐ€ ๋ฏธ๊ตญ ๋‚ด ์ƒ์‚ฐ ์‹œ์„ค์— 10์–ต ๋‹ฌ๋Ÿฌ๋ฅผ ํˆฌ์žํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ๋ฒ„์ง€๋‹ˆ์•„์ฃผ์— 4์–ต 5,700๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ๋“ค์—ฌ์„œ ๊ฑฐ๋Œ€ํ•œ ๋ณ€์••๊ธฐ ๊ณต์žฅ์„ ์ง“์Šต๋‹ˆ๋‹ค. ๋ชฉํ‘œ๋Š” ๋ฏธ๊ตญ์˜ AI ๋ถ๊ณผ ์ „๋ ฅ๋ง ๋ณต์›๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๋Š” ๋™์‹œ์— 800๊ฐœ ์ด์ƒ์˜ ์ผ์ž๋ฆฌ๋ฅผ ์ฐฝ์ถœํ•˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์—๋„ˆ์ง€ ์ •์ฑ…๊ณผ ์ œ์กฐ์—… ๋ถ€ํ™œ์ด ๋งž๋ฌผ๋ฆฐ, ์„ ๊ฑฐ์˜ ํ•ด์— ์–ด์šธ๋ฆฌ๋Š” ๊ทน์ ์ธ ํ–‰๋ณด๋ผ๊ณ  ํ•˜์ง€ ์•Š์„ ์ˆ˜ ์—†๋„ค์š”.

์•„๋งˆ์กด, ๋ˆˆ์œผ๋กœ ์‡ผํ•‘ํ•˜๋‹ค

์•„๋งˆ์กด ๋ Œ์ฆˆ ๋ผ์ด๋ธŒ. Image Credit: Amazon

์•„๋งˆ์กด์ด '๋ Œ์ฆˆ ๋ผ์ด๋ธŒ(Lens Live)'๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์— ์žˆ๋˜ ์‹œ๊ฐ ๊ฒ€์ƒ‰ ๋„๊ตฌ๋ฅผ ๊ฐ•ํ™”ํ•œ ์ด ๊ธฐ๋Šฅ์€ ์ด์ œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ƒํ’ˆ์„ ์Šค์บ”ํ•˜๊ณ , AI ๋ฃจํผ์Šค(Rufus)์˜ ํ†ตํ•ฉ๋œ ์ธ์‚ฌ์ดํŠธ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์นด๋ฉ”๋ผ๋ฅผ ๋น„์ถ”๊ธฐ๋งŒ ํ•˜๋ฉด, ์ œํ’ˆ ๋น„๊ต, ์žฅ๋ฐ”๊ตฌ๋‹ˆ ๋‹ด๊ธฐ, ์œ„์‹œ๋ฆฌ์ŠคํŠธ ์ถ”๊ฐ€ ๊ธฐ๋Šฅ์ด ์บ๋Ÿฌ์…€ ํ˜•ํƒœ๋กœ ํ•œ ๋ฒˆ์— ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. ๋ง ๊ทธ๋Œ€๋กœ ๋ˆˆ์œผ๋กœ ๋ณด๋ฉด์„œ ์‡ผํ•‘ํ•˜๋Š” ๊ฒฝํ—˜์„ ๋จธ์‹ ๋Ÿฌ๋‹์ด ๊ฐ€์†ํ™”ํ•œ ์…ˆ์ด๋„ค์š”.

์•ค์“ฐ๋กœํ”ฝ, ๊ฑฐ์นจ์—†๋Š” ์„ฑ์žฅ์„ธ

์•ค์“ฐ๋กœํ”ฝ(Anthropic)์ด 130์–ต ๋‹ฌ๋Ÿฌ ๊ทœ๋ชจ์˜ ์‹œ๋ฆฌ์ฆˆ F ํˆฌ์ž๋ฅผ ์œ ์น˜ํ•˜๋ฉด์„œ 1,830์–ต ๋‹ฌ๋Ÿฌ์˜ ๊ธฐ์—… ๊ฐ€์น˜๋ฅผ ์ธ์ •๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ์ด๋กœ์จ ํด๋กœ๋“œ(Claude)๋Š” ๋ช…์‹ค์ƒ๋ถ€ํ•œ ๊ธฐ์—…์šฉ AI ์‹œ์žฅ์˜ ์™•์ขŒ์— ์˜ฌ๋ž๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ๋Š”๋ฐ์š”. 1๋…„๋„ ์ฑ„ ๋˜์ง€ ์•Š์•„ ๋งค์ถœ์ด 10์–ต ๋‹ฌ๋Ÿฌ์—์„œ 50์–ต ๋‹ฌ๋Ÿฌ๋กœ ๊ธ‰์ฆํ–ˆ๊ณ , ํŠนํžˆ ํด๋กœ๋“œ ์ฝ”๋“œ ํ•˜๋‚˜๋กœ 5์–ต ๋‹ฌ๋Ÿฌ์˜ ์ˆ˜์ต์„ ์˜ฌ๋ ธ์Šต๋‹ˆ๋‹ค. ์ด์ œ ๋‹จ์ˆœํ•œ ์œ ํ–‰์ด ์•„๋‹Œ, ๋ณธ๊ฒฉ์ ์ธ ๋น„์ฆˆ๋‹ˆ์Šค ๋Œํ’์ด๋ผ๊ณ  ๋ด์•ผ ํ•˜์ง€ ์•Š์„๊นŒ์š”? ์•„์ด์ฝ”๋‹‰(ICONIQ)์ด ํˆฌ์ž๋ฅผ ์ฃผ๋„ํ•˜๋ฉด์„œ ์•ค์“ฐ๋กœํ”ฝ์˜ '์•ˆ์ „ ์šฐ์„ , ๋น ๋ฅธ ํ™•์žฅ' ์ „๋žต์— ํฌ๊ฒŒ ๋ฒ ํŒ…ํ–ˆ์Šต๋‹ˆ๋‹ค.

์˜คํ”ˆAI, โ€˜์‹คํ—˜ ์—”์ง„โ€™์„ ์ธ์ˆ˜ํ•˜๋‹ค

์˜คํ”ˆAI๊ฐ€ ์Šคํƒฏ์‹œ๊ทธ(Statsig)๋ฅผ ์ธ์ˆ˜ํ•˜๊ณ , ์ฐฝ์—…์ž ๋น„์ œ์ด ๋ผ์ง€(Vijaye Raji)๋ฅผ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ CTO๋กœ ์ž„๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค. A/B ํ…Œ์ŠคํŒ… ์ „๋ฌธ ์—…์ฒด๋กœ ์•Œ๋ ค์ง„ ์Šคํƒฏ์‹œ๊ทธ๋Š” ์ด๋ฏธ ์˜คํ”ˆAI๊ฐ€ ๋น ๋ฅด๊ฒŒ ์„œ๋น„์Šค๋ฅผ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ๋„์™€์ฃผ๋Š” ํ•ต์‹ฌ ์—”์ง„์œผ๋กœ ์•Œ๋ ค์ ธ ์žˆ๋Š”๋ฐ, ์ด์ œ ์˜คํ”ˆAI ๋‚ด๋ถ€๋กœ ๋“ค์–ด์™”๋„ค์š”. ๋น„์ œ์ด๊ฐ€ ChatGPT์™€ Codex ๊ฐœ๋ฐœ์„ ์ด๊ด„ํ•˜๊ฒŒ ๋˜๋ฉด์„œ, ์ด๋ฒˆ ์ธ์ˆ˜๋Š” ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜์˜ ์—„๊ฒฉํ•œ ์ œํ’ˆ ํ‰๊ฐ€/ํ…Œ์ŠคํŠธ๋กœ ์ œํ’ˆ์˜ ์™„์„ฑ๋„๋ฅผ ๋†’์ด๊ฒ ๋‹ค๋Š” ์‹ ํ˜ธ๋กœ ํ•ด์„๋ฉ๋‹ˆ๋‹ค.

Image Credit: OpenAI M&A (CBInsights)

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ํŒ€์ด ์ฝ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค

GPT-5, ๋‹จ์ˆœํžˆ ์ •๋ณด๋ฅผ ์ฐพ๋Š” ๋„๊ตฌ๋ฅผ ๋„˜์–ด์„œ, ์ƒ๊ฐ์˜ ๊ฒฝ๊ณ„๋ฅผ ํ™•์žฅํ•˜๋Š” ์ƒˆ๋กœ์šด ํŒŒํŠธ๋„ˆ๊ฐ€ ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์œŒ ์†…ํฌ(Will Schenk)๋Š” GPT-5๊ฐ€ ์ด์ „ ๋ชจ๋ธ๋“ค๊ณผ ๋น„๊ตํ•  ์ˆ˜ ์—†์„ ์ •๋„๋กœ ๋˜‘๋˜‘ํ•˜๋‹ค๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค.

์œŒ์€ ์ •ํ™•ํ•œ ๋‹ต์ด ์ •ํ•ด์ง€์ง€ ์•Š์€ ๋ณต์žกํ•œ ์งˆ๋ฌธ, ์˜ˆ๋ฅผ ๋“ค์–ด์„œ ์‹ฌ๋ฆฌํ•™ ์ด๋ก ๊ณผ ์Šค๋งˆํŠธํฐ ์ค‘๋…์˜ ๊ด€๊ณ„, ํ˜น์€ ์‹ ๋น„์ฃผ์˜ ์ฒ ํ•™ ๊ฐœ๋…์ฒ˜๋Ÿผ ๋‹ต์ด ๋ชจํ˜ธํ•œ ์ฃผ์ œ๋“ค์„ GPT-5์—๊ฒŒ ๋˜์ ธ๋ณด๋Š”๋ฐ์š”. GPT-5๋Š” ๋†€๋ž๊ฒŒ๋„ ๋ฐฉ๋Œ€ํ•œ ์ง€์‹์„ ์—ฎ์–ด๋‚ด๊ณ , ๋ณต์žกํ•œ ๊ฐœ๋… ์‚ฌ์ด์˜ ์ˆจ๊ฒจ์ง„ ์—ฐ๊ฒฐ๊ณ ๋ฆฌ๊นŒ์ง€ ์ฐพ์•„๋‚ด๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ์œŒ์€ GPT-5์˜ ๋‹ต๋ณ€์ด '์ •ํ™•ํ•œ์ง€'๋ฅผ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ ์ž์ฒด๊ฐ€ ๋ฌด์˜๋ฏธํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ๋А๋‚๋‹ˆ๋‹ค. ์˜คํžˆ๋ ค ์ค‘์š”ํ•œ ๊ฒƒ์€, ์ •ํ•ด์ง„ ๋‹ต์„ ์ฐพ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์•„์ด๋””์–ด๋ฅผ ํƒ์ƒ‰ํ•˜๊ณ  ์ดํ•ด๋ฅผ ๋„“ํžˆ๋Š” ๊ณผ์ •์ด๋ผ๋Š” ๊ฒƒ์„ ๊นจ๋‹ซ๊ฒŒ ๋œ ๊ฑฐ์ฃ .

๊ฒฐ๊ตญ ์œŒ์€ GPT-5๊ฐ€ ๋‹จ์ˆœํ•œ ๊ฒ€์ƒ‰ ์—”์ง„์„ ๋„˜์–ด์„œ, ์ธ๊ฐ„์˜ ์ง€์  ํ˜ธ๊ธฐ์‹ฌ์„ ์ž๊ทนํ•˜๊ณ  ์ƒˆ๋กœ์šด ์งˆ๋ฌธ์„ ๋˜์ง€๊ฒŒ ๋งŒ๋“œ๋Š” ์ง„์ •ํ•œ '๋Œ€ํ™” ์ƒ๋Œ€'๊ฐ€ ๋˜์–ด๊ฐ€๊ณ  ์žˆ๋‹ค๊ณ  ๋งํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ์•„์ด๋“ค์ด ๋‹ต๋ณด๋‹ค ์งˆ๋ฌธ ์ž์ฒด๋ฅผ ์ฆ๊ธฐ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, GPT-5๋Š” ์šฐ๋ฆฌ๊ฐ€ ๊ทธ๋™์•ˆ ๋˜์งˆ ๊ณณ์ด ์—†์—ˆ๋˜ ์ˆ˜๋งŽ์€ ์งˆ๋ฌธ๋“ค์„ ํ’€์–ด๋†“์„ ์ˆ˜ ์žˆ๋Š” ๊ณต๊ฐ„์ด ๋˜์–ด์ฃผ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

UC ๋ฒ„ํด๋ฆฌ์˜ ๋กœ๋ด‡ ๊ณตํ•™์ž ์ผ„ ๊ณจ๋“œ๋ฒ„๊ทธ(Ken Goldberg) ๊ต์ˆ˜๋Š”, โ€œํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡์˜ ํ˜๋ช…์ด ๊ณง ์˜ฌ ๊ฒƒโ€์ด๋ผ๋Š” ์ผ๋ถ€ ๊ธฐ์ˆ  ๋ฆฌ๋”๋“ค์˜ ์ฃผ์žฅ์— ํšŒ์˜์ ์ธ ์‹œ๊ฐ์„ ๋“œ๋Ÿฌ๋ƒˆ์Šต๋‹ˆ๋‹ค. AI ์ฑ—๋ด‡์ด ๋ฐฉ๋Œ€ํ•œ ์ธํ„ฐ๋„ท ๋ฐ์ดํ„ฐ๋กœ ๋น ๋ฅด๊ฒŒ ํ•™์Šตํ•œ ๊ฒƒ๊ณผ ๋‹ค๋ฅด๊ฒŒ, ๋กœ๋ด‡์€ ํ˜„์‹ค ์„ธ๊ณ„์˜ ๋™์ž‘์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ํ„ฑ์—†์ด ๋ถ€์กฑํ•ด์„œ ์ง€๋Šฅ์„ ๋น ๋ฅด๊ฒŒ ์Šต๋“ํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๊ฑด๋ฐ์š”. ํŠนํžˆ ์œ ๋ฆฌ์ž”์„ ์žก๊ฑฐ๋‚˜ ์ „๊ตฌ๋ฅผ ๋ฐ”๊พธ๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ์„ฌ์„ธํ•œ ์†์žฌ์ฃผ๊ฐ€ ํ•„์š”ํ•œ ์ž‘์—…์—์„œ ๋กœ๋ด‡์ด ์—ฌ์ „ํžˆ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ์ด์œ ๊ฐ€ ๋ฐ”๋กœ ์—ฌ๊ธฐ์— ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๊ณจ๋“œ๋ฒ„๊ทธ ๊ต์ˆ˜๋Š” ์•ž์œผ๋กœ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๊ณ , ๋‹น๋ถ„๊ฐ„์€ ๋ธ”๋ฃจ์นผ๋ผ ์ง์—…๋ณด๋‹ค ๋ฌธ์„œ ์ž‘์„ฑ๊ณผ ๊ฐ™์€ ์ผ๋ถ€ ํ™”์ดํŠธ์นผ๋ผ ์ง์—…์ด ๋” ๋น ๋ฅด๊ฒŒ ์ž๋™ํ™”๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค๊ณ  ๋‚ด๋‹ค๋ดค์Šต๋‹ˆ๋‹ค.

๋ฏธ๊ตญ ์ตœ๋Œ€ ๊ธ‰์—ฌ ์†Œํ”„ํŠธ์›จ์–ด ์‚ฌ์—…์ž์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•œ ์Šคํƒ ํฌ๋“œ์˜ ์ƒˆ๋กœ์šด ์—ฐ๊ตฌ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅด๋ฉด, ์ƒ์„ฑํ˜• AI๊ฐ€ ๋…ธ๋™ ์‹œ์žฅ์— ์˜ˆ์ƒ๋ณด๋‹ค ๋น ๋ฅด๊ฒŒ ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ณ  ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, AI์— ๊ฐ€์žฅ ๋งŽ์ด ๋…ธ์ถœ๋œ ์ง์—…๊ตฐ์— ์ข…์‚ฌํ•˜๋Š” ์‚ฌํšŒ ์ดˆ๋…„์ƒ(22~25์„ธ)๋“ค์ด ๊ฐ€์žฅ ํฐ ํƒ€๊ฒฉ์„ ์ž…๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์—ฐ๊ตฌ๋Š” AI๊ฐ€ ๋„๋ฆฌ ๋ณด๊ธ‰๋œ ์ดํ›„, ์ด ์‚ฌ๋žŒ๋“ค์˜ ๊ณ ์šฉ๋ฅ ์ด ๋‹ค๋ฅธ ์ง์—…๊ตฐ์˜ ๊ทผ๋กœ์ž๋“ค๋ณด๋‹ค ์ƒ๋Œ€์ ์œผ๋กœ 13% ๊ฐ์†Œํ–ˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ๋ฐํ˜€๋ƒˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์—, AI ๋…ธ์ถœ๋„๊ฐ€ ๋‚ฎ์€ ์ง์—…์ด๋‚˜ ๊ฐ™์€ ์ง์—…๊ตฐ์ด๋ผ๋„ ๊ฒฝ๋ ฅ์ด ๋งŽ์€ ์ˆ™๋ จ๋œ ๊ทผ๋กœ์ž๋“ค์˜ ๊ณ ์šฉ์€ ์•ˆ์ •์ ์œผ๋กœ ์œ ์ง€๋˜๊ฑฐ๋‚˜ ๊ณ„์† ์ฆ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ด๋ฒˆ ๋ณ€ํ™”๋Š” ๊ธ‰์—ฌ๊ฐ€ ์•„๋‹Œ '๊ณ ์šฉ' ๊ฐ์†Œ๋ผ๋Š” ํ˜•ํƒœ๋กœ ๋‚˜ํƒ€๋‚˜๊ณ  ์žˆ๋Š”๋ฐ, AI๊ฐ€ ์ธ๊ฐ„์˜ ์—…๋ฌด๋ฅผ '๋ณด์กฐ'ํ•˜๋Š” ์—ญํ• ๋ณด๋‹ค๋Š” '์ž๋™ํ™”'ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ๊ฐ•ํ•œ ์ง์—…๊ตฐ์—์„œ ๋‘๋“œ๋Ÿฌ์ง€๊ฒŒ ๊ด€์ฐฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. AI ํ˜๋ช…์ด ๋ฏธ๊ตญ ๋…ธ๋™ ์‹œ์žฅ์˜ ์‹ ์ž… ๊ทผ๋กœ์ž๋“ค์—๊ฒŒ ๋ถˆ๊ท ํ˜•์ ์œผ๋กœ ํฐ ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ธฐ ์‹œ์ž‘ํ–ˆ๋‹ค๋Š” ๊ฐ€์„ค์„ ๋’ท๋ฐ›์นจํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ์ฆ๊ฑฐ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.

์ฒดํฌํ•ด ๋ณผ ๋งŒํ•œ ๋ฒค์น˜๋งˆํฌ (๋งˆํ”ผ์•„ ๊ฒŒ์ž„ ๊ฐ™์•„์š”!)

์ตœ๊ทผ์— ๋‹ค์–‘ํ•œ ์ž๋ฆฌ์—์„œ โ€˜๋ฒค์น˜๋งˆํฌโ€™์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ๋ฅผ ๋งŽ์ด ๋“œ๋ฆฌ๊ธฐ๋„ ํ•˜๊ณ , ๋“ฃ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๊ฒƒ๋งŒํผ์ด๋‚˜ ๋‚ด๊ฐ€ ์›ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ๊ฒƒ์ด ์ •๋ง ์ค‘์š”ํ•˜์ž–์•„์š”?

์˜ค๋Š˜์€ LLM์˜ ์ƒˆ๋กœ์šด ๋Šฅ๋ ฅ์„ ์ธก์ •ํ•˜๋Š” Werewolf ๋ฒค์น˜๋งˆํฌ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฒค์น˜๋งˆํฌ๋Š” ๋‹จ์ˆœํ•œ ๋ฌธ์ œ ํ’€์ด๋ฅผ ๋„˜์–ด์„œ์„œ, ๋งˆ์น˜ ๋งˆํ”ผ์•„ ๊ฒŒ์ž„์ฒ˜๋Ÿผ LLM์ด ๋ณต์žกํ•œ ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ๊ณผ ์†Œํ†ต ๋Šฅ๋ ฅ์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ดํ•ดํ•˜๋Š”์ง€ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋Š‘๋Œ€, ์ฃผ๋ฏผ ๋“ฑ ๋‹ค์–‘ํ•œ ์—ญํ• ์„ ๋ถ€์—ฌํ•ด์„œ ๋ชจ๋ธ์˜ ์–ธ์–ด ์ „๋žต๊ณผ ์ถ”๋ฆฌ ๋Šฅ๋ ฅ์„ ์ธก์ •ํ•˜๋Š” ๊ฒƒ์ด ํŠน์ง•์ž…๋‹ˆ๋‹ค.

Werewolf ๋ฒค์น˜๋งˆํฌ๋Š”, ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์™€ ๋‹ค๋ฅด๊ฒŒ ์ •๋‹ต์„ ๋งžํžˆ๋Š” ๋Œ€์‹  ๋ชจ๋ธ์˜ ์ „๋žต์ ์ธ ์†Œํ†ต ๋Šฅ๋ ฅ๊ณผ ํŒ€์›Œํฌ๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๊ฑธ ๋ชฉํ‘œ๋กœ ๋งŒ๋“ค์–ด์กŒ์Šต๋‹ˆ๋‹ค. ๊ฒŒ์ž„ ์ค‘์— ์Œ“์ด๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ Elo ์ ์ˆ˜๋ฅผ ๋งค๊ธฐ๋Š” ๋“ฑ, ๋ชจ๋ธ์˜ ์‚ฌํšŒ์  ์ง€๋Šฅ์„ ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ”๋กœ, LLM์˜ ์„ฑ๋Šฅ์„ ๋‹จ์ˆœํžˆ ๊ธฐ์ˆ ์ ์ธ ๋ฉด ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์‚ฌํšŒ์  ๋งฅ๋ฝ์—์„œ๋„ ํ‰๊ฐ€ํ•˜๋ ค๋Š” ์ƒˆ๋กœ์šด ์‹œ๋„๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์„ ๊ฒ๋‹ˆ๋‹ค.

์ด ๋ฒค์น˜๋งˆํฌ๋Š” ์ด๋ฏธ Gemini๋‚˜ GPT์™€ ๊ฐ™์€ ์ฃผ์š” LLM์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ํ™œ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. LLM์ด ๋‹จ์ˆœํ•œ ๋„๊ตฌ๋ฅผ ๋„˜์–ด์„œ ์šฐ๋ฆฌ ์‚ฌํšŒ์˜ ์ผ์›์œผ๋กœ์„œ ๋” ๋‚˜์€ ์†Œํ†ต๊ณผ ํ˜‘๋ ฅ์„ ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๊ธฐ ์œ„ํ•ด ๋งŒ๋“ค์–ด์ง„ Werewolf ๋ฒค์น˜๋งˆํฌ. ์ธ๊ณต์ง€๋Šฅ์˜ ๋ฏธ๋ž˜๊ฐ€ ๋‹จ์ˆœํžˆ ๋˜‘๋˜‘ํ•œ ๊ฒƒ์„ ๋„˜์–ด์„œ ์ธ๊ฐ„๊ณผ ๋” ์ž˜ ์ƒํ˜ธ์ž‘์šฉํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐ€๊ณ  ์žˆ๋‹ค๋Š” ๊ฑธ ๋ณด์—ฌ์ฃผ๋Š” ์ค‘์š”ํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • EmbeddingGemma - ์˜จ๋””๋ฐ”์ด์Šค(On-Device) ๊ฒ€์ƒ‰, ํด๋Ÿฌ์Šคํ„ฐ๋ง, ์„œ์น˜์— ์ตœ์ ํ™”๋œ ์˜คํ”ˆ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์„ ์ œ๊ณตํ•˜๋Š”๋ฐ, ๋‹ค๊ตญ์–ด ํŒŒ์ดํ”„๋ผ์ธ๊ณผ ์ž„๋ฒ ๋”ฉ ํฌ๊ธฐ๋ฅผ ์œ ์—ฐํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • LLaVA-Critic-R1: Your Critic Model is Secretly a Strong Policy Model โ€“ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด์„œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋น„ํ‰๊ฐ€ ๋ชจ๋ธ์„ ํ†ตํ•ฉ๋œ Critic-Policy ๋ชจ๋ธ๋กœ ๋ณ€ํ™˜ํ•ด์„œ, ์ƒ์„ฑ ๋Šฅ๋ ฅ๋„ ๊ฐ•๋ ฅํ•˜๊ฒŒ ํ•  ๋ฟ ์•„๋‹ˆ๋ผ ์ž๊ฐ€ ๋น„ํ‰๋„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Kwai Keye-VL 1.5 Technical Report โ€“ Slow-fast ์ธ์ฝ”๋”ฉ ์ „๋žต, ์žฅ๋ฌธ(Long-context) ํ•™์Šต, ๊ทธ๋ฆฌ๊ณ  ์ถ”๋ก  ์ค‘์‹ฌ์˜ ํ›„์† ํ•™์Šต์„ ํ†ตํ•ด์„œ MLLM(๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ)์˜ ๋น„๋””์˜ค ์ดํ•ด ๋Šฅ๋ ฅ์„ ๋ฐœ์ „์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Robix: A Unified Model for Robot Interaction, Reasoning and Planning โ€“ ์žฅ๊ธฐ ๊ณผ์—…(Long-horizon Tasks)์„ ์œ„ํ•œ ๊ณ„ํš, ์‹คํ–‰, ์ƒํ˜ธ์ž‘์šฉ์„ ํ•˜๋Š” ๋‹จ์ผํ•œ ๋น„์ „-์–ธ์–ด ์ •์ฑ… ์•ˆ์—์„œ ๋†’์€ ์ˆ˜์ค€์˜ ๋กœ๋ด‡ ๊ณ„ํš๊ณผ ๋Œ€ํ™”๋ฅผ ํ†ตํ•ฉํ•ฉ๋‹ˆ๋‹ค โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Flavors of Moonshine: Tiny Specialized ASR Models for Edge Devices โ€“ ํšจ์œจ์ ์œผ๋กœ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ํ˜ผํ•ฉํ•ด์„œ, ์–ธ์–ด๋ณ„๋กœ ์†Œํ˜• ์Œ์„ฑ ์ธ์‹๊ธฐ๋ฅผ ํŠนํ™”ํ•ด์„œ ์—ฃ์ง€ ํ•˜๋“œ์›จ์–ด์—์„œ์˜ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์•„ํ‚คํ…์ฒ˜ ๋ฐ ํšจ์œจ์„ฑ (๋ชจ๋ธ, ์˜ตํ‹ฐ๋งˆ์ด์ €, Representations)

  • ๐ŸŒŸ Gated Associative Memory: A Parallel O(N) Architecture for Efficient Sequence Modeling (by Rishiraj Acharya) โ€“ ์–ดํ…์…˜(Attention) ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์œตํ•ฉ๋œ ๋กœ์ปฌ ์ปจ๋ณผ๋ฃจ์…˜(Fused Local Convolution)๊ณผ ์ „์—ญ์  ์—ฐ๊ด€ ๊ฒ€์ƒ‰(Global Associative Retrieval)์œผ๋กœ ๋Œ€์ฒดํ•ด์„œ ์„ ํ˜•์ ์œผ๋กœ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด ์ค๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Fantastic Pretraining Optimizers and Where to Find Them (by Stanford) โ€“ ์—„๊ฒฉํ•œ ํŠœ๋‹๊ณผ ์˜ˆ์‚ฐ ์กฐ๊ฑด ํ•˜์—์„œ ์—ฌ๋Ÿฌ ์˜ตํ‹ฐ๋งˆ์ด์ €(Optimizer)๋ฅผ ๋น„๊ตํ•ด์„œ, ์ „์ฒด ์—”๋“œ-ํˆฌ-์—”๋“œ ๊ณผ์ •(End-to-End)์—์„œ ์†Œํญ์˜ ์†๋„ ํ–ฅ์ƒ๊ณผ Matrix Preconditioners์— ๋Œ€ํ•ด์„œ ๊ทœ๋ชจ์— ์˜์กดํ•˜๋Š” ์ด๋“์ด ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐํ˜€๋ƒ…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Reasoning Vectors: Transferring Chain-of-Thought Capabilities via Task Arithmetic โ€“ GRPO ๋ชจ๋ธ๊ณผ SFT ๋ชจ๋ธ ์‚ฌ์ด์˜ ์ถ”๋ก  ๋ธํƒ€(Reasoning Delta)๋ฅผ ์ถ”์ถœํ•˜๊ณ , ์ด๋ฅผ ์ถ”๊ฐ€์ ์œผ๋กœ ์ ์šฉํ•ด์„œ ๋‹ค์šด์ŠคํŠธ๋ฆผ ๊ณผ์ œ(Downstream)์—์„œ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์—์ด์ „ํŠธ ๋ฐ ๋„๊ตฌ ์‚ฌ์šฉ (GUI, ์†Œํ”„ํŠธ์›จ์–ด ๊ณตํ•™, ๋ฉ€ํ‹ฐํ„ด ๋„๊ตฌ)

  • UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning โ€“ ๋ฐ์ดํ„ฐ ํ”Œ๋ผ์ดํœ (Data Flywheels), ์•ˆ์ •ํ™”๋œ ๋ฉ€ํ‹ฐํ„ด ๊ฐ•ํ™”ํ•™์Šต(RL), ํ•˜์ด๋ธŒ๋ฆฌ๋“œ OS ํ™˜๊ฒฝ์„ ํ™œ์šฉํ•ด์„œ ๋„ค์ดํ‹ฐ๋ธŒ GUI ์—์ด์ „ํŠธ๋ฅผ ํ™•์žฅํ•˜๊ณ , ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ์— ๊ฑธ์นœ(Cross-Benchmark) ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use โ€“ ์—ฌ๋Ÿฌ ๋„๋ฉ”์ธ์— ๊ฑธ์ณ์„œ ๋น„๋™๊ธฐ์  ๋กค์•„์›ƒ(Asynchronous Rollouts)๊ณผ ๋ชจ๋“ˆํ˜• ๋„๊ตฌ API๋ฅผ ํ†ตํ•ฉํ•ด์„œ, ๋ฉ€ํ‹ฐํ„ด(Multi-Turn) ๋ฐ ๋„๊ตฌ๋กœ ๊ฐ•ํ™”๋œ(Tool-Augmented) ์—์ด์ „ํŠธ๋ฅผ ํ›ˆ๋ จ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์‚ฌํ›„ ํ›ˆ๋ จ(Post-training) ๋ฐ ์ถ”๋ก  ์ตœ์ ํ™” (RLVR, SFT ๋“ฑ)

  • Towards a Unified View of Large Language Model Post-Training โ€“ ๊ณตํ†ต๋œ ๊ทธ๋ž˜๋””์–ธํŠธ ์ถ”์ •๋Ÿ‰(Gradient Estimator) ํ•˜์—์„œ SFT(์ง€๋„ ๋ฏธ์„ธ ์กฐ์ •)์™€ RL(๊ฐ•ํ™”ํ•™์Šต)์„ ํ†ตํ•ฉํ•˜๊ณ , ์‹ ํ˜ธ๋ฅผ ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ ์„ ํƒํ•˜๋Š” ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ํ›„์† ํ•™์Šต์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning โ€“ ์˜๋ฏธ ์—†๋Š” ํ„ด(Void-Turn)์˜ ๊ถค์ ์„ ํ•„ํ„ฐ๋งํ•ด์„œ ๊ทธ๋ž˜๋””์–ธํŠธ ํญ๋ฐœ(Gradient Explosions)์„ ๋ฐฉ์ง€ํ•จ์œผ๋กœ์จ, ๋ฉ€ํ‹ฐํ„ด(Multi-Turn) ๋„๊ตฌ ์‚ฌ์šฉ์„ ์•ˆ์ •์ ์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Beyond Correctness: Harmonizing Process and Outcome Rewards through RL Training โ€“ ๊ณผ์ •-๊ฒฐ๊ณผ ์ผ๊ด€์„ฑ ํ•„ํ„ฐ(Process-Outcome Consistency Filters)๋ฅผ ์‚ฌ์šฉํ•ด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ๋ ˆ์ด์…˜ํ•ด์„œ, ์ตœ์ข…์ ์ธ ์ •ํ™•๋„์™€ ๋‹จ๊ณ„๋ณ„ ํ’ˆ์งˆ์„ ํ•จ๊ป˜ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • DCPO: Dynamic Clipping Policy Optimization โ€“ ํด๋ฆฌํ•‘(Clipping) ๊ฒฝ๊ณ„๋ฅผ ํ† ํฐ ๋‹จ์œ„๋กœ ์กฐ์ •ํ•˜๊ณ  ์‹œ๊ฐ„ ๊ฒฝ๊ณผ์— ๋”ฐ๋ฅธ ์–ด๋“œ๋ฐดํ‹ฐ์ง€(Advantages)๋ฅผ ํ‰ํ™œํ™”(Smooth)ํ•ด์„œ, ๊ทธ๋ž˜๋””์–ธํŠธ๊ฐ€ ์œ ์šฉํ•œ ์ •๋ณด๋ฅผ ๋‹ด๊ณ  ํšจ๊ณผ์ ์œผ๋กœ ์œ ์ง€๋˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋ฐ์ดํ„ฐ ๋ฐ ํ‰๊ฐ€ (๋ฒค์น˜๋งˆํฌ, ๋ฐ์ดํ„ฐ์…‹, ์ธก์ •)

  • Open Data Synthesis For Deep Research โ€“ ์‹ฌ์ธต ์—ฐ๊ตฌ(Deep Research)๋ฅผ ๊ณ„์ธต์  ์ œ์•ฝ ๋งŒ์กฑ(Hierarchical Constraint Satisfaction) ๋ฌธ์ œ๋กœ ๊ณต์‹ํ™”ํ•˜๊ณ , ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋Œ€๊ทœ๋ชจ ๋‹ค๋‹จ๊ณ„(Multi-Step) ์งˆ๋ฌธ์„ ์ƒ์„ฑํ•ด์„œ LLM์ด ์ฆ๊ฑฐ๋ฅผ ์ข…ํ•ฉํ•˜๊ฒŒ๋”(Evidence-Synthesizing) ํ›ˆ๋ จํ•˜๊ณ  ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth โ€“ ์ˆ˜์‚ฌ์ ์œผ๋กœ๋Š” ์—ญ์„ค์ ์ด์ง€๋งŒ ์˜๋ฏธ ์žˆ๋Š” ํ…์ŠคํŠธ๋กœ ๊ตฌ์„ฑ๋œ ๋‹ค๊ตญ์–ด ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•ด์„œ, ์‹ค์šฉ์ , ๊ฐ์ •์ , ๋„๋•์  ์ถ”๋ก ์˜ ๊ฒฉ์ฐจ(Inference Gaps)๋ฅผ ํƒ์ƒ‰ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ LMEnt: A Suite for Analyzing Knowledge in Language Models from Pretraining Data to Representations โ€“ ๊ฐœ์ฒด์— ์ฃผ์„์ด ๋‹ฌ๋ฆฐ(Entity-Annotated) ์ฝ”ํผ์Šค, ๊ฒ€์ƒ‰ ๋„๊ตฌ, ๊ทธ๋ฆฌ๊ณ  ์ฒดํฌํฌ์ธํŠธ๋œ ๋ชจ๋ธ์„ ์ œ๊ณตํ•ด์„œ, ์–ธ์–ด ๋ชจ๋ธ(LM) ๋‚ด๋ถ€์—์„œ ์‚ฌ์‹ค(Facts)์ด ์–ด๋–ป๊ฒŒ ์ž…๋ ฅ๋˜๊ณ  ์ง„ํ™”ํ•˜๋Š”์ง€๋ฅผ ์ถ”์ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ The Gold Medals in an Empty Room: Diagnosing Metalinguistic Reasoning in LLMs with Camlang (by Cambridge, Oxford, UIUC) โ€“ ๋ฌธ๋ฒ•๊ณผ ์‚ฌ์ „์„ ๊ฐ–์ถ˜ ์ธ๊ณต ์–ธ์–ด(Constructed Language)๋ฅผ ๋„์ž…ํ•ด์„œ, ํŒจํ„ด ๋งค์นญ๊ณผ๋Š” ๊ตฌ๋ณ„๋˜๋Š” ๋ช…์‹œ์ ์ธ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ์ถ”๋ก (Rule-Based Reasoning)์„ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Flaw or Artifact? Rethinking Prompt Sensitivity in Evaluating LLMs โ€“ ํ‰๊ฐ€ ํœด๋ฆฌ์Šคํ‹ฑ(Evaluation Heuristics)์ด ํ”„๋กฌํ”„ํŠธ ๋ฏผ๊ฐ๋„(Prompt Sensitivity)๋ฅผ ๋ถ€ํ’€๋ฆฐ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ๊ณ , 'LLM-as-a-Judge' ํ”„๋กœํ† ์ฝœ์„ ํ†ตํ•ด์„œ ๋ถ„์‚ฐ(Variance)์ด ๊ฐ์†Œํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์•ˆ์ „, ๊ฐ€๋“œ๋ ˆ์ผ ๋ฐ ๋ฐ”์ด์–ด์Šค (์ •์ฑ…, ๊ฒ€์ธก, ๊ฐ•๊ฑด์„ฑ)

  • DynaGuard: A Dynamic Guardrail Model With User-Defined Policies โ€“ ์ •์ ์ธ ๋ถ„๋ฅ˜ ์ฒด๊ณ„(Static Taxonomies)๋ฅผ ๋„˜์–ด์„œ ์—ฌ๋Ÿฌ ๋„๋ฉ”์ธ์— ๊ฑธ์ณ์„œ, ๋น ๋ฅธ ํƒ์ง€ ๋˜๋Š” CoT(Chain-of-Thought) ์ •๋‹นํ™”๋ฅผ ํ†ตํ•ด์„œ ์‚ฌ์šฉ์ž ๋งž์ถคํ˜• ์ •์ฑ…(Customizable Policies)์„ ์‹œํ–‰ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ AMBEDKAR: A Multi-level Bias Elimination through a Decoding Approach with Knowledge Augmentation โ€“ ์žฌํ›ˆ๋ จ ์—†์ด ์ถ”๋ก  ์‹œ์ ์— 'ํ—Œ๋ฒ• ๊ธฐ๋ฐ˜์˜ ์ถ”์ธก์„ฑ ๋””์ฝ”๋”ฉ(Constitution-Guided Speculative Decoding)'์„ ์ ์šฉํ•ด์„œ, ๋ฌธํ™”์ ์œผ๋กœ ๋ฌธ์ œ๊ฐ€ ๋˜๋Š” ์œ ํ•ด์„ฑ(Culturally Specific Harms)์„ ์ค„์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ƒ์„ฑ ๋ฐ ํŽธ์ง‘ (์ด๋ฏธ์ง€, ๊ฐœ์ธํ™”)

  • MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement โ€“ ๋‹ค์ค‘ ํ”ผ์‚ฌ์ฒด ํ•ฉ์„ฑ(Multi-Subject Synthesis) ์ž‘์—…์—์„œ ํ”ผ์‚ฌ์ฒด๋ฅผ ๋ชฉํ‘œ ์˜์—ญ์— ์ •๋ ฌํ•˜๊ณ  ํŠน์ง•๋“ค์„ ๋ถ„๋ฆฌ(Disentangle)ํ•ด์„œ ๊ฐ ํ”ผ์‚ฌ์ฒด์˜ ์ •์ฒด์„ฑ์„ ๋ณด์กดํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing โ€“ ์ž๊ธฐํšŒ๊ท€(Autoregressive) ์ƒ˜ํ”Œ๋ง ๋…ธ์ด์ฆˆ๋ฅผ ์—ญ์ „์‹œ์ผœ์„œ, ํ”„๋กฌํ”„ํŠธ์— ๋ถ€ํ•ฉํ•˜๋ฉด์„œ๋„ ๊ตฌ์กฐ๋ฅผ ๋ณด์กดํ•˜๋Š”(Structure-Preserving) ๋ฐฉ์‹์œผ๋กœ ์ด๋ฏธ์ง€๋ฅผ ์žฌ๊ตฌ์„ฑํ•˜๊ณ  ํŽธ์ง‘ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋กœ๋ณดํ‹ฑ์Šค ๋ฐ ์ธ์ง€ ์ž‘์—… (3D ๊ธฐํ•˜ํ•™, Sim-to-Real)

  • ๐ŸŒŸ Manipulation as in Simulation: Enabling Accurate Geometry Perception in Robots (by ByteDance) โ€“ ์‹ฌ๋„ ์นด๋ฉ”๋ผ(Depth-Camera)์˜ ๋…ธ์ด์ฆˆ๋ฅผ ๋ชจ๋ธ๋งํ•ด์„œ ์‹ค์ œ ๊ฑฐ๋ฆฌ ์ธก์ • ๊นŠ์ด(Metric Depth)์˜ ๋…ธ์ด์ฆˆ๋ฅผ ์ œ๊ฑฐํ•ด์„œ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ›ˆ๋ จ๋œ ์ •์ฑ…(Policies)์ด ์‹ค์ œ ์กฐ์ž‘(Real Manipulation) ํ™˜๊ฒฝ์œผ๋กœ ์ง์ ‘ ์ „์ด๋  ์ˆ˜ ์žˆ๊ฒŒ๋” ํ•ด ์ค๋‹ˆ๋‹ค.
    โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.