• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#90: AI แ„‡แ…ฆแ†ซแ„Žแ…ตแ„†แ…กแ„แ…ณแ„‹แ…ด แ„‹แ…งแ†จแ„‰แ…ฅแ†ฏ: 'แ„Œแ…ตแ„‚แ…ณแ†ผ'แ„‹แ…ณแ†ฏ แ„Žแ…ณแ†จแ„Œแ…ฅแ†ผแ„’แ…กแ†ซแ„ƒแ…กแ„‚แ…ณแ†ซ แ„€แ…ฅแ†บแ„‹แ…ด แ„’แ…กแ†ทแ„Œแ…ฅแ†ผ

๐ŸŒFOD#90: AI แ„‡แ…ฆแ†ซแ„Žแ…ตแ„†แ…กแ„แ…ณแ„‹แ…ด แ„‹แ…งแ†จแ„‰แ…ฅแ†ฏ: 'แ„Œแ…ตแ„‚แ…ณแ†ผ'แ„‹แ…ณแ†ฏ แ„Žแ…ณแ†จแ„Œแ…ฅแ†ผแ„’แ…กแ†ซแ„ƒแ…กแ„‚แ…ณแ†ซ แ„€แ…ฅแ†บแ„‹แ…ด แ„’แ…กแ†ทแ„Œแ…ฅแ†ผ

แ„‡แ…ฆแ†ซแ„Žแ…ตแ„†แ…กแ„แ…ณแ„‹แ…ด แ„‘แ…ฉแ„’แ…ช, แ„€แ…ฎแ†บแ„’แ…กแ„แ…ณแ„‹แ…ด แ„‡แ…ฅแ†ธแ„Žแ…ตแ†จแ„€แ…ช แ„Œแ…ตแ†ซแ„แ…ก 'แ„Œแ…ตแ„‚แ…ณแ†ผ'แ„‹แ…ณแ†ฏ แ„Žแ…ณแ†จแ„Œแ…ฅแ†ผแ„’แ…กแ„€แ…ต แ„‹แ…ฑแ„’แ…กแ†ซ แ„‡แ…กแ†ผแ„’แ…ฃแ†ผ + Sesame AI + แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‚แ…ฒแ„‰แ…ณ แ„†แ…ตแ†พ แ„‹แ…งแ†ซแ„€แ…ฎ

์†Œ์œ„, ์ ์  ๋” โ€˜๋˜‘๋˜‘ํ•œโ€™ AI๋ฅผ ๊ฐœ๋ฐœํ•˜๋ ค๋Š” ๊ฒฝ์Ÿ์€ ์ ์  ์น˜์—ดํ•ด์ง€๊ณ  ์žˆ์ฃ . ์ง€๋‚œ 2์›” 27์ผ ์˜คํ”ˆAI๋Š” ๊ธฐ๋‹ค๋ฆฌ๋˜ ์ตœ์‹  ๋ชจ๋ธ, โ€˜GPT-4.5โ€™๋ฅผ ๋ฐœํ‘œํ–ˆ๊ตฌ์š”, ๋ฐ”๋กœ ์ดํ‹€ ์ „, ์•ค์“ฐ๋กœํ”ฝ์€ ์ตœ์ดˆ์˜ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ถ”๋ก  ๋ชจ๋ธ โ€˜Claude 3.7 Sonnetโ€™์„ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค.

GPT-4.5๋Š” ํŠนํžˆ โ€˜๊ฐ์„ฑ ์ง€๋Šฅโ€™์„ ํ–ฅ์ƒ์‹œํ‚ค๋ฉด์„œ ๊ธ€์“ฐ๊ธฐ, ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋“ฑ ์˜์—ญ์—์„œ ์“ธ๋ชจ๊ฐ€ ๋†’์•„์ง„ ๊ฑธ๋กœ ๋ณด์ด๊ณ , ๋Œ€ํ™”์˜ ํ๋ฆ„์ด ์ด์ „๋ณด๋‹ค ํ•œ์ธต ์ž์—ฐ์Šค๋Ÿฌ์›Œ์กŒ์Šต๋‹ˆ๋‹ค. โ€˜ํ™˜๊ฐโ€™ ํ˜„์ƒ๋„ GPT-4o ๋Œ€๋น„ ํฌ๊ฒŒ ๊ฐ์†Œํ–ˆ๋‹ค๊ณ  ํ•˜๊ตฌ์š”.

Claude 3.7 Sonnet์€ โ€˜์‹œ์Šคํ…œ 1 ์‚ฌ๊ณ โ€™ - ์ฆ‰๊ฐ์ ์œผ๋กœ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒƒ, ๊ทธ๋ฆฌ๊ณ  โ€˜์‹œ์Šคํ…œ 2 ์‚ฌ๊ณ โ€™ - ๊นŠ์€ ์ถ”๋ก  ๊ณผ์ •์„ ํ•˜๋‚˜์˜ ๋ชจ๋ธ์— ํ†ตํ•ฉํ•œ ๊ฒƒ์ด ํŠน์ง•์œผ๋กœ, ์ฝ”๋”ฉ ๋ถ„์•ผ์— ๊ฐ•์ ์ด ์žˆ์„ ๋ฟ ์•„๋‹ˆ๋ผ Extended Thinking Mode๋ฅผ ํ™œ์„ฑํ™”ํ•˜๋ฉด ๋‹ค๋ฅธ ์ตœ์‹  ๋ชจ๋ธ๊ณผ ๋น„์Šทํ•œ ์ˆ˜์ค€์˜ ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜๊ฐ€ ๋‚˜์˜จ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๋ญ, ์–ด๋–ค ๋ชจ๋ธ์ด ๋‚˜์™”๋‹ค๋Š” ๋ง์”€์„ ๋“œ๋ฆฌ๋ ค๋Š” ๊ฑด ์•„๋‹™๋‹ˆ๋‹ค. ์˜คํžˆ๋ ค, โ€˜๋” ๋˜‘๋˜‘ํ•œ AIโ€™๋ฅผ ๊ฐœ๋ฐœํ•˜๋ ค๋Š” ๊ฒฝ์Ÿ์ด ๋‚ณ๊ณ  ์žˆ๋Š” โ€˜์—ญ์„ค (Paradox)โ€™์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ๋ฅผ ํ•˜๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค - ๋ฐ”๋กœ, โ€˜๋ฐœ์ „์˜ ์ •๋„โ€™๋ฅผ ์ธก์ •ํ•˜๋Š”๋ฐ ์‚ฌ์šฉํ•˜๋Š” โ€˜๋ฒค์น˜๋งˆํฌโ€™์— ๋Œ€ํ•œ ์ด์•ผ๊ธฐ์ž…๋‹ˆ๋‹ค.

๊ฐ์ข… ๋ฒค์น˜๋งˆํฌ๋“ค์ด ๋น ๋ฅด๊ฒŒ ํฌํ™”๋˜๋ฉด์„œ, โ€˜์ถ”๋ก โ€™ ๋Šฅ๋ ฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ๋“ค์ด ๋“ฑ์žฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ๋ฒค์น˜๋งˆํฌ๋Š”, ๋ชจ๋ธ์ด ๋ฐœ์ „ํ•˜๋Š” ์†๋„, ๋ฐ”๋กœ ๊ทธ๋งŒํผ ๋น ๋ฅด๊ฒŒ ์“ธ๋ชจ๊ฐ€ ์—†์–ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด๋ณผ๊นŒ์š”? ๋ถˆ๊ณผ ๋ช‡ ๋…„ ์ „๋งŒํ•ด๋„, BIG-Bench Hard (BBH) ๋ฐ์ดํ„ฐ์…‹์€ ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์•„์ฃผ ํ›Œ๋ฅญํ•œ ๊ธฐ์ค€์ด์—ˆ๋Š”๋ฐ, ์˜ค๋Š˜๋‚  ํ˜„์žฌ, ์‚ฌ์‹ค์ƒ ์“ธ๋ชจ๊ฐ€ ์—†์–ด์ ธ ๋ฒ„๋ ธ์Šต๋‹ˆ๋‹ค. GPT-4o, Gemini, DeepSeek ๊ฐ™์€ ์ตœ์‹  ๋ชจ๋ธ๋“ค์€ ์ด ํ…Œ์ŠคํŠธ๋ฅผ ๊ฑฐ์˜ ์™„๋ฒฝํ•˜๊ฒŒ ํ†ต๊ณผํ•˜๊ณ  ์žˆ๊ณ , ํ•œ ๋•Œ ๋ฌด์„œ์šด ํ˜ธ๋ž‘์ด ๊ฐ™์•˜๋˜ ์„ ์ƒ๋‹˜(?)์„ ํ˜•์‹์ , ์š”์‹์  ์ ˆ์ฐจ์— ์ง€๋‚˜์ง€ ์•Š๋Š”, ์ข…์ด ํ˜ธ๋ž‘์ด๋กœ ๋งŒ๋“ค์–ด ๋ฒ„๋ ธ์ฃ . ๊ทธ๋ž˜์„œ ์—ฐ๊ตฌ์ž๋“ค์ด AI ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ทนํ•œ๊นŒ์ง€ ์‹œํ—˜ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์„ค๊ณ„ํ•œ โ€˜BIG-Bench Extra Hard (BBEH)โ€™๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋„์ž…ํ–ˆ์ฃ .

์ฃผ์š” SOTA ๋ชจ๋ธ๋“ค์˜ BBEH ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ - ํ˜„์žฌ ๊ฒฐ๊ณผ๊ฒ ์ฃ .

๊ทธ๋ ‡์ง€๋งŒ, ๊ณผ๊ฑฐ์˜ ์‚ฌ๋ก€๋ฅผ ๋ณผ ๋•Œ, BBEH ์—ญ์‹œ ์šฐ๋ฆฌ๊ฐ€ ์˜ˆ์ƒํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋นจ๋ฆฌ โ€˜ํ•ด๊ฒฐโ€™๋  ๊ฒ๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ, ๊ทธ ๋‹ค์Œ์€ ๋ญ˜๊นŒ์š”?

์ด๋Ÿฐ โ€˜๋ฒค์น˜๋งˆํฌ ํฌํ™” ์ฃผ๊ธฐโ€™ - ์ •ํ™•ํžˆ๋Š” โ€˜์ ์  ๋นจ๋ผ์ง€๋Š” ํฌํ™” ์ฃผ๊ธฐโ€™๊ฒ ์ฃ  - ๊ฐ€ AI์˜ ํ‰๊ฐ€์— ๊ด€๋ จํ•œ ๊ฐ€์žฅ ํฐ ์žฅ์• ๋ฌผ ์ค‘ ํ•˜๋‚˜๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ž๋“ค์ด ์ƒˆ๋กœ์šด ํ…Œ์ŠคํŠธ๋ฅผ ๊ณ ์•ˆํ•  ๋•Œ๋งˆ๋‹ค ๋ชจ๋ธ๋“ค์€ ๋งˆ์น˜ ์ด๋Ÿฐ ์—ฐ๊ตฌ์ž๋“ค์˜ ๋…ธ๋ ฅ์„ โ€˜๋น„์›ƒ๋“ฏ์ด (^.^;)โ€™ ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•˜๋Š”๋ฐ์š”. ๋ฌธ์ œ๋Š”! ์ด ๊ณผ์ •์ด, ๊ฐ€๋”์€ ์ง„์งœ โ€˜์ถ”๋ก โ€™์„ ํ•˜๋Š” ๊ฒƒ๊ณผ๋Š” ๊ฑฐ์˜ ๊ด€๋ จ์ด ์—†๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ์ด๋ฃจ์–ด์ง€๊ธฐ๋„ ํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ๋งŽ์€ AI ๊ธฐ์—…๊ณผ ์Šคํƒ€ํŠธ์—…๋“ค์ด, ๋ฆฌ๋”๋ณด๋“œ์™€ ๋žญํ‚น์—์„œ ์ƒ์œ„๋ฅผ ์ฐจ์ง€ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•˜๊ธฐ๋„ ํ•˜๊ณ , ์ง„์งœ ์ œ๋Œ€๋กœ ๋œ โ€˜์ธ์ง€โ€™ ๋Šฅ๋ ฅ์„ ๋†’์ด๊ธฐ๋ณด๋‹ค ๋ฒค์น˜๋งˆํฌ ํ˜•์‹์— ๋งž๊ฒŒ ์‘๋‹ต์„ ํŒŒ์ธํŠœ๋‹ํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

๊ตฟํ•˜ํŠธ์˜ ๋ฒ•์น™: ํ• ๋‹น๋Ÿ‰์„ ์ฑ„์šฐ๋ ค๋Š” ์ž‘์—…์ž vs. ๊ฐ€์น˜ ์ฐฝ์ถœ์— ๊ธฐ์—ฌํ•˜๋ ค๋Š” ์ž‘์—…์ž

๊ตฟํ•˜ํŠธ์˜ ๋ฒ•์น™ (Goodhartโ€™s Law)์ด๋ผ๋Š”๊ฒŒ ์žˆ์Šต๋‹ˆ๋‹ค. 1975๋…„ ์˜๊ตญ ๊ฒฝ์ œํ•™์ž ์ฐฐ์Šค ๊ตฟํ•˜ํŠธ๊ฐ€ ํ†ตํ™” ์ •์ฑ…์˜ ๋ถ„์„ ๊ณผ์ •์—์„œ ์ฒ˜์Œ ์ด์•ผ๊ธฐํ•œ ๊ฐœ๋…์ธ๋ฐ์š”, โ€œ์ธก์ •์น˜๊ฐ€ ๋ชฉํ‘œ๊ฐ€ ๋˜๋ฉด, ์ด๋ฏธ ์˜ฌ๋ฐ”๋ฅธ ์ธก์ •์€ ๋ถˆ๊ฐ€๋Šฅํ•ด์ง„๋‹คโ€๋Š” ๊ฑฐ์˜ˆ์š”. ๋‚˜์ค‘์— ์ธ๋ฅ˜ํ•™์ž์ธ ๋งˆ๋ฆด๋ฆฐ ์ŠคํŠธ๋ž˜์„ ์ด ์ด๊ฑธ โ€œ์ฒ™๋„๊ฐ€ ๋ชฉํ‘œ๊ฐ€ ๋˜๋Š” ์ˆœ๊ฐ„, ๋” ์ด์ƒ ์ข‹์€ ์ฒ™๋„๊ฐ€ ์•„๋‹ˆ๋‹คโ€๋ผ๊ณ  ๋ณ€ํ˜•ํ•˜๋ฉด์„œ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์— ์“ฐ์ด๊ฒŒ ๋˜์—ˆ๋Š”๋ฐ์š”. ์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ โ€˜AI ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ๊ฐœ์„  ๋ฐฉ๋ฒ•โ€™ ์ด์Šˆ๋„ ๊ตฟํ•˜ํŠธ์˜ ๋ฒ•์น™์ด ์ ์šฉ๋œ ์ „ํ˜•์ ์ธ ์‚ฌ๋ก€๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค - ์ธก์ • ์ง€ํ‘œ๊ฐ€ ๋ชฉํ‘œ๊ฐ€ ๋˜๋ฉด, ๊ทธ๊ฑด ๋” ์ด์ƒ ์ข‹์€ ์ธก์ • ์ง€ํ‘œ๊ฐ€ ์•„๋‹ˆ๊ฒŒ ๋˜๋Š” ๊ฒ๋‹ˆ๋‹ค.

โ€˜๋ฒค์น˜๋งˆํฌ์˜ ํฌํ™”โ€™ ๋ฌธ์ œ ๋ฟ์ด ์•„๋‹™๋‹ˆ๋‹ค - ๋” ํฐ ๋ฌธ์ œ๊ฐ€ ์žˆ์–ด์š”. ์šฐ๋ฆฌ๋Š” โ€˜์ž˜๋ชป๋œ ๊ฒƒ๋“ค์„ ์ธก์ •โ€™ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋Œ€๋ถ€๋ถ„์˜ ์ถ”๋ก  ๋ฒค์น˜๋งˆํฌ๋Š”, ๋ช…ํ™•ํ•œ ์ •๋‹ต๊ณผ ์˜ค๋‹ต์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— โ€˜์ˆ˜ํ•™โ€™์ด๋ผ๋“ ๊ฐ€ โ€˜์ฝ”๋”ฉโ€™ ๊ณผ์ œ๋ฅผ ์ƒ๋Œ€์ ์œผ๋กœ ๋งŽ์ด ์„ ํ˜ธํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋Œ€์ˆ˜ (Algebra) ๋ฌธ์ œ๋ฅผ ํ’€ ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ด์„œ AI๊ฐ€ ์‹ค์ œ ์„ธ์ƒ์˜ ๋ชจํ˜ธํ•œ ์ƒํ™ฉ์„ ํ—ค์ณ๋‚˜๊ฐ€๊ฑฐ๋‚˜, ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์ถ”๋ก ํ•˜๊ฑฐ๋‚˜, ์‚ฌ๋žŒ์ด ๊ฐ€์ง„ ๋™๊ธฐ๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์˜๋ฏธ๋Š” ์•„๋‹ˆ์ฃ . ์™„๋ฒฝํ•œ Python ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์ž‘์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด๋ผ๋„, ๋ฏธ๋ฌ˜ํ•œ ์œค๋ฆฌ์  ๋”œ๋ ˆ๋งˆ์— ๋‹ต์„ ํ•˜๊ฑฐ๋‚˜ ๋Œ€ํ™” ์ค‘์˜ ๋น„๊ผฌ๋Š” ๋ง์„ ํ•ด์„ํ•˜๋Š”๋ฐ๋Š” ์—ฌ์ „ํžˆ ํƒ๋„ ์—†์ด ์‹คํŒจํ•  ์ˆ˜๊ฐ€ ์žˆ์–ด์š”. ์ด๊ฑธ ๋ชจ๋ฅด๋Š”๊ฒŒ ์•„๋‹ˆ์ง€๋งŒ, ์ˆ˜ํ•™, ํ”„๋กœ๊ทธ๋ž˜๋ฐ์€ ์ ์ˆ˜๋ฅผ ๋งค๊ธฐ๊ธฐ ์‰ฝ๊ธฐ ๋•Œ๋ฌธ์— ๊ณ„์†ํ•ด์„œ โ€˜AI ๋ชจ๋ธ์— ๋Œ€ํ•œ ํ‰๊ฐ€โ€™ ์˜์—ญ์„ ์ง€๋ฐฐํ•˜๋ฉด์„œ, ์šฐ๋ฆฌ๋“ค์—๊ฒŒ โ€˜๋ฐœ์ „ ์ƒํ™ฉ์— ๋Œ€ํ•œ ์™œ๊ณก๋œ ์ธ์‹โ€™์„ ์‹ฌ์–ด์ค๋‹ˆ๋‹ค.

๋” ๊ด‘๋ฒ”์œ„ํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋‹ค๋ค„ ๋ณด๋ ค๊ณ  ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ๋งˆ์ €๋„, ๋˜ ๋‹ค๋ฅธ ๋ฌธ์ œ์— ์ง๋ฉดํ•˜๊ฒŒ ๋ผ์š”: ๋ชจ๋ธ๋“ค์ด, ๋ฌธ์ œ๋ฅผ ์ง„์งœ โ€˜์ถ”๋ก โ€™ํ•˜๋Š” ๋Œ€์‹ , โ€˜ํ”ผ์ƒ์ ์ธ ์ง€๋ฆ„๊ธธโ€™์„ ํƒํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. AI๋Š” ์•„์‹œ๋‹ค์‹œํ”ผ โ€˜ํŒจํ„ด ์ธ์‹โ€™์„ ์ž˜ ํ•˜์ž–์•„์š”? ๊ทธ๋ž˜์„œ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ โ€˜๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐโ€™ํ•˜๋Š” ๋Œ€์‹ , ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ๋ถ€ํ„ฐ ํ†ต๊ณ„์ ์ธ ๋‹จ์„œ๋ฅผ ์‹๋ณ„ํ•˜๊ณค ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด๋ณผ๊ป˜์š”. ๋ฒค์น˜๋งˆํฌ๊ฐ€ ํ•ญ์ƒ ๋…ผ๋ฆฌ์  ์ถ”๋ก  ๋ฌธ์ œ๋ฅผ ๋น„์Šทํ•œ ํ˜•์‹์œผ๋กœ ์ œ์‹œํ•˜๊ฒŒ ๋˜๋ฉด, ๋ชจ๋ธ์ด ์‹ค์ œ๋กœ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋Œ€์‹ , ํŒจํ„ด์„ ์•”๊ธฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ โ€˜๋Šฅ๋ ฅ์— ๋Œ€ํ•œ ํ™˜์ƒ (Illusion of Competence)โ€™์ด, ์šฐ๋ฆฌ๊ฐ€ ์•„๋Š” ์ตœ๊ณ ์˜ ๋ชจ๋ธ์ด ๋‚ฏ์„  ์‹ค์ œ ์„ธ์ƒ์˜ ๋„์ „ ๊ณผ์ œ์— ์ง๋ฉดํ–ˆ์„ ๋•Œ ์—ฌ์ง€์—†์ด ์‹ค์ˆ˜ํ•˜๊ฒŒ ๋˜๋Š” ์ด์œ  ์ค‘์— ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ, โ€˜๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„โ€™, โ€˜ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์˜ ๋ฌธ์ œโ€™๋Š” ์—ฐ๊ตฌ์‹ค์—๋งŒ ๋จธ๋ฌด๋ฅด์ง€ ์•Š๊ณ  ํ˜„์‹ค ์„ธ๊ณ„๋กœ ํ™•์žฅ๋  ์ˆ˜ ๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค. AI ๋ชจ๋ธ์€ ์ด๋ฏธ ์˜๋ฃŒ, ๋ฒ•๋ฅ  ๋ถ„์„, ๊ณ ๊ฐ ์„œ๋น„์Šค ๋“ฑ โ€˜์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์ค‘์š”ํ•œ ํ•ต์‹ฌ์ ์ธ ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜โ€™๋“ค์— ํ†ตํ•ฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ, ์šฐ๋ฆฌ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๊ฐ€ ์‹ค์ œ ์„ธ์ƒ์—์„œ ์š”๊ตฌํ•˜๋Š” โ€˜์ถ”๋ก  ๋Šฅ๋ ฅโ€™์— ๋Œ€ํ•œ ์š”๊ตฌ๋ฅผ ์ œ๋Œ€๋กœ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฑฐ๋ผ๋ฉด, โ€˜๊ฒ‰์œผ๋กœ๋Š” ์•„์ฃผ ์œ ๋Šฅํ•ด ๋ณด์ด์ง€๋งŒ ์˜ˆ์ธกํ•  ์ˆ˜๋„ ์—†๊ณ  ์‹ค์ œ๋กœ๋Š” ๋น„์šฉ์ด ๋งŽ์ด๋“œ๋Š” ๋ฐฉ์‹์œผ๋กœ ์‹คํŒจํ•˜๋Š”โ€™ ๋ชจ๋ธ์„ ๋ฐฐํฌํ•˜๊ฒŒ ๋  ์œ„ํ—˜์ด ์žˆ๊ฒ ์ฃ . ๋” ๋‚˜์•„๊ฐ€์„œ, ๊ธฐ์—…์˜ ๋ฆฌ๋”๋‚˜ ์ •์ฑ… ์ž…์•ˆ์ž๋“ค์ด, ์˜คํ•ด์˜ ์†Œ์ง€๊ฐ€ ์žˆ๋Š” ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•ด์„œ AI๊ฐ€ ๊ฐ€์ง„ ์ธ์ง€ ๋Šฅ๋ ฅ์„ ๊ณผ๋Œ€ ํ‰๊ฐ€ํ•œ๋‹ค๋ฉด, ์ž๋™ํ™”๋œ ์˜์‚ฌ ๊ฒฐ์ •์— ์ง€๋‚˜์นœ ๋ฏฟ์Œ๊ณผ ๊ถŒ์œ„๋ฅผ ์ค„ ์ˆ˜๋„ ์žˆ๊ฒ ๊ตฌ์š”.

๊ทธ๋ ‡๋‹ค๋ฉด, ์–ด๋–ป๊ฒŒ ๋” ๋‚˜์€ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”? ๊ทธ ๋‹ต์€ ์•„๋งˆ๋„ ๋‹ค์–‘์„ฑ (Diversity), ์ ์‘์„ฑ (Adaptability), ๊ทธ๋ฆฌ๊ณ  ์‹ค์ œ ์„ธ๊ณ„๋ฅผ ๋ชจ์‚ฌํ•˜๋Š” ํ…Œ์ŠคํŠธ (Real-World Test), ์ด ์„ธ ๊ฐ€์ง€ ํ‚ค์›Œ๋“œ์— ์žˆ์ง€ ์•Š์„๊นŒ์š”? ๋น ๋ฅด๊ฒŒ ์“ธ๋ชจ์—†์–ด์ง€๋Š” ๊ณ ์ •๋œ ๋ฐ์ดํ„ฐ์…‹์— ์˜์กดํ•˜์ง€ ๋ง๊ณ , ์•ž์œผ๋กœ AI ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•  ๋•Œ๋Š” โ€˜์ƒˆ๋กญ๊ณ  ๋ณด์ง€ ๋ชปํ•œ ๋ฌธ์ œ๋“ค์ด ์ง€์†์ ์œผ๋กœ ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์— ๋„์ „ํ•˜๋Š”โ€™, ๋‹ค์ด๋‚˜๋ฏนํ•˜๋ฉด์„œ ์ ๋Œ€์ ์ธ (Adversarial) ํ…Œ์ŠคํŠธ๋ฅผ ํฌํ•จํ•ด์•ผ ํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ , ์ˆ˜ํ•™, ์ฝ”๋”ฉ์„ ๋„˜์–ด์„œ ์ƒ์‹์  ์ถ”๋ก , ์ธ๊ณผ์  ์ถ”๋ก , ์œค๋ฆฌ์  ์˜์‚ฌ ๊ฒฐ์ •๋„ ํฌํ•จํ•˜๊ฒŒ๋” ํ™•์žฅ๋˜์–ด์•ผ ํ•˜๊ตฌ์š”. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜๊ฐ€ ์•„๋‹ˆ๋ผ โ€˜์‹ค์ œ ์„ธ๊ณ„์—์„œ์˜ ์„ฑ๋Šฅโ€™์ด ๊ถ๊ทน์ ์ธ ์ง€ํ‘œ๊ฐ€ ๋˜์–ด์•ผ ํ•  ๊ฒ๋‹ˆ๋‹ค - AI๊ฐ€ ์˜์‚ฌ ์„ ์ƒ๋‹˜์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ง€์›ํ•˜๋Š”์ง€, ์ž์œจ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ๊ฐ€์ด๋“œํ•˜๋Š”์ง€, ๋ณต์žกํ•œ ์‚ฌํšŒ์ ์ธ ์ƒํ˜ธ์ž‘์šฉ์„ ์ž˜ ํ•ด๋‚ด๋Š”์ง€ ๋ง์ž…๋‹ˆ๋‹ค.

BBEH๋Š”, ๋ถ„๋ช… โ€˜์˜ฌ๋ฐ”๋ฅธ ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐ€๋Š” ํ•œ ๊ฑธ์Œโ€™์ž…๋‹ˆ๋‹ค. ๊ทธ๋ ‡์ง€๋งŒ ์•ž์œผ๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋งŒ๋“ค์–ด๊ฐ€์•ผ ํ•  ์•„์ฃผ ๊ธด ์ด์•ผ๊ธฐ์˜ ์ƒˆ๋กœ์šด ์ฑ•ํ„ฐ์ผ ๋ฟ์ด๋ผ๋Š” ๊ฒ๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ๊ฑด, โ€˜๋ฒค์น˜๋งˆํฌ๋ฅผ ๋” ์–ด๋ ต๊ฒŒโ€™ ๋งŒ๋“œ๋Š”๊ฒŒ ์•„๋‹ˆ๋ผ, โ€˜๋ชจ๋ธ์ด ์ •๋ง๋กœ ๋˜‘๋˜‘ํ•˜๊ฒŒโ€™ ๋งŒ๋“œ๋Š” ๊ฑฐ๋‹ˆ๊นŒ์š”. AI๊ฐ€ ์ง„์งœ โ€˜์ถ”๋ก โ€™์„ ํ•˜๋Š”์ง€ ํ…Œ์ŠคํŠธํ•˜๋Š” ๋ฐฉ๋ฒ•, ์ œ๋กœ ๋ฒ ์ด์Šค์—์„œ ๋‹ค์‹œ ์žฌ๊ณ ํ•ด ๋ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด, โ€˜์‹œํ—˜์น˜๋Š” ๋Šฅ๋ ฅโ€™์„ โ€˜์ง€๋Šฅโ€™์ด๋ผ๊ณ  ์˜คํ•ดํ•˜๋Š” ๊ธฐ๊ฐ„์ด ๋Š˜์–ด๋‚  ๋ฟ์ž…๋‹ˆ๋‹ค - ์ด๊ฑด ์•„์ฃผ ๋น ์ง€๊ธฐ ์‰ฌ์šธ ๋ฟ ์•„๋‹ˆ๋ผ ์œ„ํ—˜ํ•œ ํ™˜์ƒ์ด๊ตฌ์š”.

AI ์—…๊ณ„ ์ „๋ฌธ๊ฐ€๋“ค์ด ์ถ”์ฒœํ•˜๋Š” ์„œ๋น„์Šค ๐Ÿ‘๐Ÿผ

  • Sesame AI์˜, โ€˜๋ถˆ์พŒํ•œ ๊ณจ์งœ๊ธฐ (Uncanny Valley)โ€™๋ฅผ ๋„˜์–ด์„œ๋Š” ์Œ์„ฑ ์„œ๋น„์Šค (๋ฐ๋ชจ)

๊ธˆ์ฃผ์—๋Š” ์•„์ง ์ƒ์šฉํ™” ์„œ๋น„์Šค๋Š” ์•„๋‹ˆ๊ณ  โ€˜๋ฐ๋ชจโ€™ ์ƒํƒœ์ผ ๋ฟ์ด์ง€๋งŒ, Sesame AI๋ฅผ ์†Œ๊ฐœํ•ด์•ผ ํ•  ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. Personal Companion์ด๋ผ๋Š” ์ด๋ฆ„์œผ๋กœ AI ๊ธฐ๋ฐ˜์˜ ๋Œ€ํ™”ํ˜• ์—์ด์ „ํŠธ, ๊ทธ๋ฆฌ๊ณ  ์ด ์—์ด์ „ํŠธ๊ฐ€ ์ž‘๋™ํ•  ํ•˜๋“œ์›จ์–ด์ธ Lightweight Eyewear๋ฅผ ๋งŒ๋“ค๊ณ  ์žˆ๋Š” ํŒ€์ธ๋ฐ์š”. a16z์˜ ๋งˆํฌ ์•ค๋“œ๋ฆฌ์Šจ, ์ŠคํŒŒํฌ ์บํ”ผํƒˆ, ๋งคํŠธ๋ฆญ์Šค ํŒŒํŠธ๋„ˆ์Šค ๋“ฑ ์Ÿ์Ÿํ•œ VC์™€ ํˆฌ์ž์ž๋“ค์˜ ๋ฐฑ์—…์„ ๋ฐ›๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ํŒ€์—์„œ ์ตœ๊ทผ์— ๋‚ด๋†“์€ ์Œ์„ฑ ๋Œ€ํ™” ์—์ด์ „ํŠธ์˜ ๋ฐ๋ชจ๊ฐ€ ํ™”์ œ์ธ๋ฐ์š”. Ethan Mollick์€ โ€œSesame AI์˜ ์ƒˆ๋กœ์šด ์Œ์„ฑ ์–ด์‹œ์Šคํ„ดํŠธ๋Š” AI๊ฐ€ ๋‚˜์•„๊ฐ€๋Š” ๋ฐฉํ–ฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ฐ•๋ ฅํ•œ ์‚ฌ๋ก€์ด๋‹ค. ๋‚ด ๋ธŒ๋ผ์šฐ์ €์—์„œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ž‘๋™ํ•˜๋Š”๋ฐ, ๋ง์˜ ๋”๋“ฌ๊ฑฐ๋ฆผ, ํœด์ง€ (Pause), ์‹ฌ์ง€์–ด๋Š” ์ˆจ์„ ๋“ค์ด๋งˆ์‹œ๋Š” ์†Œ๋ฆฌ๊นŒ์ง€ ํ›Œ๋ฅญํ•˜๊ฒŒ ํ™œ์šฉํ•ด์„œ, ์ •๋ง ์‚ฌ๋žŒํ•˜๊ณ  ๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ๊ฐ™์€ ๋Š๋‚Œ์„ ์ค€๋‹ค. ๋ฌผ๋ก  ์•„์ง ๋ถ€์ž์—ฐ์Šค๋Ÿฐ ๋ถ€๋ถ„๋“ค์ด ๋‚จ์•„์žˆ์ง€๋งŒ, ์ ์–ด๋„ ์ง€๊ธˆ ์ด ๊ธฐ์ˆ ์ด ์–ด๋””๋กœ ํ–ฅํ•˜๊ณ  ์žˆ๋Š”์ง€ ์ถฉ๋ถ„ํžˆ ๋Š๋‚„ ์ˆ˜ ์žˆ๋‹คโ€๋Š” ํ”ผ๋“œ๋ฐฑ์„ ๋‚จ๊ฒผ์Šต๋‹ˆ๋‹ค.

์ €๋„ Sesame AI์—์„œ ์˜คํ”ˆํ•ด ๋†“์€ ๋ฐ๋ชจ ์ค‘์— Maya์™€ ์ด์•ผ๊ธฐ๋ฅผ ๊ฝค ํ•ด ๋ดค๋Š”๋ฐ์š”. AI ์—์ด์ „ํŠธ๋ผ๋Š” ๊ฑธ ์•Œ ์ˆ˜ ์žˆ๋Š” ํžŒํŠธ๋Š” ์—ฌ๋Ÿฟ ์žˆ์—ˆ์ง€๋งŒ, ์ •๋ง ๋Œ€ํ™” ์ž์ฒด๋Š” ๋„ˆ๋ฌด๋‚˜ ์ž์—ฐ์Šค๋Ÿฌ์›Œ์„œ ๋†€๋ž์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ๋ถ„๋“ค๋„ ํ•œ ๋ฒˆ ์‹œํ—˜ํ•ด ๋ณด์‹œ๊ธฐ๋ฅผ ๊ถŒํ•ฉ๋‹ˆ๋‹ค.

์กฐ์ฝ”๋”ฉ ๋‹˜ ์œ ํŠœ๋ธŒ์—๋„ Sesame AI ์ด์•ผ๊ธฐ๊ฐ€ ์žˆ์œผ๋‹ˆ, ํ•จ๊ป˜ ํ•œ ๋ฒˆ ๋ณด์‹œ๋ฉด ๋” ์ข‹์„ ๋“ฏ ํ•˜๋„ค์š”. Sesame AI ์ด์•ผ๊ธฐ๋Š” 5๋ถ„ 20์ดˆ๋ถ€ํ„ฐ์ž…๋‹ˆ๋‹ค:

  • LLM์˜ ๋‚ด๋ถ€๋ฅผ ๋“ค์—ฌ๋‹ค๋ณผ ์ˆ˜ ์žˆ๋Š” ํ˜„๋ฏธ๊ฒฝ(?)

์ด๊ฑด ๊ฐœ๋ฐœ์ž, ๋˜๋Š” ์•„์ฃผ ๋”ฅํ•˜๊ฒŒ ๊ธฐ์ˆ ์ ์œผ๋กœ ๊ณต๋ถ€ํ•˜์‹œ๋Š” ๋ถ„๋“ค์€ ๊ด€์‹ฌ์ด ์žˆ์œผ์‹ค ๊ฒƒ ๊ฐ™์€๋ฐ์š”. LLM์„ ์ •๋ฐ€ํ•˜๊ฒŒ ํ•ด๋ถ€ํ•˜๋Š” ๋ฉ”์Šค์ฒ˜๋Ÿผ, ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœ๋œ LLM-Microscope์ž…๋‹ˆ๋‹ค: Token Nonlinearity, Memory Depth, Layer Insight, Representation Complexity ๋“ฑ์„ ์‹œ๊ฐ์ ์œผ๋กœ ๋ณด์—ฌ์ค€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ €๋Š” ๊ฐœ์ธ์ ์œผ๋กœ ์•ˆ๋“œ๋ ˆ ์นดํŒŒ์‹œ์˜ ์œ ํŠœ๋ธŒ์—์„œ ๋ณด์—ฌ์ค€ ์ •๋„์˜ ์‹œ๊ฐ์  ์ž๋ฃŒ๊ฐ€ ์ œ ์ˆ˜์ค€์—๋Š” ์ข€ ๋” ๋งž๋‹ค๋Š” ์ƒ๊ฐ์€ ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ^.^;

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

CoT (Chain-of-Thought) ํ”„๋กฌํ”„ํŒ…์€, ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ๋…ผ๋ฆฌ์ ์ธ ๋‹จ๊ณ„๋ณ„ ์ˆœ์„œ๋กœ ๋‚˜๋ˆ ์„œ ํ•ด๊ฒฐํ•˜๋„๋ก ํ•ด์„œ โ€˜AI ๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒโ€™์‹œ์ผœ ์ค๋‹ˆ๋‹ค. ํŠนํžˆ ์ด ๊ธฐ๋ฒ•์€ ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ์ถ”๋ก  ๋ชจ๋ธ์—์„œ ๊ทธ ํšจ๊ณผ๋ฅผ ๊ณ„์† ์ž…์ฆํ•˜๊ณ  ์žˆ๋Š”๋ฐ์š”. ๊ทธ๋ ‡์ง€๋งŒ, CoT๋ฅผ ํ™•์žฅํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๋ชฉ์ ์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์œ ์‚ฌํ•œ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋“ค๋„ ์žˆ์ฃ  - ์˜ค๋Š˜์€ ๊ทธ๋Ÿฐ ๋ฐฉ๋ฒ• 9๊ฐ€์ง€์— ๋Œ€ํ•ด ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค:

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

DeepSeek, โ€˜์˜คํ”ˆ์†Œ์Šคโ€™ ์œ„ํฌ ๊ธฐ๊ฐ„์— ์„ ๋ณด์ธ 6๊ฐ€์ง€ ๋†€๋ผ์šด ๊ฒฐ๊ณผ๋ฌผ

  • DeepSeek์ด ์ด๋ฒˆ ์ฃผ์— ์ž์‚ฌ๊ฐ€ ์ ์šฉํ•œ ์˜คํ”ˆ์†Œ์Šค AI ์ตœ์ ํ™” ๊ธฐ์ˆ  ์—ฌ์„ฏ ๊ฐ€์ง€๋ฅผ ๊ณต๊ฐœํ•˜๋Š” โ€˜์˜คํ”ˆ์†Œ์Šคโ€™ ์œ„ํฌ ๊ธฐ๊ฐ„์„ ๊ฐ€์กŒ์Šต๋‹ˆ๋‹ค. ์ด๋ฏธ ๊นƒํ—ˆ๋ธŒ์—์„œ 11,000๊ฐœ ์ด์ƒ ๋ณ„์„ ๋ฐ›์€, Hopper GPU๋ฅผ ์œ„ํ•œ MLA (Multi-Head Attention)์„ ์ตœ์ ํ™”ํ•œ FlashMLA, MoE์˜ ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ์ƒˆ๋กœ์šด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ DeepEP, DeepGEMM, ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ์ตœ์ ํ™” ์ „๋žต, ๊ณ ์„ฑ๋Šฅ์˜ AI ๋ฐ์ดํ„ฐ ๊ด€๋ฆฌ ์‹œ์Šคํ…œ์ธ Fire-Flyer ํŒŒ์ผ ์‹œ์Šคํ…œ (3FS) ๋“ฑ์„ ์†Œ๊ฐœํ–ˆ๊ตฌ์š”. ๋งˆ์ง€๋ง‰ ๋‚ ์ธ 6์ผ์งธ์—๋Š” DeepSeek-V3/R1 ์ถ”๋ก  ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ์‹ฌ์ธต์ ์ธ ๋ถ„์„ ๋‚ด์šฉ์„ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค.

  • DeepSeek์ด ์ผ์œผํ‚จ ํŒŒ์žฅ์˜ ๋˜ ๋‹ค๋ฅธ ํšจ๊ณผ๋Š” ๋ฐ”๋กœ โ€˜์ฆ๋ฅ˜ (Distillation)โ€™ ๊ธฐ์ˆ ์— ๋Œ€ํ•œ ๊ด€์‹ฌ์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ฆ๋ฅ˜ ๊ธฐ๋ฒ•์ด ๋ฏธ๋””์–ด์˜ ํ—ค๋“œ๋ผ์ธ๊นŒ์ง€ ์žฅ์‹ํ•˜๋Š” ๊ฑธ ๋ณด๋‹ˆ ์žฌ๋ฏธ์žˆ๋„ค์š”. ์ด์ œ AI ๋ชจ๋ธ์˜ ์ตœ์ ํ™” ๊ธฐ์ˆ ๊นŒ์ง€๋„ ๋‚˜๋ฆ„์˜ โ€˜15๋ถ„๊ฐ„์˜ ๋ช…์„ฑโ€™์„ ๋ˆ„๋ฆฌ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ณง โ€˜์ง€์‹ ์ฆ๋ฅ˜ (Knowledge Distillation)โ€™์— ๋Œ€ํ•ด์„œ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์—์„œ๋„ ๋‹ค๋ค„๋ณด๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

์•ค์“ฐ๋กœํ”ฝ์˜ ๋ ˆ๋ฒจ ์—…: ๋” ๋˜‘๋˜‘ํ•œ AI, ๋” ํฐ ํˆฌ์ž, ๊ทธ๋ฆฌ๊ณ  โ€˜ํˆฌ๋ช…์„ฑโ€™์„ ํ–ฅํ•œ ํ•œ ๊ฑธ์Œ

๊ตฌ๊ธ€์˜ AI ํ”Œ๋ ˆ์ด๋ถ: ๋” ์—ด์‹ฌํžˆ ์ผํ•˜๊ณ , ๋” ๋˜‘๋˜‘ํ•˜๊ฒŒ ์ฝ”๋”ฉํ•˜๊ธฐ + AI Co-Scientist

  • ์ง€๊ธˆ ์‹ค๋ฆฌ์ฝ˜ ๋ฐธ๋ฆฌ์—์„œ ํŽผ์ณ์ง€๋Š”, ์ผ์ข…์˜ โ€˜AI ๋ ˆ์ด์Šคโ€™๋Š” ๊ธฐ๊ณ„ ๋ฟ ์•„๋‹ˆ๋ผ ์‚ฌ๋žŒ๋“ค๋„ ํ•œ๊ณ„์— ๋ฐ€์–ด๋ถ™์ด๊ณ  ์žˆ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์ž…๋‹ˆ๋‹ค: ์„ธ๋ฅด๊ฒŒ์ด ๋ธŒ๋ฆฐ์ด ๊ตฌ๊ธ€์˜ Gemini AI ํŒ€์—๊ฒŒ ์ฃผ๋‹น 60์‹œ๊ฐ„ ๊ทผ๋ฌด๋ฅผ ํ•˜๊ธฐ๋ฅผ ์›ํ•˜๋Š”๋ฐ, ์ด๊ฑธ โ€˜์ƒ์‚ฐ์„ฑ์˜ Sweet Spotโ€™์ด๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค๊ณ  ํ•˜๋„ค์š”. ์šฐ๋ฆฌ๋‚˜๋ผ๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ๋ฐ›์•„๋“ค์—ฌ์งˆ๊นŒ์š”?

  • ๋” ๋งŽ์€ ๊ฐœ๋ฐœ์ž ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ์ž๊ธฐ ํŽธ์œผ๋กœ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด์„œ, ๊ตฌ๊ธ€์ด Gemini Code Assistant๋ฅผ ํ†ตํ•ด์„œ ๋ˆ„๊ตฌ๋‚˜ AI ๊ธฐ๋ฐ˜์˜ ์ฝ”๋”ฉ์„ ํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ฌด๋ฃŒ๋กœ ์ œ๊ณตํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋„๊ตฌ๋ฅผ ํ†ตํ•ด์„œ ์›” ์ตœ๋Œ€ 180,000๊ฑด์˜ ์ฝ”๋“œ๊ฐ€ ์™„์„ฑ๋œ๋‹ค๊ณ  ํ•˜๋„ค์š” - ๊ธฐ์กด์˜ ๋„๊ตฌ๋“ค๋ณด๋‹ค๋„ ์—„์ฒญ๋‚˜๊ฒŒ ๋†’์€ ์ˆ˜์น˜ ์•„๋‹Œ๊ฐ€ ํ•ฉ๋‹ˆ๋‹ค. ํ˜„์žฌ VS Code, JetBrains, GitHub์—์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ณ , ๋‹จ์ˆœํžˆ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ ๋ฟ ์•„๋‹ˆ๋ผ Pull Request๋ฅผ ๊ฒ€ํ† ํ•˜๊ฑฐ๋‚˜ ์ปค์Šคํ…€ ์Šคํƒ€์ผ ๊ฐ€์ด๋“œ ๋“ฑ์— ์ ์‘ํ•˜๋ฉด์„œ ์ž‘์—…ํ•  ์ˆ˜๋„ ์žˆ๋‹ค๊ณ  ํ•˜๋„ค์š”.

  • โ€˜์—ฐ๊ตฌ์‹คโ€™์—์„œ ๊ตฌ๊ธ€์˜ ์กด์žฌ๊ฐ๋„ ๋งŒ๋งŒ์น˜ ์•Š์Šต๋‹ˆ๋‹ค. Gemini 2.0 ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋œ ๊ตฌ๊ธ€์˜ AI Co-Scientist๋Š” ๊ณผํ•™์ ์ธ ๊ฐ€์„ค์„ ๋งŒ๋“ค๊ณ  ๋‹ค๋“ฌ์Šต๋‹ˆ๋‹ค - ์ด๋ฏธ ์‹ ์•ฝ๋ฌผ ํ›„๋ณด๋ผ๋“ ๊ฐ€ ์œ ์ „์ž ์ „๋‹ฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๋ฐœ๊ฒฌํ•ด์„œ, ๋ฐ”์ด์˜ค๋ฉ”๋””์ปฌ ์—ฐ๊ตฌ์—์„œ ๋‘๊ฐ์„ ๋‚˜ํƒ€๋‚ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฏธ๋ž˜์—๋Š”, AI๊ฐ€ โ€˜์‚ฌ๋žŒ๋„ AI์ฒ˜๋Ÿผ ํœด์‹๋„ ํ•˜์ง€ ์•Š๊ณ  ๊ณ„์†ํ•ด์„œ ์ผํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•โ€™์„ ์•Œ์•„๋‚ผ ์ˆ˜ ์žˆ์„๊นŒ์š”?

๊ณ„์†ํ•ด์„œ ์ด์–ด์ง€๋Š” โ€˜ํ€€ํ…€ ์ปดํ“จํŒ…โ€™์˜ ์ง„์ „

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ํŒ€์ด ์ฝ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค

๊ฝค ํฅ๋ฏธ๋กญ๊ณ  ์ธ์‚ฌ์ดํŠธ๊ฐ€ ์žˆ๋Š” ๊ธ€์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š”๋ฐ์š”. ์œ„์—์„œ ๋ง์”€๋“œ๋ฆฐ Sesame AI๋ฅผ ์‚ฌ์šฉํ•ด๋ด๋„ ๊ทธ๋ ‡๊ณ , ์ตœ๊ทผ์˜ GPT-4.5๋ฅผ ๋‘˜๋Ÿฌ์‹ผ ๋ฐ˜์‘๋“ค์„ ๋ด๋„ ๊ทธ๋ ‡๊ณ , ์–ด๋Š ์ •๋„ ๋†’์€ ์ˆ˜์ค€์˜ ๋ชจ๋ธ๋“ค์„ ์ตœ์†Œํ•œ โ€˜์“ธ๋งŒํ•œโ€™ ์ˆ˜์ค€์— ๊ณตํ†ต์ ์œผ๋กœ ๋„๋‹ฌํ•ด ์žˆ๋Š” ๊ฒƒ ๊ฐ™๊ณ , ๊ฒฐ๊ตญ์€ ๊ทธ๋ ‡๋‹ค๋ฉด ๋งˆ์ง€๋ง‰ ๋‚จ์€ ๋‹จ๊ณ„๋Š” โ€˜์ž์—ฐ์Šค๋Ÿฌ์šดโ€™, ๋˜๋Š” โ€˜๊ฐœ์„ฑ์žˆ๋Š”โ€™ ์ƒํ˜ธ์ž‘์šฉ์ธ๊ฐ€ ์‹ถ๊ธฐ๋„ ํ•˜๊ฑฐ๋“ ์š”.

์ด โ€˜๊ฐœ์„ฑโ€™์„ ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ โ€˜AI ์—์ด์ „ํŠธโ€™ ์‹œ๋ฆฌ์ฆˆ์˜ ํ•œ ์—ํ”ผ์†Œ๋“œ์—์„œ๋Š” โ€˜Profiling (ํ”„๋กœํŒŒ์ผ๋ง)โ€™์ด๋ผ๊ณ  ๋ถˆ๋ €๋Š”๋ฐ์š”:

์ด ํ”„๋กœํŒŒ์ผ๋ง ์ด๋ผ๋Š” ์šฉ์–ด๊ฐ€ ๊ฐ€์žฅ ์ข‹์€ ์šฉ์–ด์ธ์ง€๋Š” ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ์–ด์จŒ๋“  โ€˜Character Trainingโ€™์ด๋ผ๋Š” ํ‘œํ˜„๋„ ํ”„๋กœํŒŒ์ผ๋ง์˜ ๋ณต์žก์„ฑ์„ ์˜จ์ „ํžˆ ๋‹ด์•„๋‚ด์ง€๋Š” ๋ชปํ•˜์ง€๋งŒ, ํ˜„์žฌ๋กœ์„œ๋Š” ๋” ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ํ‘œํ˜„์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • NeoBERT: A Next-Generation BERT โ€“ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์—…๊ทธ๋ ˆ์ด๋“œ (RoPE, SwiGLU, RMSNorm)ํ•˜๊ณ  ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ํ™•์žฅ, ์–‘๋ฐฉํ–ฅ ์ธ์ฝ”๋”๋ฅผ ํ˜„๋Œ€ํ™”ํ•ด์„œ, BERT-large์™€ RoBERTa-large๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋ฉด์„œ ์ถ”๋ก  ์†๋„๋„ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค.

  • IBM Granite 3.2: Reasoning, Vision, Forecasting, and More โ€“ ํ–ฅ์ƒ๋œ ์ถ”๋ก  ๋Šฅ๋ ฅ, ๋น„์ „-์–ธ์–ด ๋Šฅ๋ ฅ, ์˜ˆ์ธก ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ˜ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์„ ๋„์ž…ํ•ด์„œ, ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ๋” ํฐ ๊ทœ๋ชจ์˜ ๋…์ ์  ๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • Kanana: Compute-Efficient Bilingual Language Models โ€“ ํ•œ๊ตญ์–ด-์˜์–ด ์ด์ค‘ ์–ธ์–ด ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•ด์„œ, ๊ณ„์‚ฐ ๋น„์šฉ์„ ๋‚ฎ์ถ”๋ฉด์„œ๋„ ํ•œ๊ตญ์–ด ๋ฒค์น˜๋งˆํฌ์—์„œ LLaMA 3.1 70B๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์˜ค๋žœ๋งŒ์— ๋ณธ ์นด์นด์˜ค์˜ ๋…ผ๋ฌธ์ด๋ผ ๋ฐ˜๊ฐ‘๋„ค์š”.

  • SoS1: O1 and R1-Like Reasoning LLMs are Sum-of-Square Solvers โ€“ ๊ตฌ์กฐํ™”๋œ ์ถ”๋ก ์ด โ€˜Polynomial Nonnegativityโ€™ ๋ฌธ์ œ์—์„œ LLM์˜ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œ์ผœ์ฃผ๊ณ , ์ตœ์†Œํ•œ์˜ ๊ณ„์‚ฐ์œผ๋กœ๋„ ํ›จ์”ฌ ๋” ํฐ ๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค๋Š” ๊ฑธ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • Conversational Speech Model (CSM) โ€“ ํŠธ๋žœ์Šคํฌ๋จธ๋ฅผ ํ™œ์šฉํ•ด์„œ ํ…์ŠคํŠธ์™€ ์˜ค๋””์˜ค ํ‘œํ˜„ (Representation)์„ ํ†ตํ•ฉํ•˜๊ณ , ์ง€์—ฐ ์‹œ๊ฐ„์„ ์ตœ์ ํ™”ํ•˜๊ณ , ๊ธฐ์กด์˜ ํ…์ŠคํŠธ-์Œ์„ฑ ๋ณ€ํ™˜ ๊ธฐ๋ฒ•์„ ๋„˜์–ด์„œ ๋Œ€ํ™”ํ˜• AI๋ฅผ ๋ฐœ์ „์‹œํ‚ค๋Š”, ํ‘œํ˜„๋ ฅ์ด ์ข‹๊ณ  ๋งฅ๋ฝ๋„ ์ธ์‹ํ•˜๋Š” ์Œ์„ฑ์„ ์ƒ์„ฑํ•˜๋Š” โ€˜End-to-End ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ๋ฒ•โ€™์ž…๋‹ˆ๋‹ค. (์œ„์—์„œ ์ด์•ผ๊ธฐํ•œ Sesame AI์˜ ๋ธ”๋กœ๊ทธ ๊ธ€์ž…๋‹ˆ๋‹ค)

LLM ์ตœ์ ํ™” ๋ฐ ํŠธ๋ ˆ์ด๋‹ ์•ˆ์ •์„ฑ

  • ๐ŸŒŸ SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution โ€“ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ๊ด€๋ จ ์ž‘์—…์—์„œ LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๊ฐ•ํ™”ํ•™์Šต ํ”„๋ ˆ์ž„์›์ธ SWE-RL์„ ์†Œ๊ฐœํ•˜๋Š”๋ฐ, ์ด ๊ธฐ๋ฒ•์˜ ๊ฒฐ๊ณผ๋Š” SFT์˜ ๊ฒฐ๊ณผ๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • Make LoRA Great Again: Boosting LoRA with Adaptive Singular Values and Mixture-of-Experts Optimization Alignment โ€“ ์ ์‘ํ˜• (Adaptive) SVD ์‚ฌ์ „ ๋ถ„ํฌ๋ฅผ ๊ฐ–์ถ˜ ์ตœ์ ํ™”๋œ MoE ํ”„๋ ˆ์ž„์›์„ ์‚ฌ์šฉํ•ด์„œ LoRA์˜ ํšจ์œจ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ๊ธฐ์กด์˜ ํŒŒ์ธํŠœ๋‹ ๋ฐฉ๋ฒ•๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  • The Lottery LLM Hypothesis, Rethinking What Abilities Should LLM Compression Preserve? โ€“ LLM ์••์ถ• (Compression)์€ ๋‹จ์ˆœํ•œ ํ† ํฐ ํšจ์œจ์„ฑ๋ณด๋‹ค ์ถ”๋ก  ๋ฐ ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ๋ณด์กดํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘์–ด์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸ LongRoPE2: Near-Lossless LLM Context Window Scaling โ€“ LLM ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ๋ฅผ 128K ํ† ํฐ๊นŒ์ง€ ํ™•์žฅํ•˜๋ฉด์„œ๋„ ์งง์€ ์ปจํ…์ŠคํŠธ ๊ธ‰์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋Š” ๊ณ ๋„ํ™”๋œ RoPE ๋ฆฌ์Šค์ผ€์ผ๋ง ๊ธฐ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

์ถ”๋ก  (Reasoning) ๋ฐ ๋ฉ€ํ‹ฐ์Šคํ… ๋ฌธ์ œํ•ด๊ฒฐ

  • ๐ŸŒŸ TheoremExplainAgent: Towards Multimodal Explanations for LLM Theorem Understanding โ€“ STEM ๊ด€๋ จ ์ฃผ์ œ์— ๋Œ€ํ•œ โ€˜์›€์ง์ด๋Š” (Animated)โ€™ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ์ปจํ…์ธ ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ์—์ด์ „ํŠธ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค

  • Can Large Language Models Detect Errors in Long Chain-of-Thought Reasoning? โ€“ LLM์ด ๋ฉ€ํ‹ฐ์Šคํ… ์ถ”๋ก  ๊ณผ์ •์—์„œ ์˜ค๋ฅ˜๋ฅผ ๊ฐ์ง€ํ•˜๋Š” ๊ฒƒ์ด ์–ด๋ ต๋‹ค๋Š” ๊ฑธ ๋ณด์—ฌ์ฃผ๋Š” ๋ฐ์ดํ„ฐ์…‹, DeltaBench๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • Self-rewarding Correction for Mathematical Reasoning โ€“ ์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ LLM์˜ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค๋Š”, ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๊ต์ • (Correction) ํ”„๋ ˆ์ž„์›์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.

RAG ๋ฐ ์ •๋ณด ์ฒ˜๋ฆฌ

  • Rank1: Test-Time Compute for Reranking in Information Retrieval โ€“ ํ…Œ์ŠคํŠธ ํƒ€์ž„ ์ปดํ“จํŒ…์„ ํ™œ์šฉํ•ด์„œ ๊ฒ€์ƒ‰์˜ Relevance๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค๋Š” Reranking ๊ธฐ๋ฒ•์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • TeleRAG: Efficient Retrieval-Augmented Generation Inference With Lookahead Retrieval โ€“ LLM์˜ ์ƒ์„ฑ ์ž‘์—… ์ค‘์— ๊ด€๋ จ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฏธ๋ฆฌ ๊ฐ€์ ธ์˜ค๋Š” ๋ฐฉ์‹์œผ๋กœ RAG์˜ ์ถ”๋ก  ์ง€์—ฐ ์‹œ๊ฐ„์„ ์ค„์ด๊ณ , ๊ฒ€์ƒ‰ ํšจ์œจ์„ฑ์„ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸ LettuceDetect: A Hallucination Detection Framework for RAG Applications โ€“ ๋น ๋ฅธ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ๋” ํฐ ๋ชจ๋ธ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋Š” ๊ฒฝ๋Ÿ‰ํ™”๋œ ํ™˜๊ฐ ๊ฐ์ง€ ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค

AI ์—์ด์ „ํŠธ์™€ ๊ณผํ•™์  ์‹คํ—˜ ์ž๋™ํ™”

  • Curie: Toward Rigorous and Automated Scientific Experimentation with AI Agents โ€“ ์ž๋™ํ™”๋œ ๊ฐ€์„ค ๊ฒ€์ฆ, ๊ทธ๋ฆฌ๊ณ  ๊ฒฐ๊ณผ ํ™•์ธ์„ ํ†ตํ•ด์„œ ๋ณด๋‹ค ์—„๊ฒฉํ•˜๊ฒŒ ๊ณผํ•™์  ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ•˜๋Š” AI ์—์ด์ „ํŠธ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

  • ๐ŸŒŸ Project Alexandria: Towards Freeing Scientific Knowledge from Copyright Burdens via LLMs โ€“ ์ €์ž‘๊ถŒ ๋ฌธ์ œ๋ฅผ ํ”ผํ•˜๋ฉด์„œ AI ๊ธฐ๋ฐ˜์˜ ๊ณผํ•™ ์ง€์‹ ์ถ”์ถœ์„ ์œ„ํ•œ ๊ตฌ์กฐํ™”๋œ ๊ธฐ๋ฒ•์œผ๋กœ, โ€˜์ง€์‹ ๋‹จ์œ„(Knowledge Units, KUs)โ€™๋ผ๋Š” ๊ฒƒ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๊ฐ•ํ™”ํ•™์Šต๊ณผ Policy ์ตœ์ ํ™”

๋ณด์•ˆ ๋ฐ AI Alignment

  • Guardians of the Agentic System: Preventing Many-Shots Jailbreak with Agentic System โ€“ ๋ฉ€ํ‹ฐ ์—์ด์ „ํŠธ์˜ Alignment ๊ธฐ์ˆ ์„ ํ†ตํ•ด์„œ AI ํƒˆ์˜ฅ ์‹œ๋„๋ฅผ ๋ฐฉ์ง€ํ•˜๋Š” ๋ณด์•ˆ ํ”„๋ ˆ์ž„์›์„ ๊ฐœ๋ฐœํ•ฉ๋‹ˆ๋‹ค.

  • On Relation-Specific Neurons in Large Language Models โ€“ LLM์—์„œ์˜ โ€˜๊ด€๊ณ„-ํŠนํ™” ๋‰ด๋Ÿฐ (Relation-Specific Neurons)โ€™์„ ์กฐ์‚ฌํ•ด์„œ, ๊ตฌ์กฐํ™”๋œ ์ง€์‹์„ ํšŒ์ƒํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ์˜ ์—ญํ• , ๊ทธ๋ฆฌ๊ณ  ์ž ์žฌ์ ์ธ ๊ฐ„์„ญ ํšจ๊ณผ๋ฅผ ํŒŒ์•…ํ•ฉ๋‹ˆ๋‹ค.

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

Reply

or to participate.