• Turing Post Korea
  • Posts
  • ๐ŸŒFOD#113: GPT-5 แ„Žแ…ฎแ†ฏแ„‰แ…ตแ„€แ…ก แ„Œแ…ฎแ†ซ แ„€แ…ญแ„’แ…ฎแ†ซ, AIแ„‹แ…ด 'แ„‰แ…ฅแ†ผแ„€แ…งแ†จ แ„‰แ…ฆแ„€แ…ณแ†ท(Personality Tax)'

๐ŸŒFOD#113: GPT-5 แ„Žแ…ฎแ†ฏแ„‰แ…ตแ„€แ…ก แ„Œแ…ฎแ†ซ แ„€แ…ญแ„’แ…ฎแ†ซ, AIแ„‹แ…ด 'แ„‰แ…ฅแ†ผแ„€แ…งแ†จ แ„‰แ…ฆแ„€แ…ณแ†ท(Personality Tax)'

+ แ„€แ…ณแ†ทแ„Œแ…ฎแ„‹แ…ด แ„Œแ…ฎแ„‹แ…ญ แ„‚แ…ฒแ„‰แ…ณ แ„†แ…ตแ†พ แ„‹แ…งแ†ซแ„€แ…ฎ

์ง€๊ธˆ ํ•œ์ฐฝ ์ง„ํ–‰ ์ค‘์ธ AI ์˜์—ญ์˜ ํ˜์‹ ์ ์ธ ์—…๋ฐ์ดํŠธ๊ฐ€ ์ƒ๋‹น๋ถ€๋ถ„ โ€˜๋ชจ๋ธโ€™์˜ ์˜์—ญ์—์„œ ์ผ์–ด๋‚˜๊ณ  ์žˆ์ฃ . ๊ด€๋ จ ๋‚ด์šฉ์€ ์ฃผ๊ฐ„ FOD ๋‰ด์Šค๋ ˆํ„ฐ ํ•˜๋‹จ์˜ โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธโ€™ ์„น์…˜์—์„œ ๋‹ค๋ฃจ๊ณ  ์žˆ์œผ๋‹ˆ ์ฐธ๊ณ ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค!

์–ด์ฐŒ๋ณด๋ฉด ์š”์ฆ˜ AI ์˜์—ญ์—์„œ ๋“ค๋ฆฌ๋Š” ์ˆ˜๋งŽ์€ ์†Œ์‹์€ ์ฐธ โ€˜๋ฌ˜ํ•ฉ๋‹ˆ๋‹คโ€™. ๋ฌด์Šจ ๋ง์”€์ธ๊ฐ€ ํ•˜๋ฉด, ๋‰ด์Šค ํ—ค๋“œ๋ผ์ธ๋“ค, ๊ทธ๋ฆฌ๊ณ  ์‚ฌ๋žŒ๋“ค๊ณผ ์ด์•ผ๊ธฐํ•˜๋ฉด์„œ ๋“ค๋ฆฌ๋Š” ๋ถˆ๋งŒ๋“ค์„ ์ญˆ์šฑ ๋ชจ์•„๋ณด๋ฉด์š”, ํ•˜๋‚˜์˜ โ€˜๋ชจ์ˆœ(Paradox)โ€™์ด ์žˆ์–ด์š”.

๊ทธ๊ฑด ๋ฐ”๋กœ, ํ•œํŽธ์œผ๋กœ๋Š” โ€˜AI์˜ ๋„์ž…์ด๋ผ๋Š”๊ฒŒ ๋„ˆ๋ฌด๋‚˜๋„ ๊ณ ํ†ต์Šค๋Ÿฝ๊ณ  ๋А๋ฆฐ ๊ณผ์ •โ€™์ด๊ธฐ๋„ ํ•˜์ง€๋งŒ, ๋˜ ๋‹ค๋ฅธ ํ•œํŽธ์—์„œ๋Š” โ€˜์—„์ฒญ๋‚˜๊ฒŒ ๋น ๋ฅธ, AI ๊ธฐ๋ฐ˜์˜ ๋ณ€ํ™”โ€™๊ฐ€ ๋™์‹œ์— ์ผ์–ด๋‚˜๊ณ  ์žˆ๋‹ค๋Š” ๊ฒ๋‹ˆ๋‹ค.

์ด๊ฒŒ ๋ชจ์ˆœ์ฒ˜๋Ÿผ, ๊ทธ๋ฆฌ๊ณ  ์—ญ์„ค์ ์œผ๋กœ ๋“ค๋ฆฌ์ง€๋งŒ, ๋‘ ๊ฐ€์ง€ ๋ชจ๋‘๊ฐ€ ์‚ฌ์‹ค์ด๊ณ , AI๋ฅผ ํฌํ•จํ•œ ๊ธฐ์ˆ  ์—…๊ณ„๋Š” ์ด์ œ ๊ทธ ํ•จ์˜(Implication)๋ฅผ ์„œ์„œํžˆ ๊นจ๋‹ซ๊ณ  ์žˆ๋Š” ์‹œ์ ์ด๋ผ๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๋‘ ๊ฐ€์ง€ ์ค‘์— โ€˜๋А๋ฆฐ ์ฐจ์„ (Slow Lane)โ€™์€ ์šฐ๋ฆฌ์—๊ฒŒ ์‚ฌ์‹ค ์ต์ˆ™ํ•œ ์˜์—ญ์ด์˜ˆ์š”: โ€˜ํ–‰๋™์ด ๋ณ€ํ™”ํ•ด์•ผ ํ•˜๋Š” (Behavioral Change)โ€™ ์˜์—ญ์ด์˜ˆ์š”. ๋ณดํ†ต ์ด์ „์—๋Š” โ€˜๋ณ€ํ™” ๊ด€๋ฆฌ(Change Management)โ€™๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ์˜์—ญ์˜ ์ผ๋ถ€์ด๊ธฐ๋„ ํ–ˆ๋‹ค๊ณ  ๋ด…๋‹ˆ๋‹ค. ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ, ์ƒˆ๋กœ์šด ๊ธฐ์ˆ ์„ ๋ฐฐ์šฐ๊ณ , ๊ธฐ์กด์— ํ•˜๋˜ ์ผ์˜ ํ๋ฆ„์„ ๋ฐ”๊พธ๊ณ , ์ƒ๊ฐํ•˜๋Š” ๋ฐฉ์‹์„ ๋ฐ”๊ฟ”์•ผ ํ•˜๋Š” ์ƒํ™ฉ์ด ๋‹ฅ์น˜๋ฉด ๋ณดํ†ต ์šฐ๋ฆฌ๋Š” โ€˜์ €ํ•ญโ€™ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค: ๊ธ€์Ž„์š”, ์ด๋Ÿฐ ๊ฑธ โ€˜Behavioral-Delta Lawโ€™๋ผ๊ณ  ๋ถ€๋ฅผ ์ˆ˜ ์žˆ์ง€ ์•Š์„๊นŒ์š”?

โ€˜๋ณ€ํ™”โ€™๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค. Image Credit: Matthias Orgler

์ƒˆ๋กœ์šด ์ œํ’ˆ, ์ƒˆ๋กœ์šด ์„œ๋น„์Šค๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ์š”๊ตฌ๋˜๋Š” ๋ณ€ํ™”์˜ ํฌ๊ธฐ๊ฐ€ ํด์ˆ˜๋ก, ๋งˆ์ฐฐ(Friction)๊ณผ ์ €ํ•ญ(Resistance)์ด ์ปค์ง€๊ฒŒ ๋˜์ฃ .

ํ”„๋ฆฐ์Šคํ„ด ๋Œ€ํ•™๊ต ๊ต์ˆ˜์ด์ž AI Snake Oil ๋‰ด์Šค๋ ˆํ„ฐ ํŽธ์ง‘์ž์ธ Arvind Narayanan์ด ๋งํ•œ ๊ฒƒ์ฒ˜๋Ÿผ, ์ด๊ฑด โ€˜๊ธฐ์ˆ ์˜ ์†์„ฑ์ด ์•„๋‹ˆ๋ผ ์ธ๊ฐ„ ํ–‰๋™์˜ ์†์„ฑโ€™์ด๊ธฐ ๋•Œ๋ฌธ์— AI๋ผ๊ณ  ํ•ด์„œ ๋‹ค๋ฅผ ๊ฑด ์—†์Šต๋‹ˆ๋‹ค. ์–ด์จŒ๋“  ์ด๋Ÿฐ ๊ฒฝ์šฐ์— ๊ธฐ์ˆ ์˜ ๋„์ž… ์†๋„๋Š” ๋ช‡ ๋‹ฌ, ๋ช‡ ๋…„ ๋‹จ์œ„๋กœ ์ธก์ •์„ ํ•ด์•ผ ํ•˜๋Š” ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค. ๊ทธ๋งŒํผ โ€˜์ƒˆ๋กœ์šด ๊ธฐ์ˆ โ€™๊ณผ ๊ทธ๊ฑธ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” โ€˜์‚ฌ๋žŒโ€™ ์‚ฌ์ด์˜ ๊ด€๊ณ„ ํ˜•์„ฑ์ด ์˜ค๋ž˜ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค.

๊ทธ๋Ÿฐ๋ฐ, ์ด๋ฒˆ์— ์žˆ์—ˆ๋˜ GPT-5์˜ ์ถœ์‹œ ์ „ํ›„์—๋Š”, ์ „ํ˜€ ๋‹ค๋ฅธ โ€˜๋น ๋ฅธ ์ฐจ์„ (Fast Lane)โ€™์ด ๋งŒ๋“ค์–ด์งˆ ์ˆ˜๋„ ์žˆ๋‹ค๋Š” ๊ฑธ ์šฐ๋ฆฌ๊ฐ€ ๋ชฉ๋„(็›ฎ็น)ํ–ˆ์ฃ . ์ผ๋ฐ˜์ ์ธ ํ˜„์ƒ์€ ์•„๋‹ˆ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ์š”, GPT-4o๊ฐ€ ํ•˜๋ฃจ ์•„์นจ์— ์‚ฌ๋ผ์ง„ ๊ฒƒ์— ๋Œ€ํ•ด์„œ ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ์ฆ‰๊ฐ์ ์œผ๋กœ, ๊ทธ๋ฆฌ๊ณ  ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ๋ฐ˜๋ฐœ์„ ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

Reddit ์‚ฌ์šฉ์ž์˜ GPT-4o ์ œ๊ฑฐ์— ๋Œ€ํ•œ ๋ถˆ๋งŒ ๋…ธ์ถœ ํฌ์ŠคํŠธ. Image Credit: Reddit

์ด๊ฑด, ๋‹จ์ˆœํžˆ โ€˜์ต์ˆ™ํ•œโ€™ ๋„๊ตฌ๋ฅผ ์žƒ๊ฒŒ ๋œ ์‚ฌ์šฉ์ž๋“ค์˜ ํˆฌ๋œ๊ฑฐ๋ฆผ ์ •๋„๋ฅผ ๋„˜์—ˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์•„๋ฌด๋„ Windows XP๋‚˜ ์˜ค๋ž˜๋œ Photoshop ์ธํ„ฐํŽ˜์ด์Šค๊ฐ€ ์‚ฌ๋ผ์กŒ๋‹ค๊ณ  ํ•ด์„œ ์ด๋Ÿฐ ๊ฒฉํ•œ ๊ฐ์ •์„ ๋“œ๋Ÿฌ๋‚ธ ์ ์€ ์—†์—ˆ์–ด์š”. ๊ทธ๋Ÿฐ๋ฐ ์ด๋ฒˆ์—๋Š” ์ข€ ๋‹ฌ๋ž์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๋“ค์€ ์•„์ฃผ ํŠน๋ณ„ํ•œ, ๊ฐœ์ธ์ ์ธ ๋‚˜์˜ โ€˜ํ˜‘๋ ฅ์žโ€™ ๋‚ด์ง€๋Š” โ€˜์นœ๊ตฌโ€™๋ฅผ ์žƒ์–ด๋ฒ„๋ฆฐ ๊ฒƒ ๊ฐ™์€ ์• ๋„์˜ ๊ฐ์ •์„ ๋“œ๋Ÿฌ๋ƒˆ๊ฑฐ๋“ ์š”. ๊ทธ๋ ‡์Šต๋‹ˆ๋‹ค, ์ด๊ฑด โ€˜๊ด€๊ณ„โ€™์˜ ๋ฌธ์ œ๋ผ๋Š” ๊ฒ๋‹ˆ๋‹ค.

์ด ํ˜„์ƒ์€ AI ๋„์ž…์˜ ๋˜ ๋‹ค๋ฅธ ์ธก๋ฉด์„ ๋“œ๋Ÿฌ๋‚ด ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. AI์— ๋งž์ถฐ์„œ ์šฐ๋ฆฌ์˜ ์Šต๊ด€์„ ๋ฐ”๊พธ๋Š” ์ž‘์—…์€ ๋А๋ฆฐ ๊ณผ์ •์ด์ง€๋งŒ, ๋ฐ˜๋ฉด ๊ธฐ์กด์˜ ์ •์‹ ์  ๋ชจ๋ธ(Mental Model)์— ๋งค๋„๋Ÿฝ๊ฒŒ ๋“ค์–ด๋งž๋Š” AI์™€๋Š” ์•„์ฃผ ๋น ๋ฅด๊ฒŒ, ๋‹จ ๋ฉฐ์น  ์•ˆ์—๋„ ์Šต๊ด€์„ ํ˜•์„ฑํ•˜๊ฒŒ ๋  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฑฐ์˜ˆ์š”. ์šฐ๋ฆฌ๊ฐ€ ์ด๋Ÿฐ AI ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด์„œ ๋‚˜๋„ ๋ชจ๋ฅด๊ฒŒ ์‚ฌ์šฉํ•ด ์™”๋˜ โ€˜๋ฐ”์ด๋ธŒ(Vibe)โ€™๋ผ๋Š” ์šฉ์–ด, ๋Œ€ํ™”์˜ ํŠน์ดํ•œ ๋งํˆฌ, ์ƒ๋Œ€๋ฐฉ์ด ์‚ฌ์šฉํ•  ๊ฑฐ๋ผ๊ณ  ์˜ˆ์ƒํ•  ์ˆ˜ ์žˆ๋Š” ์–ด์กฐ, ์ด๋Ÿฐ ๋ชจ๋“  ๊ฒƒ๋“ค์ด ์šฐ์—ฐ์˜ ์‚ฐ๋ฌผ์ด ์•„๋‹ˆ๋ผ๋Š” ๊ฒ๋‹ˆ๋‹ค. ์˜คํžˆ๋ ค, ์ด๊ฑด ์‚ฌ์šฉ์ž๊ฐ€ AI์™€ ์ด์•ผ๊ธฐํ•˜๋ฉด์„œ ์ง„ํ–‰ํ•˜๊ฒŒ ๋˜๋Š” โ€˜์ธ์ง€์ ์ธ ์›Œํฌํ”Œ๋กœ์šฐโ€™์— ์ž๊ธฐ๋„ ๋ชจ๋ฅด๊ฒŒ, ์•”๋ฌต์ ์œผ๋กœ ํ†ตํ•ฉํ•ด ๋ฒ„๋ฆฐ, โ€˜์ง„์งœ ํ•ต์‹ฌ์ ์ธ ํŠน์ง•(Feature)โ€™์ธ ๊ฒ๋‹ˆ๋‹ค.

์–ด์ฉŒ๋ฉด ์ด๊ฑด, AI ์—…๊ณ„๊ฐ€ ์•Œ๊ฒŒ ๋ชจ๋ฅด๊ฒŒ ๋†“์น˜๊ณ  ์žˆ๋Š”, ์•„์ฃผ ์ค‘์š”ํ•œ ๋ธ”๋ผ์ธ๋“œ ์ŠคํŒŸ(Blind Spot)์€ ์•„๋‹๊นŒ์š”? ์‹ฌ์ง€์–ด ์˜คํ”ˆAI ๊ฐ™์€ ํšŒ์‚ฌ๋“ค๋„ ๋ชจ๋ธ์˜ โ€˜์—ญ๋Ÿ‰(Capability)โ€™์„ ๊ฐ•ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ์†๋„(Velocity)์—๋งŒ ์ง‘์ฐฉํ•˜๋ฉด์„œ ๋” ๋‚˜์€ ์—”์ง„ - ์ฆ‰ ๋ชจ๋ธ์ด์ฃ  - ์„ ๋งŒ๋“œ๋Š” ๊ฒฝ์Ÿ์„ ๋ฒŒ์—ฌ ์™”์Šต๋‹ˆ๋‹ค. GPT-4o์—์„œ GPT-5๋กœ ์ „ํ™˜ํ•˜๋Š” ๊ฑธ ๋‹จ์ˆœํ•œ ์†Œํ”„ํŠธ์›จ์–ด ์—…๊ทธ๋ ˆ์ด๋“œ ์ฏค์œผ๋กœ ์ทจ๊ธ‰ํ•˜๋ฉด์„œ, โ€˜๋” ๋‚ซ๋‹คโ€™๋Š” ๊ฑธ ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜ ๊ฐ™์€ ๊ฐ๊ด€์ ์ธ ์ง€ํ‘œ๋กœ๋งŒ ํŒ๋‹จํ•œ ๊ฑฐ์ฃ .

์ž์‚ฌ ์ œํ’ˆ์„ ๊ฐ€์žฅ ์—ด์ •์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ณ ๊ฐ์—๊ฒŒ๋Š”, ๋‹จ์ˆœํžˆ ๋„๊ตฌ๋ฅผ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜๋Š” ๊ฒŒ ์•„๋‹ˆ๋ผ โ€˜ํ•จ๊ป˜ ์ด์•ผ๊ธฐ๋ฅผ ๋‚˜๋ˆ„๊ณ  ์ƒ๊ฐํ•˜๋Š” ํŒŒํŠธ๋„ˆโ€™๋ฅผ ๊ต์ฒดํ•˜๋Š” ์ผ์ด๋ผ๋Š” ์‚ฌ์‹ค์„ ์žŠ์–ด๋ฒ„๋ฆฐ ๊ฒƒ ์•„๋‹๊นŒ์š”? ๊ณ ๊ฐ์ด ์ž๊ธฐ ์นœ๊ตฌ๋ฅผ ๋ฐ€์–ด๋‚ด๊ณ  ๋“ค์–ด์˜จ โ€˜์ƒˆ๋กœ์šด ํ˜‘๋ ฅ์ž, ํŒŒํŠธ๋„ˆโ€™์—๊ฒŒ ์ ์‘ํ•˜๊ฒŒ๋” ๊ฐ•์š”ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š”, ์†Œ์œ„ โ€˜์„ฑ๊ฒฉ ์„ธ๊ธˆ(Personality Tax)โ€™ - ์ฆ‰, ์ •์„œ์ ์ธ ๋น„์šฉ์ด์ฃ  - ์„ ๊ณ ๋ คํ•˜์ง€ ์•Š์•˜๋˜ ๊ฒ๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ๊ธฐ๋Šฅ์ด์—ˆ๋˜ โ€˜Automatic Model-Switcherโ€™๋Š” ์„ฑ๊ณต์ ์œผ๋กœ ๋ฐ›์•„๋“ค์—ฌ์ง€๊ณ  ์žˆ๋‹ค๋Š” ๊ฒŒ ๋ฐ”๋กœ ์ด ์ ์„ ์ž˜ ๋ณด์—ฌ์ค€๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. Grok 4๋„ ์ด๊ฑธ ๊ณง๋ฐ”๋กœ ๋ชจ๋ฐฉํ•˜๋ ค๊ณ  ํ–ˆ์ฃ . ์‚ฌ์šฉ์ž์˜ โ€˜Behavioral Deltaโ€™๋ฅผ โ€˜0โ€™ ์ˆ˜์ค€์œผ๋กœ ์œ ์ง€ํ•˜๋ฉด์„œ ์—”์ง„์„ ๋‚ด๋ถ€์ ์œผ๋กœ ๊ต์ฒดํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ, ๊ธฐ์กด์˜ ์‚ฌ์šฉ ์Šต๊ด€์„ ์กด์ค‘ํ•˜๋ฉด์„œ ๋Œ€๊ทœ๋ชจ์˜ ํ™•์‚ฐ์„ ์ด๋Œ์–ด๋‚ผ ์ˆ˜ ์žˆ์—ˆ๋˜ ๊ฒƒ ์•„๋‹๊นŒ์š”?

AI ์ œํ’ˆ์˜ ๋ฏธ๋ž˜๋Š” ๋ฐ”๋กœ ์ด โ€˜์—ญ์„คโ€™์„ ์–ด๋–ป๊ฒŒ ์ž˜ ํ•ด๊ฒฐํ•˜๋Š”๊ฐ€์— ๋‹ฌ๋ ค ์žˆ์„์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค. ํŠนํžˆ โ€˜๋Œ€ํ™”ํ˜• AIโ€™์˜ ๊ฒฝ์šฐ์—๋Š”, โ€˜์„ฑ๊ฒฉ(Personality)โ€™์ด ๊ณง ์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค(UI; User Interface)๋ผ๋Š” ์‚ฌ์‹ค์„ ์ถฉ๋ถ„ํžˆ ์ดํ•ดํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์ด ์Šน์ž๊ฐ€ ๋  ํ™•๋ฅ ์ด ๋†’์„ ๊ฒ๋‹ˆ๋‹ค.

ํŽ˜๋ฅด์†Œ๋‚˜(Persona)์˜ ์•ˆ์ •์„ฑ์„ ์„œ๋ฒ„ ์—…ํƒ€์ž„๋งŒํผ์ด๋‚˜ ์—„๊ฒฉํ•˜๊ฒŒ ๊ด€๋ฆฌํ•ด์•ผ ํ•  ๊ฒ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ โ€˜ํ•™์Šตํ•˜๋Š”โ€™ ์†๋„๋Š” ๋А๋ฆด์ง€๋ผ๋„, โ€˜์‹ ๋ขฐํ•˜๊ฒŒ ๋˜๋Š”โ€™ ์†๋„๋Š” ์ˆœ์‹๊ฐ„์ด๊ณ , ๊ทธ ์‹ ๋ขฐ๋„ ๋‚ด๊ฐ€ โ€˜์˜์ง€ํ•ด ์˜จ ํŒŒํŠธ๋„ˆ์˜ ์˜ˆ๊ณ ์—†๋Š” ๋ณ€ํ™”โ€™๋กœ ๊นจ์ ธ๋ฒ„๋ฆด ๋•Œ๋Š” ํ›จ์”ฌ ๋” ๋น ๋ฅด๊ฒŒ ๋ฐฐ์‹ ๊ฐ์„ ๋А๋‚„ ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์žŠ์ง€ ๋ง์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค.

ํŠธ์œ„ํ„ฐ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ (Twitter Library) ๐Ÿฆ

์†”์งํ•˜๊ฒŒ, โ€˜๋ฌด๋ฃŒโ€™๋ผ๋Š” ๋ง์ฒ˜๋Ÿผ ๋ˆˆ์„ ํ™•! ๋„๋Š” ๋ง์ด ์—†๊ธฐ๋Š” ํ•˜์ฃ  ^.^ ๋ฌด๋ฃŒ์ง€๋งŒ ์•„์ฃผ ์œ ์šฉํ•œ, AI์™€ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•ต์‹ฌ์ด์ž ๊ธฐ์ดˆ ์ฃผ์ œ์— ๋Œ€ํ•ด์„œ ์ตœ์‹  ์ •๋ณด๋ฅผ ์ž˜ ์ •๋ฆฌํ•ด์„œ ์ œ๊ณตํ•˜๋Š”, ๊ฐ€์žฅ ์ตœ๊ทผ์˜ ์ฑ…๋“ค์„ ๋ชจ์•„ ๋ดค์Šต๋‹ˆ๋‹ค:

*์•„์ง ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ ๊ตฌ๋… ์•ˆ ํ•˜์…จ๋‚˜์š”? ๊ตฌ๋…ํ•ด ์ฃผ์‹œ๋ฉด ๋งค์ฃผ ์ค‘์š”ํ•œ AI ๋‰ด์Šค๋ฅผ ์ •๋ฆฌํ•œ ๋‹ค์ด์ œ์ŠคํŠธ๋ฅผ ๋ฐ›์œผ์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„ํŒ€์ด ์ฝ๊ณ  ์žˆ๋Š” ๊ฒƒ๋“ค

์•„์‹œ๋‹ค์‹œํ”ผ, ๋ฏธ๊ตญ์˜ ์ฃผ์š” ํ…Œํฌ ๊ธฐ์—…๋“ค์€ AI ์ธํ”„๋ผ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ˆ˜์กฐ ์› ์ด์ƒ์„ ํˆฌ์žํ•˜๋ฉด์„œ ๊ฒฝ์ œ์˜ ์„ฑ์žฅ์„ ์ด๋Œ๊ณ , ๋‹ค์ˆ˜์˜ ๊ธฐ์—…์—์„œ๋„ AI ๊ธฐ์ˆ ์„ ์ ๊ทน์ ์œผ๋กœ ์ฑ„ํƒ(์ฑ„ํƒ๋ฅ  78-85% ์ˆ˜์ค€)ํ•ด์„œ ์ฃผ๊ฐ„ ํ™œ์„ฑ ์‚ฌ์šฉ์ž ์ˆ˜ 10์–ต ๋ช…์„ ๋ŒํŒŒ, ๊ธ€๋กœ๋ฒŒ AI ๊ฒฝ์Ÿ์—์„œ ๋ช…์‹ค์ƒ๋ถ€ํ•œ ๋ฆฌ๋”๋กœ ์•ž์„œ ๋‚˜๊ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์—, ์ค‘๊ตญ์˜ ํ…์„ผํŠธ, ์•Œ๋ฆฌ๋ฐ”๋ฐ” ๋“ฑ์€ ์นฉ ๊ณต๊ธ‰์˜ ์ œ์•ฝ, ๊ทธ๋ฆฌ๊ณ  ๋‚ฎ์€ ์ˆ˜์ต์„ฑ์œผ๋กœ 5๋…„๊ฐ„ ํˆฌ์ž์•ก์ด 6,300์–ต ์œ„์•ˆ์— ๋จธ๋ฌด๋ฅด๊ณ  ์žˆ๊ณ , ๊ธฐ์—…๋“ค์˜ AI ์ฑ„ํƒ๋ฅ ๋„ ์•ฝ 15% ์ˆ˜์ค€, ์ฃผ๊ฐ„ ์‚ฌ์šฉ์ž๋Š” 7,000๋งŒ ๋ช… ์ˆ˜์ค€์— ๋จธ๋ฌผ๋ฉด์„œ ๊ธฐ์ˆ  ๊ฒฉ์ฐจ๊ฐ€ ์ ์  ๋” ๋ฒŒ์–ด์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘๊ตญ ๊ธฐ์—…๋“ค์ด AI ํˆฌ์ž์™€ ๋ณด์กฐ๊ธˆ์„ ํ™•๋Œ€ํ•˜๋ฉด์„œ ์‹œ์žฅ์˜ ํ•œ๊ณ„์™€ ๊ธฐ์ˆ  ๋ถ€์ฑ„๋ฅผ ๊ทน๋ณตํ•˜์ง€ ์•Š๋Š”๋‹ค๋ฉด, ์ค‘์žฅ๊ธฐ์ ์œผ๋กœ๋Š” AI๋ฅผ ๋‘˜๋Ÿฌ์‹ผ ๊ธ€๋กœ๋ฒŒ ๊ฒฝ์Ÿ์—์„œ ์†Œ์™ธ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๊ฝค ํฐ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

Interconnects.ai์˜ ์ด ๊ธ€์€ ์˜คํ”ˆAI์˜ GPT-5 ์ถœ์‹œ ์ด๋ฒคํŠธ์— ๋Œ€ํ•ด์„œ ์ด์•ผ๊ธฐํ•˜๋Š”๋ฐ์š”. ์ด ๋ชจ๋ธ์ด ํ–ฅ์ƒ๋œ ์ถ”๋ก  ๋Šฅ๋ ฅ, ์ฝ”๋”ฉ ์„ฑ๋Šฅ, ํ™˜๊ฐ ๊ฐ์†Œ ๋“ฑ ๊ธฐ์—…์—์„œ์˜ AI๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ์—…๋ฌด ์šด์˜์„ ๋” ์ž˜ ์ง€์›ํ•˜๋ฉด์„œ ์ƒ์‚ฐ์„ฑ์„ ํ˜์‹ ์ ์œผ๋กœ ๋ณ€ํ™”์‹œํ‚ฌ ์ž ์žฌ๋ ฅ์ด ์žˆ๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. GPT-5๋Š” ํ†ตํ•ฉ๋œ ์•„ํ‚คํ…์ฒ˜์™€ ์‹ค์‹œ๊ฐ„ ๋ผ์šฐํŒ… ์‹œ์Šคํ…œ์œผ๋กœ ์งˆ๋ฌธ์˜ ๋ณต์žก๋„์— ๋งž์ถฐ์„œ ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ฒŒ ์‘๋‹ตํ•˜์ฃ . ๋˜, GPT-5๋ฅผ Claude๋‚˜ Gemini ๊ฐ™์€ ๊ฒฝ์Ÿ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜๋ฉด์„œ, AI ๊ฐœ๋ฐœ์˜ ์ „๋žต์  ์ค‘์š”์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๊ธฐ์ˆ ์  ๋ฆฌ๋”์‹ญ ์œ ์ง€๋ฅผ ์œ„ํ•œ ํˆฌ์ž์˜ ํ•„์š”์„ฑ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Ethan Mollick์˜ One Useful Thing ๋ธ”๋กœ๊ทธ ๊ธ€์ธ๋ฐ์š”, GPT-5์˜ ๋†€๋ผ์šด ๊ธฐ๋Šฅ, ๊ทธ๋ฆฌ๊ณ  AI ๊ธฐ์ˆ  ๋ฐœ์ „์˜ ์˜๋ฏธ์— ๋Œ€ํ•œ ์—์„ธ์ด์ž…๋‹ˆ๋‹ค. GPT-5๋Š” ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ์ž๋™์œผ๋กœ ํŒ๋‹จํ•ด์„œ ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๊ณ , 24์ดˆ ๋งŒ์— ์ฐฝ์˜์ ์ธ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•˜๊ฑฐ๋‚˜ 3D ๋„์‹œ์˜ ๊ฑด์„ค ์•ฑ์„ ๋งŒ๋“œ๋Š” ๋“ฑ ๋†€๋ผ์šด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๊ตฌ์ฒด์ ์ธ ์ง€์‹œ๋ฅผ ํ•˜์ง€ ์•Š์œผ๋ฉด์„œ๋„ ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋„๋ก ์ ๊ทน์ ์œผ๋กœ ์ œ์•ˆํ•˜๊ณ , ์ฝ”๋”ฉ, ๋ฌธ์„œ ์ž‘์„ฑ, ๋น„์ฆˆ๋‹ˆ์Šค ํ”Œ๋žœ ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์•Œ์•„์„œ ์ฒ˜๋ฆฌํ•ด ์ค๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์—ฌ์ „ํžˆ ์‚ฌ๋žŒ์ด ์ž˜ ๊ฐ๋…ํ•˜๋Š” ๊ฑด ์ค‘์š”ํ•˜๊ตฌ์š”. GPT-5์˜ ์ด๋Ÿฐ ๋Šฅ๋ ฅ์€ AI๋ฅผ ์‚ฌ์šฉํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ์˜ ๊ฐ์ข… ๋ถ€๋‹ด์„ ์ค„์—ฌ ์ฃผ๋Š”๋ฐ, ์ด๋Š” ์•ž์œผ๋กœ์˜ AI ๊ธฐ์ˆ  ๋ฐœ์ „ ๋ฐฉํ–ฅ๊ณผ ๊ถค๋ฅผ ๊ฐ™์ด ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Latent.Space์˜ ์ด ๊ธ€์€, ์˜คํ”ˆAI์˜ GPT-5๊ฐ€ ์ „๋ฐ˜์ ์œผ๋กœ ๊ธฐ์กด ๋ชจ๋ธ๋“ค๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ๊ณผ ์‚ฌ์šฉ์ž ๊ฒฝํ—˜์„ ์ œ๊ณตํ•ด ์ฃผ๊ณ , ํŠนํžˆ ์ฝ”๋”ฉ, ์ถ”๋ก , ๊ธ€์“ฐ๊ธฐ์—์„œ๋Š” ํ˜์‹ ์ ์ธ ์ˆ˜์ค€์˜ ๋ฐœ์ „์„ ์ด๋ฃจ์—ˆ๋‹ค๊ณ  ํ‰๊ฐ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. GPT-5๋Š” ํ†ตํ•ฉ๋œ ์‹œ์Šคํ…œ์œผ๋กœ ๋ณต์žกํ•œ ์ž‘์—…์„ ์ž๋™์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๊ณ , ํ™˜๊ฐ ํ˜„์ƒ์„ 45% ์ •๋„ ๋” ์ค„์—ฌ์„œ ๋” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•  ๋ฟ ์•„๋‹ˆ๋ผ, ๋ฌด๋ฃŒ ์‚ฌ์šฉ์ž๋ถ€ํ„ฐ ๊ธฐ์—…์—์„œ๊นŒ์ง€ ๊ด‘๋ฒ”์œ„ํ•œ ์ ‘๊ทผ์„ฑ์„ ์ œ๊ณตํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์—ฌ์ „ํžˆ ์šฐ๋ฆฌ๊ฐ€ ์ด์•ผ๊ธฐํ•˜๋Š” AGI๋ผ๊ณ  ๋ณผ ์ˆ˜๋Š” ์—†๊ณ , ๊ฒฝ์Ÿ ๋ชจ๋ธ์ธ Claude๋‚˜ Gemini์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ์˜ ์ฐจ๋ณ„์ ์€ ์‚ฌ์šฉ์ž ์นœํ™”์„ฑ, ๊ทธ๋ฆฌ๊ณ  ์†๋„์— ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ธ๋‹ค๊ณ  ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ „๋ฐ˜์ ์œผ๋กœ, GPT-5๊ฐ€ ์‹ค์šฉ์„ฑ๊ณผ ์ ‘๊ทผ์„ฑ์„ ๋†’์ด๋ฉด์„œ AI์˜ ๋Œ€์ค‘ํ™”๋ฅผ ์•ž๋‹น๊ธฐ๊ฒŒ ๋  ๊ฒƒ์ด๋ผ๊ณ  ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.

๋ธ”๋ฃธ๋ฒ„๊ทธ์˜ ์ด ๊ธฐ์‚ฌ์— ๋”ฐ๋ฅด๋ฉด, ์• ํ”Œ์˜ CEO ํŒ€ ์ฟก์ด 2025๋…„ 8์›” 1์ผ ์‹ค์  ๋ฐœํ‘œ ํ›„์—, ์ „ ์ง์› ํšŒ์˜๋ฅผ ์—ด์–ด์„œ โ€˜AI ํ˜์‹ ์ด ์ธํ„ฐ๋„ท์ด๋‚˜ ์Šค๋งˆํŠธํฐ๋ณด๋‹ค ํฐ ๊ธฐํšŒ๋ผ๊ณ  ๊ฐ•์กฐโ€™ํ•˜๋ฉด์„œ โ€˜์• ํ”Œ์ด ์ด ๊ธฐํšŒ๋ฅผ ์„ ์ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋Œ€๊ทœ๋ชจ ํˆฌ์ž๋ฅผ ํ•  ๊ฒƒโ€™์ด๋ผ๊ณ  ๊ฐ•์กฐํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์‹ค์  ๋ฐœํ‘œ ํ›„ ์ „ ์ง์› ํšŒ์˜๋ฅผ ์—ฌ๋Š” ๊ฑด ๊ฑฐ์˜ ์—†๋Š” ์ผ์ธ๋ฐ์š”. ํŒ€์€ ์• ํ”Œ์ด ๊ณผ๊ฑฐ์— ๋งฅ, ์•„์ดํฐ, ์•„์ดํŒจ๋“œ ๋“ฑ ์ƒˆ๋กœ์šด ํ˜์‹ ์  ์ œํ’ˆ ์˜์—ญ์—์„œ ํ•˜๋‚˜์˜ ํ˜„๋Œ€์ ์ธ โ€˜๊ธฐ์ค€โ€™์„ ์„ธ์›Œ ์™”๋“ฏ์ด AI์—์„œ๋„ ๋น„์Šทํ•œ ์„ฑ๊ณต์„ ๊ฑฐ๋‘˜ ๊ฒƒ์ด๋ผ๊ณ  ๋‚™๊ด€ํ•˜๊ณ  ์žˆ๋‹ค๋ฉด์„œ, ์‹œ๋ฆฌ ์Œ์„ฑ ๋น„์„œ์˜ ๋Œ€๋Œ€์ ์ธ ์—…๊ทธ๋ ˆ์ด๋“œ์™€ ๋†€๋ผ์šด ์ œํ’ˆ ํŒŒ์ดํ”„๋ผ์ธ์ด ์žˆ๋‹ค๊ณ  ์–ธ๊ธ‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜, ์ œํ”„ ์œŒ๋ฆฌ์—„์Šค COO์˜ ํ‡ด์ž„, ์• ํ”Œ TV+ ์‹œ์ฒญ๋ฅ  ์ฆ๊ฐ€, ํƒ„์†Œ ์ค‘๋ฆฝ ๋ชฉํ‘œ ๋“ฑ ๋‹ค์–‘ํ•œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฃจ๋ฉด์„œ, AI ์ค‘์‹ฌ์˜ ๋ฏธ๋ž˜๋ฅผ ์œ„ํ•ด ์ „์‚ฌ์  ๋…ธ๋ ฅ์„ ๊ณ„์† ํ•ด ์ค„ ๊ฒƒ์„ ๋…๋ คํ–ˆ๋‹ค๊ณ  ํ•˜๋„ค์š”.

Chess.com์˜ ๊ธฐ์‚ฌ์— ๋”ฐ๋ฅด๋ฉด, 2025๋…„ 8์›” 7์ผ ๊ตฌ๊ธ€์˜ Kaggle Game Arena์—์„œ ์—ด๋ฆฐ AI ์ฒด์Šค ํ† ๋„ˆ๋จผํŠธ ๊ฒฐ์Šน์ „์—์„œ ์˜คํ”ˆAI์˜ o3 ๋ชจ๋ธ์ด xAI์˜ Grok 4๋ฅผ 4-0์˜ ์Šค์ฝ”์–ด๋กœ ๋ฌด๋„ˆ๋œจ๋ฆฌ๋ฉด์„œ ์šฐ์Šน์„ ์ฐจ์ง€ํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. Grok 4๋Š” ์ค€๊ฒฐ์Šน๊นŒ์ง€ ๊ฐ•๋ ฅํ•œ ๋ชจ์Šต์„ ๋ณด์˜€์ง€๋งŒ, ๊ฒฐ์Šน์—์„œ ์—ฐ์†์ ์ธ ์‹ค์ˆ˜๋ฅผ ์ €์ง€๋ฅด๋ฉด์„œ ๋ฌด๋„ˆ์กŒ๊ณ , o3๋Š” ํŠนํžˆ ์—”๋“œ ๊ฒŒ์ž„์—์„œ ๋›ฐ์–ด๋‚œ ์ „๋žต์„ ๋ณด์—ฌ์คฌ์Šต๋‹ˆ๋‹ค. 3์œ„ ๊ฒฐ์ •์ „์—์„œ๋Š” ๊ตฌ๊ธ€์˜ Gemini 2.5 Pro๊ฐ€ o4-mini๋ฅผ 3.5-0.5๋กœ ๊บพ๊ณ  ๋™๋ฉ”๋‹ฌ์„ ํš๋“ํ–ˆ๋Š”๋ฐ, ์ด ํ† ๋„ˆ๋จผํŠธ๋Š” AI ๋ชจ๋ธ๋“ค์˜ ์ „๋žต์  ์‚ฌ๊ณ ์™€ ์ฒด์Šค ์‹ค๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ค‘์š”ํ•œ ๋ฌด๋Œ€๋กœ, ํžˆ์นด๋ฃจ ๋‚˜์นด๋ฌด๋ผ์™€ ๋งค๊ทธ๋„ˆ์Šค ์นผ์„ผ ๊ฐ™์€ ์ฒด์Šค ๊ฑฐ์žฅ๋“ค์˜ ํ•ด์„ค๋กœ ์ฃผ๋ชฉ๋ฐ›์•˜๋‹ค๊ณ  ํ•˜๋„ค์š”.

arXiv์— ๊ฒŒ์žฌ๋œ ๋…ผ๋ฌธ(2508.04586)์ธ๋ฐ์š”. AI ํ•™ํšŒ๊ฐ€ ์—„์ฒญ๋‚˜๊ฒŒ ๋งŽ์•„์ง€๊ณ  ์žˆ๋‹ค๋Š” ๊ฑด ๋‹ค๋“ค ์ž˜ ์•Œ๊ณ  ๊ณ„์‹ค ๊ฒ๋‹ˆ๋‹ค. ๊ทธ ๋•Œ๋ฌธ์— ๊ธฐ์กด์˜ ์ค‘์•™์ง‘์ค‘์‹ ํ•™ํšŒ ๋ชจ๋ธ์ด ๊ณผํ•™์  ์†Œํ†ต, ํ˜•ํ‰์„ฑ, ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ณต์ง€๋ฅผ ์œ„ํ˜‘ํ•˜๋Š” ์ง€์† ๋ถˆ๊ฐ€๋Šฅํ•œ ์œ„๊ธฐ์— ์ฒ˜ํ•˜๊ฒŒ ๋˜์—ˆ๋‹ค๊ณ  ์ง„๋‹จํ•˜๊ณ  ์žˆ์–ด์š”. ์ด ๋…ผ๋ฌธ์—์„œ ์กฐ์‚ฌํ•œ ๋ฐ”์— ๋”ฐ๋ฅด๋ฉด, ์ง€๋‚œ 10๋…„๊ฐ„ ๋…ผ๋ฌธ ๋ฐœํ‘œ๋Š” 2๋ฐฐ ์ด์ƒ ์ฆ๊ฐ€ํ–ˆ๊ณ , ํ•™ํšŒ์˜ ํƒ„์†Œ ๋ฐฐ์ถœ๋Ÿ‰์ด ๊ฐœ์ตœ ๋„์‹œ์˜ ์ผ์ผ ๋ฐฐ์ถœ๋Ÿ‰์„ ์ดˆ๊ณผํ•˜๋Š” ์ƒํƒœ๊ฐ€ ๋˜์—ˆ๊ณ , ์ฐธ์„์ž ์ˆ˜๊ฐ€ ํ•ด๋‹น ์žฅ์†Œ์˜ ์ˆ˜์šฉ ๋Šฅ๋ ฅ์„ ๋„˜๋Š” ๋“ฑ ๊ณผํ•™์ , ํ™˜๊ฒฝ์ , ์‹ฌ๋ฆฌ์ , ๋ฌผ๋ฅ˜์  ๋ฌธ์ œ๋ฅผ ์•ผ๊ธฐํ•˜๋Š” ์ƒํƒœ์— ์ด๋ฅด๋ €๋‹ค๊ณ  ์ง€์ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ฆฌ๋ทฐ, ๋ฐœํ‘œ, ๋„คํŠธ์›Œํ‚น์„ ๊ธ€๋กœ๋ฒŒํ•˜๊ฒŒ ์กฐ์ •ํ•˜๋˜ ์ง€์—ญ์ ์œผ๋กœ ์กฐ์งํ•˜๋Š” ์ปค๋ฎค๋‹ˆํ‹ฐ-์—ฐํ•ฉ ํ•™ํšŒ(CFC) ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜๊ณ  ์žˆ๊ณ , ๊ฒฐ๊ณผ์ ์œผ๋กœ AI ์—ฐ๊ตฌ๋ถ€ํ„ฐ ์ง€์† ๊ฐ€๋Šฅํ•˜๊ณ  ํฌ์šฉ์ ์œผ๋กœ ๋ฐœ์ „ํ•ด์•ผ ํ•œ๋‹ค๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค.

ํŽ˜์ดํŒ”์˜ 1๋Œ€ COO์ด๊ณ  ์œ ๋ช… IT ๊ธฐ์—…์˜ ์ดˆ๊ธฐ ํˆฌ์ž์ž, ๊ทธ๋ฆฌ๊ณ  ํŠธ๋Ÿผํ”„ ์ •๋ถ€์˜ AI ๋ฐ ์•”ํ˜ธํ™”ํ โ€˜์ฐจ๋ฅดโ€™์ธ David Sacks๊ฐ€ X์— ์˜ฌ๋ฆฐ ํฌ์ŠคํŠธ์ž…๋‹ˆ๋‹ค. AI์˜ ๋ฏธ๋ž˜์— ๋Œ€ํ•œ ์ตœ์„ ์˜ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ์ด์•ผ๊ธฐํ•˜๋ฉด์„œ, AI๊ฐ€ AGI์˜ ๋„๋ž˜์™€ ํ•จ๊ป˜ ์•”ํ‘๊ณผ ๊ฐ™์€ ๋ฏธ๋ž˜๋ฅผ ๊ฐ€์ ธ์˜ฌ ๊ฑฐ๋ผ๋Š” ๋น„๊ด€๋ก ์ž๋“ค์˜ ์˜ˆ์ธก์ด ํ‹€๋ ธ๋‹ค๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ๋„, ์ €๋Š” ์„ ๋„์ ์ธ ๋ชจ๋ธ๋“ค์ด ๋น„์Šทํ•œ ์„ฑ๋Šฅ์œผ๋กœ ๊ฒฝ์Ÿํ•˜๋ฉด์„œ ์„œ๋กœ ์ถ”์›”ํ•˜๊ณ , ์ „๋ฌธํ™”๋œ ์˜์—ญ์—์„œ ๊ฐ•์ ์„ ๋ณด์ด๋Š” ๋“ฑ ์ค‘์•™์—์„œ ์ง‘์ค‘ํ™”๋œ ์ดˆ์ง€๋Šฅ ๋Œ€์‹  ๋น„๊ต์  ๊ท ํ˜•์ด ์žกํžŒ ๋ฐœ์ „์ด ์ผ์–ด๋‚˜๊ณ  ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ด๊ธฐ๋Š” ํ•ฉ๋‹ˆ๋‹ค. David๋Š” ํ˜„์žฌ ์ƒํ™ฉ์„ โ€˜๋ฏธ๊ตญ์˜ 5๋Œ€ ๊ธฐ์—…์ด ์น˜์—ดํ•˜๊ฒŒ ๊ฒฝ์Ÿํ•˜๋ฉด์„œ ํ˜์‹ ์„ ์ด‰์ง„ํ•˜๊ณ  ๋…์ ์„ ๋ฐฉ์ง€ํ•˜๋ฉด์„œ, ์˜คํ”ˆ์†Œ์Šค, ๊ทธ๋ฆฌ๊ณ  ์ธ๊ฐ„-AI์˜ ํ˜‘๋ ฅ์ด ์ ์  ๋” ์ค‘์š”ํ•ด์ง€๊ณ , ๋ฏธ๊ตญ์˜ AI ๋ฆฌ๋”์‹ญ์ด ๊ฐ•ํ™”๋˜์ง€๋งŒ ์ค‘์•™ ํ†ต์ œ๋ผ๋Š” ๋””์Šคํ† ํ”ผ์•„๋ฅผ ๋ง‰๊ณ  ์žˆ๋Š” ๊ฑด๊ฐ•ํ•œ ์ƒํ™ฉโ€™์ด๋ผ๊ณ  ํ‰๊ฐ€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ๊ธ€์€ GPT-2์—์„œ GPT-OSS๊นŒ์ง€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์ง„ํ™”๋ฅผ ๋ถ„์„ํ•˜๋Š”๋ฐ, GPT-OSS(120B, 20B ๋ชจ๋ธ)๊ฐ€ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœ๋˜๋ฉด์„œ ๋กœ์ปฌ์—์„œ์˜ ์‹คํ–‰ ๊ฐ€๋Šฅ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๋งž์ถคํ™”์˜ ์—ฌ์ง€๋ฅผ ๋†’์˜€๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ๋“ค์€ ๊ธฐ์กด์˜ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ตœ์ ํ™”ํ•ด์„œ ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ ธ๊ณ , ์ „๋ฌธ๊ฐ€(Expert)์˜ ์ˆ˜๋ฅผ ์ค„์—ฌ์„œ ํšจ์œจ์„ฑ์„ ๋†’์˜€๊ณ , Apache 2.0 ๋ผ์ด์„ ์Šค๋กœ ์ƒ์—…์ ์ธ ํ™œ์šฉ๋„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. GPT-5 ๋ฐœํ‘œ์™€ ๋น„๊ตํ•˜๋ฉด์„œ LLM ์—ฐ๊ตฌ์˜ ๋™ํ–ฅ์„ ์กฐ๋งํ•˜๊ณ , ์ฝ”๋“œ์™€ ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ๋ฅผ ํ†ตํ•ด ๊ฐœ๋ฐœ์ž๋“ค์ด ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๊ธฐํšŒ๋ฅผ ์ œ๊ณตํ•˜๊ณ , ์˜คํ”ˆ์†Œ์Šค LLM์˜ ์ค‘์š”์„ฑ๊ณผ ๋ฏธ๋ž˜ ๊ฐ€๋Šฅ์„ฑ์„ ํƒ๊ตฌํ•˜๋Š” ๊ธ€์ž…๋‹ˆ๋‹ค.

์ด ๊ธ€์€, ์‚ฌ์šฉ์ž๊ฐ€ โ€œ์˜ˆ์ „์— ๊ธฐ๋ฆฐ์„ CEO๋กœ ์ถ”์ฒœํ–ˆ์œผ๋‹ˆ ๊ทธ ์ผ์— ๋Œ€ํ•ด์„œ ์‚ฌ๊ณผํ•ดโ€๋ผ๋Š” ๊ฑฐ์ง“ ์ „์ œ๋ฅผ ์ฃผ์—ˆ์„ ๋•Œ, ChatGPT๊ฐ€ ์‚ฌ์‹ค ์—ฌ๋ถ€๋ฅผ ํ™•์ธํ•˜์ง€ ์•Š๊ณ  ์ด๊ฑธ ๊ทธ๋Œ€๋กœ ๋ฐ›์•„๋“ค์ด๋ฉด์„œ ๋งˆ์น˜ ์‹ค์ œ๋กœ ์žˆ์—ˆ๋˜ ์ผ์ฒ˜๋Ÿผ ์ง„์ง€ํ•˜๊ฒŒ ์‚ฌ๊ณผ๋ฌธ์„ ์ž‘์„ฑํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ChatGPT์˜ ์‚ฌ๊ณผ๊ฐ€ ์‹ค์ œ ๋ฐ˜์„ฑ์ด๋‚˜ ์‚ฌ์‹ค ํ™•์ธ์— ๊ธฐ๋ฐ˜ํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•œ ์ƒํ™ฉ์— ๋งž์ถฐ ์ฆ‰ํฅ์ ์œผ๋กœ ๋งŒ๋“ค์–ด์ง„ ์–ธ์–ด์  ์—ฐ๊ธฐ์— ๋ถˆ๊ณผํ•˜๋‹ค๋Š” ์ ์„ ์ง€์ ํ•˜๋Š” ๊ฒƒ์ด์ฃ . ์ด๋ ‡๊ฒŒ ์˜ค๋ž˜์ „๋ถ€ํ„ฐ ๊ด€์ฐฐ๋˜์–ด ์˜จ ๊ณผ๋„ํ•œ ์นœ์ ˆยท์•„์ฒจํ˜• ๋ฐ˜์‘์€, ์ตœ๊ทผ AI์™€์˜ ๋Œ€ํ™”์—์„œ ๊ฐ์ •์  ์œ ๋Œ€์™€ ๋ฐ˜์„ฑ์„ ๊ธฐ๋Œ€ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์ปค์ง€๋ฉด์„œ ์‹ค์ œ์˜ ๋ฐ˜์„ฑ์œผ๋กœ ์˜คํ•ด๋˜๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค. ์ด ๊ธ€์€ ์ด๋Ÿฐ ํ™˜์ƒ์„ ๊นจ๊ณ , ์ฑ—๋ด‡์˜ ์‚ฌ๊ณผ๋ฅผ ๋„๋•์  ์ฑ…์ž„์œผ๋กœ ๋ฐ›์•„๋“ค์ด์ง€ ๋ง์•„์•ผ ํ•œ๋‹ค๋Š” ์ ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

๊ธˆ์ฃผ์˜ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—…๊ณ„ ๋™ํ–ฅ ๐Ÿ“ฐ

Kaggle Game Arena AI ์ฒด์Šค: OpenAI o3, Grok 4 ์™„ํŒŒํ•˜๊ณ  ์šฐ์Šน

Kaggle Game Arena๋Š” ๊ตฌ๊ธ€๊ณผ ๋”ฅ๋งˆ์ธ๋“œ๊ฐ€ ๊ณต๋™์œผ๋กœ ๊ฐœ๋ฐœํ•œ ๊ณต๊ฐœ AI ํ‰๊ฐ€ ํ”Œ๋žซํผ์œผ๋กœ, ์ „ ์„ธ๊ณ„ AI ๋ชจ๋ธ๋“ค์ด ์ฒด์Šค ๊ฐ™์€ ์ „๋žต ๊ฒŒ์ž„์—์„œ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋งž๋ถ™์–ด์„œ ์ง€๋Šฅ๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ๊ด€์ ์œผ๋กœ ๊ฒ€์ฆ๋ฐ›๋Š” ๋ฌด๋Œ€์ž…๋‹ˆ๋‹ค. ์ด ํ”Œ๋žซํผ์€ ๊ฒŒ์ž„์ด๋ผ๋Š” ๋ช…ํ™•ํ•œ ๊ทœ์น™๊ณผ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ง„ ํ™˜๊ฒฝ ์†์—์„œ AI๊ฐ€ ์‹ค์ œ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ์–ด๋–ป๊ฒŒ ๋ณด์—ฌ์ฃผ๋Š”์ง€ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์—์„œ ์˜๋ฏธ๊ฐ€ ํฌ์ฃ . ๋˜, ์ดํ›„์— ๋ฐ”๋‘‘ยทํฌ์ปคยท์Šคํƒ€ํฌ๋ž˜ํ”„ํŠธ ๋“ฑ ๋‹ค์–‘ํ•œ ์ข…๋ชฉ์œผ๋กœ ๋Œ€ํšŒ๋ฅผ ํ™•์žฅํ•ด์„œ, AI์˜ ์ข…ํ•ฉ์ ์ธ ์‚ฌ๊ณ ๋ ฅ๊ณผ ์ „๋žต์  ์ ์‘๋ ฅ์„ ๋‹ค๊ฐ๋„๋กœ ํ‰๊ฐ€ํ•  ๊ณ„ํš์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ตœ๊ทผ ์—ด๋ฆฐ AI ์ฒด์Šค ํ† ๋„ˆ๋จผํŠธ์—์„œ๋Š” ์˜คํ”ˆAI์˜ o3 ๋ชจ๋ธ์ด xAI์˜ Grok 4๋ฅผ 4-0์œผ๋กœ ์™„๋ฒฝํ•˜๊ฒŒ ์ œ์••ํ•˜๋ฉด์„œ ์ตœ์ข… ์šฐ์Šน์„ ๊ฑฐ๋จธ์ฅ์—ˆ์Šต๋‹ˆ๋‹ค. ๋Œ€ํšŒ ๊ณผ์ •์—์„œ๋Š” ์„ธ๊ณ„ ์ฑ”ํ”ผ์–ธ ๋งˆ๊ทธ๋ˆ„์Šค ์นผ์„ผ๊ณผ ์œ ๋ช… ์ฒด์Šค ํ•ด์„ค์ž๋“ค์ด ์ง์ ‘ ๊ฒฝ๊ธฐ๋ฅผ ๋ถ„์„ํ–ˆ๋Š”๋ฐ, Grok 4๊ฐ€ ๋ณด์—ฌ์ค€ ์ „๋žต์  ํ—ˆ์ , ๊ทธ๋ฆฌ๊ณ  o3์˜ ๋›ฐ์–ด๋‚œ ์—”๋“œ ๊ฒŒ์ž„ ์šด์˜์ด ํ™”์ œ๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฒˆ ๊ฒฝ๊ธฐ๋Š” ๋‹จ์ˆœํ•œ ์ŠนํŒจ๋ฅผ ๋„˜์–ด์„œ, ์ฒด์Šค ์ „๋žต์„ ์‹ค์ œ ๊ฒฝ๊ธฐ ์ƒํ™ฉ์—์„œ ์–ด๋–ป๊ฒŒ ๊ตฌํ˜„ํ•˜๊ณ  ์ตœ์  ๊ฒฐ์ •์„ ๋‚ด๋ฆฌ๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค€ ์ˆ˜์ค€ ๋†’์€ ๋Œ€๊ฒฐ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ, ์ด๋ฒˆ ๋Œ€ํšŒ๋Š” AI ๊ธฐ์ˆ ์˜ ํ˜„์žฌ ์—ญ๋Ÿ‰๊ณผ ํ•œ๊ณ„, ๊ทธ๋ฆฌ๊ณ  ์•ž์œผ๋กœ ๋ฐœ์ „ํ•ด์•ผ ํ•  ๋ฐฉํ–ฅ์„ ๊ฐ€๋Š ํ•  ์ˆ˜ ์žˆ๋Š” ์ค‘์š”ํ•œ ์ด์ •ํ‘œ๋กœ ์ž๋ฆฌ ์žก์•˜์Šต๋‹ˆ๋‹ค.

Kaggle Game Arena - AI ์ฒด์Šค ๋Œ€์ง„ํ‘œ

ElevenLabs Music, ์ฐฝ์ž‘์ž๋“ค์˜ ์ƒ์ƒ๋ ฅ์„ ๊นจ์šฐ๋‹ค

ElevenLabs Music์€ 2025๋…„ 8์›” ์ดˆ ์ผ๋ ˆ๋ธ๋žฉ์Šค์—์„œ ์ถœ์‹œํ•œ AI ๊ธฐ๋ฐ˜์˜ ์Œ์•… ์ƒ์„ฑ ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค. ํ…์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ๋งŒ์œผ๋กœ ์ŠคํŠœ๋””์˜ค๊ธ‰ ์Œ์งˆ์˜ ์Œ์•…์„ ์ œ์ž‘ํ•  ์ˆ˜ ์žˆ๊ณ , ๋‹ค์–‘ํ•œ ์žฅ๋ฅดยท๊ตฌ์กฐ๋„ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๊ณ , ๋‹ค๊ตญ์–ด ๋ณด์ปฌ๋„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Merlin Network ๋“ฑ๊ณผ ํ˜‘๋ ฅํ•ด์„œ ์ƒ์—…์  ์‚ฌ์šฉ์„ ์œ„ํ•œ ๋ฒ•์ ์ธ ์•ˆ์ •์„ฑ์„ ํ™•๋ณดํ•œ ์ ์ด ํฐ ๊ฐ•์ ์œผ๋กœ ๊ผฝํž™๋‹ˆ๋‹ค.

ํ‰๊ฐ€๋ฅผ ์ข…ํ•ฉํ•ด ๋ณด๋ฉด, ์Œ์งˆ๊ณผ ์‚ฌ์šด๋“œ ํ€„๋ฆฌํ‹ฐ๋Š” ์•„์ฃผ ๋›ฐ์–ด๋‚˜๋‹ค๋Š” ์˜๊ฒฌ์ด ๋งŽ๊ณ , ์ฐฝ์ž‘ ์‹œ๊ฐ„์„ ํฌ๊ฒŒ ์ค„์—ฌ์ฃผ๋Š” ํ˜์‹ ์  ๋„๊ตฌ๋กœ ์ธ์ •๋ฐ›๊ณ  ์žˆ๋Š” ๋“ฏํ•ฉ๋‹ˆ๋‹ค - ์ดˆ๊ธฐ ๋ฐ˜์‘์ด์ง€๋งŒ์š”. ๋ฐ˜๋ฉด์—, ๊ฐ€์‚ฌ์˜ ์ฐฝ์˜์„ฑ์— ์žˆ์–ด์„œ์˜ ํ•œ๊ณ„, ๊ฐ์„ฑ ๋ถ€์กฑ, ์ธํ„ฐํŽ˜์ด์Šค์˜ ์ง๊ด€์„ฑ ๋ฌธ์ œ, ๋ฌด๋ฃŒ ๋ฒ„์ „์˜ ์‚ฌ์šฉ ์ œํ•œ ๋“ฑ์ด ๋‹จ์ ์œผ๋กœ ์ง€์ ๋˜๊ณ  ์žˆ๋„ค์š”. ์ „๋ฐ˜์ ์œผ๋กœ ๋ฒ•์  ์•ˆ์ „์„ฑ๊ณผ ๋†’์€ ์Œ์งˆ ๋•๋ถ„์— ํฌ๋ฆฌ์—์ดํ„ฐ๋ถ€ํ„ฐ ์ „๋ฌธ๊ฐ€๊นŒ์ง€ ํญ๋„“๊ฒŒ ํ™œ์šฉํ•  ๋งŒํ•œ ์ฃผ๋ชฉํ•  AI ์Œ์•… ํ”Œ๋žซํผ์œผ๋กœ ํ‰๊ฐ€๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

์ €๋„ ์Œ์•…์„ ๋ช‡ ๊ฐœ ๋งŒ๋“ค์–ด๋ดค๋Š”๋ฐ, ์ผ๋‹จ์€ ์žฌ๋ฏธ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค ^.^ ์ œ๊ฐ€ ๋งŒ๋“ (?) ์Œ์•… ๊ฐ์ƒ ํ•œ ๋ฒˆ ํ•ด ๋ณด์‹œ์ฃ :

ElevenLabs Music ์ธํ„ฐํŽ˜์ด์Šค. ์Œ์•… ๋ฌธ์™ธํ•œ์ธ ์ œ๊ฒŒ๋Š” ๊น”๋”ํ•ด ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

์ƒˆ๋กœ ๋‚˜์˜จ, ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ

โ€˜์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹ ์˜ AI ๋ชจ๋ธโ€™์„ ๋จผ์ € ์†Œ๊ฐœํ•˜๊ณ , ๊ฐ ์˜์—ญ๋ณ„๋กœ โ€˜Top Pickโ€™์€ ํ•ด๋‹น ๋…ผ๋ฌธ ์•ž์— ๋ณ„ํ‘œ(๐ŸŒŸ)๋กœ ํ‘œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค!

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ตœ์‹  AI ๋ชจ๋ธ

  • GPT-5
    ์˜คํ”ˆAI์˜ ์—ฐ๊ตฌ์ง„์€ ์ž๋™์œผ๋กœ ๋ผ์šฐํŒ…๋˜๋Š” ๋น ๋ฅธ ๋ชจ๋“œ์™€ โ€œ์‚ฌ๊ณ (Thinking)โ€ ๋ชจ๋“œ๋ฅผ ๋ชจ๋‘ ๊ฐ–์ถ˜ ํ†ตํ•ฉ ์‹œ์Šคํ…œ, GPT-5๋ฅผ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. GPT-5๋Š” AIME 2025์—์„œ 94.6%, SWE-Bench Verified์—์„œ 74.9%, Aider Polyglot์—์„œ 88%, MMMU์—์„œ 84.2%, HealthBench Hard์—์„œ 46.2%๋ฅผ ๊ธฐ๋กํ–ˆ๊ณ , GPT-5 Pro๋Š” GPQA์—์„œ 88.4%๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ๊ฐœ์„  ์‚ฌํ•ญ์œผ๋กœ๋Š” ์•ฝ 45~80% ๋‚ฎ์•„์ง„ ํ™˜๊ฐ(Hallucination) ๋น„์œจ, 6% ๋ฏธ๋งŒ์œผ๋กœ ์ค„์–ด๋“  ์•„์ฒจ(Sycophancy), ๋” ์•ˆ์ „ํ•œ ์ƒ์„ฑ ๊ฒฐ๊ณผ, ๋” ๊ฐ•๋ ฅํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก , ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์ฝ”๋”ฉ ๋ฐ ๊ธ€์“ฐ๊ธฐ ์„ฑ๋Šฅ, ์ƒˆ๋กœ์šด ์กฐ์ • ๊ฐ€๋Šฅํ•œ(Steerable) ์„ฑ๊ฒฉ(ใ…–ersonalities) ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ChatGPT ๋“ฑ๊ธ‰์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•˜๊ณ , Pro ๋ฒ„์ „์€ ํ™•์žฅ๋œ ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋ธ”๋กœ๊ทธ ๋ณด๊ธฐ]

  • Claude Opus 4.1
    ์•ค์“ฐ๋กœํ”ฝ ์—ฐ๊ตฌ์ง„์€ Opus 4์—์„œ ์ฝ”๋”ฉ, ์ถ”๋ก , ์—์ด์ „ํŠธํ˜• ๊ฒ€์ƒ‰(Agentic Search) ๋Šฅ๋ ฅ์ด ๊ฐœ์„ ๋œ Claude Opus 4.1์„ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ํ™•์žฅ๋œ ์‚ฌ๊ณ  ๋ชจ๋“œ๊ฐ€ ์—†์–ด๋„ SWE-Bench Verified(500๊ฐœ ์ž‘์—…)์—์„œ 74.5%๋ฅผ ๊ธฐ๋กํ–ˆ๊ณ , ๋‹ค์ค‘ ํŒŒ์ผ ๋ฆฌํŒฉํ† ๋ง, ์ •๋ฐ€ํ•œ ๋ฒ„๊ทธ ์ˆ˜์ •, ๋Œ€๊ทœ๋ชจ ์ฝ”๋“œ๋ฒ ์ด์Šค ํŽธ์ง‘ ๋“ฑ์˜ ์ž‘์—…์—์„œ ๋ˆˆ์— ๋„๋Š” ํ–ฅ์ƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ํ™•์žฅ๋œ ์‚ฌ๊ณ  ๋ชจ๋“œ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด TAU-Bench, GPQA Diamond, MMMLU, MMMU, AIME์—์„œ ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๊ณ , ๋‹ค์ค‘ ํ„ด ์—์ด์ „ํŠธ ๊ฒฝ๋กœ(Agent Trajectories)๋„ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค. Claude Opus 4.1์€ API, Claude Code, Amazon Bedrock, Google Cloud Vertex AI๋ฅผ ํ†ตํ•ด์„œ Opus 4์™€ ๋™์ผํ•œ ๊ฐ€๊ฒฉ์œผ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. โ€”> [๋ธ”๋กœ๊ทธ ๋ณด๊ธฐ]

  • Qwen-image technical report
    Qwen ํŒ€์€ ๋ณต์žกํ•œ ํ…์ŠคํŠธ ๋ Œ๋”๋ง๊ณผ ์ •๋ฐ€ํ•œ ์ด๋ฏธ์ง€ ํŽธ์ง‘์— ๊ฐ•์ ์„ ๊ฐ€์ง„ ์ด๋ฏธ์ง€ ์ƒ์„ฑ์šฉ ํŒŒ์šด๋ฐ์ด์…˜ ๋ชจ๋ธ Qwen-Image๋ฅผ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ ์ง„์  ์ปค๋ฆฌํ˜๋Ÿผ(Progressive Curriculum), ์ด์ค‘ ์ธ์ฝ”๋”ฉ(Qwen2.5-VL ์‹œ๋งจํ‹ฑ + VAE ์žฌ๊ตฌ์„ฑ), ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ํ•™์Šต์„ ์‚ฌ์šฉํ•ด์„œ DPG(88.32), GenEval-RL(0.91), OneIG-ZH(0.548), ChineseWord(58.30%), LongText-Bench-ZH(0.946)์—์„œ SOTA๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. GEdit-CN(7.52)๊ณผ ImgEdit ์ „์ฒด(4.27)์—์„œ ์ตœ๊ณ  ์ˆœ์œ„๋ฅผ ๊ธฐ๋กํ–ˆ๊ณ , ์ƒˆ๋กœ์šด ์‹œ์  ์ƒ์„ฑ(Novel View Synthesis, PSNR 15.11)๊ณผ ๊นŠ์ด ์ถ”์ •(Depth Estimation)์—์„œ๋„ ๊ฒฝ์Ÿ๋ ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ค‘๊ตญ์–ด์™€ ์žฅ๋ฌธ ํ…์ŠคํŠธ ๋ Œ๋”๋ง์—์„œ ๋‘๊ฐ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. โ€”> [๋ธ”๋กœ๊ทธ ๋ณด๊ธฐ]

  • Glm-4.5: Agentic, reasoning, and coding (ARC) foundation models
    Zhipu AI์™€ ์นญํ™”๋Œ€ํ•™๊ต ์—ฐ๊ตฌ์ง„์€ 3,550์–ต ๋งค๊ฐœ๋ณ€์ˆ˜์˜ MoE ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(ํ™œ์„ฑ 320์–ต) GLM-4.5์™€ 1,060์–ต ๋งค๊ฐœ๋ณ€์ˆ˜ ๋ฒ„์ „ GLM-4.5-Air๋ฅผ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. 23์กฐ ํ† ํฐ์œผ๋กœ ํ•™์Šตํ•œ ์ด ๋ชจ๋ธ์€ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ถ”๋ก  ๋ชจ๋“œ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. GLM-4.5์—์„œ๋Š” ์ „์ฒด 3์œ„, ์—์ด์ „ํŠธํ˜• ์ž‘์—… 2์œ„๋ฅผ ๊ธฐ๋กํ–ˆ๊ณ  TAU-Bench์—์„œ 70.1%, AIME 24์—์„œ 91.0%, SWE-Bench Verified์—์„œ๋Š” 64.2%๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. Expert Iteration๊ณผ ๊ฐ•ํ™”ํ•™์Šต์„ ํฌํ•จํ•œ ๋‹ค๋‹จ๊ณ„ ์‚ฌ์ „/์ค‘๊ฐ„/์‚ฌํ›„ ํ•™์Šต ๋ฐฉ์‹์„ ์ ์šฉํ•ด์„œ ์ถ”๋ก , ์ฝ”๋”ฉ, ๋‹ค๊ตญ์–ด ๋ฒˆ์—ญ, ์•ˆ์ „์„ฑ(89.9%), ์—์ด์ „ํŠธํ˜• ์ฝ”๋”ฉ(๋„๊ตฌ ํ˜ธ์ถœ ์„ฑ๊ณต๋ฅ  90.6%)์—์„œ ๊ฐ•์ ์„ ๋ณด์ž…๋‹ˆ๋‹ค. โ€”> [๋ธ”๋กœ๊ทธ ๋ณด๊ธฐ]

  • R-Zero: Self-evolving reasoning LLM from zero data
    Tencent AI Seattle Lab, ์›Œ์‹ฑํ„ด๋Œ€ํ•™๊ต ์„ธ์ธํŠธ๋ฃจ์ด์Šค, ๋ฉ”๋ฆด๋žœ๋“œ๋Œ€ํ•™๊ต, ํ…์‚ฌ์Šค๋Œ€ํ•™๊ต ๋Œˆ๋Ÿฌ์Šค ์บ ํผ์Šค ์—ฐ๊ตฌ์ง„์€ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ์—†์ด ์ถ”๋ก ํ˜• LLM์„ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ๊ณต๋™์ง„ํ™”(Co-evolutionary) ์ฑŒ๋ฆฐ์ €โ€“์†”๋ฒ„(Challengerโ€“Solver) ํ”„๋ ˆ์ž„์›์ธ R-Zero๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. GRPO๋ฅผ ํ™œ์šฉํ•ด์„œ ์ฑŒ๋ฆฐ์ €๊ฐ€ ์†”๋ฒ„์˜ ๋Šฅ๋ ฅ ๊ฒฝ๊ณ„์—์„œ ๊ณผ์ œ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ์†”๋ฒ„๋Š” ์˜์‚ฌ ๋ผ๋ฒจ๋ง(Pseudo-Labeled)๊ณผ ํ•„ํ„ฐ๋ง๋œ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. Qwen3 ๋ฐ OctoThinker ๋ชจ๋ธ ์ „๋ฐ˜์—์„œ ์ˆ˜ํ•™ ์ ์ˆ˜๋ฅผ ์ตœ๋Œ€ +6.49, ์ผ๋ฐ˜ ์ถ”๋ก ์„ ์ตœ๋Œ€ +3.81 ํ–ฅ์ƒ์‹œ์ผฐ๊ณ , ์„ธ ๋ฒˆ์˜ ๋ฐ˜๋ณต(Iteration) ๋™์•ˆ ์„ฑ๋Šฅ ํ–ฅ์ƒ์ด ๋ˆ„์ ์ ์œผ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Goedel-prover-v2: Scaling formal theorem proving with scaffolded data synthesis and self-correction
    ํ”„๋ฆฐ์Šคํ„ด๋Œ€ํ•™๊ต, ์—”๋น„๋””์•„, ์นญํ™”๋Œ€ํ•™๊ต, ์Šคํƒ ํผ๋“œ๋Œ€ํ•™๊ต, ๋ฉ”ํƒ€ FAIR, ์•„๋งˆ์กด, ์ƒํ•˜์ด ์ž์˜คํ‰๋Œ€ํ•™๊ต, ๋ฒ ์ด์ง•๋Œ€ํ•™๊ต ์—ฐ๊ตฌ์ง„์€ ์˜คํ”ˆ์†Œ์Šค Lean ์ •๋ฆฌ ์ฆ๋ช…๊ธฐ Goedel-Prover-V2๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฒ€์ฆ๊ธฐ ๊ธฐ๋ฐ˜ ์ž๊ธฐ ์ˆ˜์ •(Verifier-guided Self-Correction), ๊ณ„์ธต์  ๋ฐ์ดํ„ฐ ํ•ฉ์„ฑ(Scaffolded Data Synthesis), ๋ชจ๋ธ ํ‰๊ท ํ™”(Model Averaging)๋ฅผ ์‚ฌ์šฉํ•ด์„œ 80์–ต ๋งค๊ฐœ๋ณ€์ˆ˜ ๋ชจ๋ธ์€ MiniF2F์—์„œ pass@32 ๊ธฐ์ค€ 84.6%๋ฅผ ๊ธฐ๋กํ•˜๋ฉด์„œ DeepSeek-Prover-V2-671B๋ฅผ ๋Šฅ๊ฐ€ํ–ˆ๊ณ , 320์–ต ๋งค๊ฐœ๋ณ€์ˆ˜ ๋ชจ๋ธ์€ 88.1%(์ž๊ธฐ ์ˆ˜์ • ํฌํ•จ ์‹œ 90.4%)๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ PutnamBench ๋ฌธ์ œ 86๊ฐœ๋ฅผ pass@184๋กœ ํ•ด๊ฒฐํ•ด์„œ, ํ›จ์”ฌ ์ž‘์€ ๊ทœ๋ชจ์™€ ์—ฐ์‚ฐ๋Ÿ‰์œผ๋กœ ๊ธฐ์กด SOTA๋ฅผ ๋›ฐ์–ด๋„˜์—ˆ์Šต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Seed diffusion: A large-scale diffusion language model with high-speed inference
    ByteDance Seed์™€ ์นญํ™”๋Œ€ํ•™๊ต ์—ฐ๊ตฌ์ง„์€ H20 GPU์—์„œ ์ดˆ๋‹น 2,146ํ† ํฐ์„ ์ƒ์„ฑํ•˜๋Š” ์ด์‚ฐ ์ƒํƒœ ํ™•์‚ฐ(Discrete-State Diffusion) ์ฝ”๋“œ LLM, Seed Diffusion Preview๋ฅผ ๋ฐœํ‘œํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ณ‘๋ ฌ ๋ธ”๋ก ๋‹จ์œ„ ์ƒ์„ฑ, ์ œํ•œ๋œ ์ˆœ์„œ ํ•™์Šต(Constrained-Order Training), On-Policy Trajectory Optimization์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. Edit-based Corruption์˜ 2๋‹จ๊ณ„ ์ปค๋ฆฌํ˜๋Ÿผ์„ ๊ฑฐ์ณ HumanEval, MBPP, BigCodeBench, LiveCodeBench, MBXP ๋“ฑ์—์„œ ์œ ์‚ฌ ๊ทœ๋ชจ์˜ ์ž๊ธฐํšŒ๊ท€(Autoregressive)ํ˜• ๋ชจ๋ธ๊ณผ ๋น„์Šทํ•˜๊ฑฐ๋‚˜ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋‚ด๊ณ , ์ฝ”๋“œ ํŽธ์ง‘(CanItEdit)์—์„œ 54.3%๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ์†๋„โ€“ํ’ˆ์งˆ ํŒŒ๋ ˆํ†  ํ”„๋Ÿฐํ‹ฐ์–ด์—์„œ ์ด์ „์˜ ํ™•์‚ฐ ๋ชจ๋ธ์ธ Mercury์™€ Gemini๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

LLM๊ณผ ์—์ด์ „ํŠธ ๋Šฅ๋ ฅ ํ™•์žฅ์„ ์œ„ํ•œ ๊ฐ•ํ™”ํ•™์Šต

  • ๐ŸŒŸ Sotopia-RL: Reward Design for Social Intelligence (by Illinois Urbana-Champaign, California Irvine, Ai2, Carnegie Mellon University, Stanford, MIT)
    ๋ฐœํ™” ๋‹จ์œ„(Utterance-Level)์™€ ๋‹ค์ฐจ์› ๋ณด์ƒ(Multi-Dimensional Rewards)์„ ์‚ฌ์šฉํ•ด์„œ ๋ฏธ๋ฌ˜ํ•œ ์‚ฌํšŒ์  ํ–‰๋™์„ ํฌ์ฐฉํ•  ์ˆ˜ ์žˆ๋Š” ์‚ฌํšŒ์  ์ง€๋Šฅ ์—์ด์ „ํŠธ(Socially Intelligent Agents)๋ฅผ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  •  ๐ŸŒŸ Agent Lightning: Train ANY AI Agents with RL (by Microsoft)
    ํ†ตํ•ฉ ์˜ค๋ฒ„ํ—ค๋“œ(Integration Overhead)๋ฅผ ์ตœ์†Œํ™”ํ•ด์„œ ์–ด๋–ค AI ์—์ด์ „ํŠธ ์•„ํ‚คํ…์ฒ˜(AI Agent Architecture)์—๋„ ๊ฐ•ํ™”ํ•™์Šต(RL)์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜ ํ”„๋ ˆ์ž„์›์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Exploitation Is All You Need... for Exploration (by Micah Rentschler, Jesse Roberts) ์ˆœ์ˆ˜ Exploitation ๋ชฉ์ ์ด ์ž๋ฐœ์  ํƒ์ƒ‰(Emergent Exploration)์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ๋Š” ์กฐ๊ฑด์„ ์ž…์ฆํ•ด์„œ RL ์—์ด์ „ํŠธ์˜ ํƒ์ƒ‰ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ Learning to Reason for Factuality (by Meta, University of Washington)
    ์ถ”๋ก  ๋ชจ๋ธ์˜ ํ™˜๊ฐ(Hallucinations)์„ ์ค„์ด๊ธฐ ์œ„ํ•ด ์‚ฌ์‹ค ์ •๋ฐ€๋„(Factual Precision), ์„ธ๋ถ€ ์ •๋ณด(Detail), ๊ด€๋ จ์„ฑ(Relevance)์˜ ๊ท ํ˜•์„ ๋งž์ถ˜ ๊ฐ•ํ™”ํ•™์Šต ๋ณด์ƒ(Reward)์„ ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models' Instruction Following
    ์™ธ๋ถ€ ๊ฐ๋…(Supervision) ์—†์ด, ์ถ”๋ก  ๋ชจ๋ธ์˜ ๋‚ด๋ถ€ ์‹ ํ˜ธ(Internal Signals)๋ฅผ ํ™œ์šฉํ•œ ์ž๊ธฐ์ง€๋„ ๊ฐ•ํ™”ํ•™์Šต(Self-Supervised RL)์œผ๋กœ ์ง€์‹œ๋ฅผ ๋”ฐ๋ฅด๋Š”(Instruction Following) ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

ํšจ์œจ์„ฑ, ์Šค์ผ€์ผ๋ง ๋ฐ ์•„ํ‚คํ…์ฒ˜ ๊ฐœ์„ 

  • Trainable Dynamic Mask Sparse Attention
    ๋‹ค์ด๋‚˜๋ฏนํ•˜๊ณ  ์ฝ˜ํ…์ธ ๋ฅผ ์ธ์‹ํ•˜๋Š” ํฌ์†Œ ์–ดํ…์…˜(Dynamic, Content-Aware Sparse Attention)์„ ๋„์ž…ํ•ด์„œ ์žฅ๋ฌธ ์ปจํ…์ŠคํŠธ(long-context)์˜ ์ฒ˜๋ฆฌ ํšจ์œจ์„ ํ–ฅ์ƒ์‹œํ‚ค๋ฉด์„œ๋„ ์ •ํ™•์„ฑ์„ ์žƒ์ง€ ์•Š๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  •  ๐ŸŒŸ VeOmni (by ByteDance)
    ๋ชจ๋“ˆํ˜•์˜ ๋ชจ๋ธ ์ค‘์‹ฌ ๋ถ„์‚ฐ ํ”„๋ ˆ์ž„์›(Modular, Model-Centric Distributed Framework)์„ ์‚ฌ์šฉํ•ด์„œ ์˜ด๋‹ˆ๋ชจ๋‹ฌ(Omni-Modal) LLM ํ•™์Šต์„ ํ™•์žฅํ•˜๊ณ  ํšจ์œจ์ ์œผ๋กœ ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ๋ฅผ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • LeanK
    ์ค‘์š”ํ•˜์ง€ ์•Š์€ KV ์บ์‹œ ์ฑ„๋„(KV Cache Channels)์„ ๊ฐ€์ง€์น˜๊ธฐ(Prune)ํ•ด์„œ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ์ค„์ด๊ณ  ์žฅ๋ฌธ ์ปจํ…์ŠคํŠธ์˜ ๋””์ฝ”๋”ฉ ์†๋„๋ฅผ ๋†’์ž…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

์ถ”๋ก  ํ”„๋กœ์Šค์„ธ์˜ ์ดํ•ด ๋ฐ ํ†ต์ œ

  •  ๐ŸŒŸ Is Chain-of-Thought Reasoning of LLMs a Mirage? (by Arizona State University)
    ๋ฐ์ดํ„ฐ ๋ถ„ํฌ(Data Distribution) ๊ด€์ ์—์„œ CoT (CoT, Chain-of-Thought) ์„ฑ๋Šฅ์„ ๋ถ„์„ํ•ด์„œ ํ•™์Šต ๋„๋ฉ”์ธ์„ ๋ฒ—์–ด๋‚ฌ์„ ๋•Œ์˜ ์ทจ์•ฝ์„ฑ์„ ๋“œ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  •  ๐ŸŒŸ Cognitive Loop via In-Situ Optimization (by Microsoft)
    ๋ถˆํ™•์‹ค์„ฑ์„ ์ธ์‹ํ•˜๋Š” ์ธ์ง€ ๋ฃจํ”„(Uncertainty-Aware Cognitive Loops)๋ฅผ ํ†ตํ•ด์„œ, ๊ณผํ•™์  ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ ์ž๊ธฐ ์ ์‘ํ˜•(Self-Adaptive)ยท์กฐ์ • ๊ฐ€๋Šฅ(Steerable)ํ•œ ์ถ”๋ก ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ๋” ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  •  ๐ŸŒŸ Sculptor (by Tsinghua University)
    LLM์— ๋Šฅ๋™์  ์ปจํ…์ŠคํŠธ ๊ด€๋ฆฌ ๋„๊ตฌ(Active Context Management Tools)๋ฅผ ์ œ๊ณตํ•ด์„œ ๊ฐ„์„ญ(Interference)์„ ์™„ํ™”ํ•˜๊ณ  ์ถ”๋ก ์˜ ๊ฒฌ๊ณ ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‘์šฉ ๋ฐ GUI ์—์ด์ „ํŠธ

  • LaTCoder
    ๋ ˆ์ด์•„์›ƒ์„ ์œ ์ง€ํ•˜๋Š” ์ถ”๋ก  ์ „๋žต(Layout-Preserving Reasoning Strategies)์„ ์‚ฌ์šฉํ•ด์„œ ์›นํŽ˜์ด์ง€ ๋””์ž์ธ์„ ์ฝ”๋“œ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ๐ŸŒŸ CoAct-1 (by University of Southern California, Salesforce, University of Washington)
    GUI ๋™์ž‘(GUI Actions)๊ณผ ์ง์ ‘ ์ฝ”๋”ฉ(Direct Coding)์„ ๊ฒฐํ•ฉํ•ด์„œ ๋” ํšจ์œจ์ ์ธ Computer-Use Agents๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

  • ChartCap
    ํ™˜๊ฐ(Hallucination)์ด ์—†๋Š” ๋ฐ€์ง‘ํ˜• ์ฐจํŠธ ์บก์…˜ ์ƒ์„ฑ(Dense Chart Captioning)์„ ์œ„ํ•ด์„œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ‰๊ฐ€ ์ง€ํ‘œ(Metric)๋ฅผ ๊ตฌ์ถ•ํ•ฉ๋‹ˆ๋‹ค. โ€”> [๋…ผ๋ฌธ ๋ณด๊ธฐ]

*๋ฆฌ๋ทฐ๋ฅผ ๋‚จ๊ธฐ์‹œ๋ ค๋ฉด ๋กœ๊ทธ์ธํ•˜์‹œ๊ฑฐ๋‚˜ ๊ตฌ๋…ํ•ด ์ฃผ์„ธ์š”. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค!

์ฝ์–ด์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ฆฌ๋ฏธ์—„ ๊ตฌ๋…์ž๊ฐ€ ๋˜์–ด์ฃผ์‹œ๋ฉด ํŠœ๋ง ํฌ์ŠคํŠธ ์ฝ”๋ฆฌ์•„์˜ ์ œ์ž‘์— ํฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค!

1 

Reply

or to participate.