- Turing Post Korea
- Posts
- ๐FOD#113: GPT-5 แแ ฎแฏแแ ตแแ ก แแ ฎแซ แแ ญแแ ฎแซ, AIแแ ด 'แแ ฅแผแแ งแจ แแ ฆแแ ณแท(Personality Tax)'
๐FOD#113: GPT-5 แแ ฎแฏแแ ตแแ ก แแ ฎแซ แแ ญแแ ฎแซ, AIแแ ด 'แแ ฅแผแแ งแจ แแ ฆแแ ณแท(Personality Tax)'
+ แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
์ง๊ธ ํ์ฐฝ ์งํ ์ค์ธ AI ์์ญ์ ํ์ ์ ์ธ ์ ๋ฐ์ดํธ๊ฐ ์๋น๋ถ๋ถ โ๋ชจ๋ธโ์ ์์ญ์์ ์ผ์ด๋๊ณ ์์ฃ . ๊ด๋ จ ๋ด์ฉ์ ์ฃผ๊ฐ FOD ๋ด์ค๋ ํฐ ํ๋จ์ โ์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธโ ์น์ ์์ ๋ค๋ฃจ๊ณ ์์ผ๋ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค!
์ด์ฐ๋ณด๋ฉด ์์ฆ AI ์์ญ์์ ๋ค๋ฆฌ๋ ์๋ง์ ์์์ ์ฐธ โ๋ฌํฉ๋๋คโ. ๋ฌด์จ ๋ง์์ธ๊ฐ ํ๋ฉด, ๋ด์ค ํค๋๋ผ์ธ๋ค, ๊ทธ๋ฆฌ๊ณ ์ฌ๋๋ค๊ณผ ์ด์ผ๊ธฐํ๋ฉด์ ๋ค๋ฆฌ๋ ๋ถ๋ง๋ค์ ์ญ์ฑ ๋ชจ์๋ณด๋ฉด์, ํ๋์ โ๋ชจ์(Paradox)โ์ด ์์ด์.
๊ทธ๊ฑด ๋ฐ๋ก, ํํธ์ผ๋ก๋ โAI์ ๋์ ์ด๋ผ๋๊ฒ ๋๋ฌด๋๋ ๊ณ ํต์ค๋ฝ๊ณ ๋๋ฆฐ ๊ณผ์ โ์ด๊ธฐ๋ ํ์ง๋ง, ๋ ๋ค๋ฅธ ํํธ์์๋ โ์์ฒญ๋๊ฒ ๋น ๋ฅธ, AI ๊ธฐ๋ฐ์ ๋ณํโ๊ฐ ๋์์ ์ผ์ด๋๊ณ ์๋ค๋ ๊ฒ๋๋ค.
์ด๊ฒ ๋ชจ์์ฒ๋ผ, ๊ทธ๋ฆฌ๊ณ ์ญ์ค์ ์ผ๋ก ๋ค๋ฆฌ์ง๋ง, ๋ ๊ฐ์ง ๋ชจ๋๊ฐ ์ฌ์ค์ด๊ณ , AI๋ฅผ ํฌํจํ ๊ธฐ์ ์ ๊ณ๋ ์ด์ ๊ทธ ํจ์(Implication)๋ฅผ ์์ํ ๊นจ๋ซ๊ณ ์๋ ์์ ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
๋ ๊ฐ์ง ์ค์ โ๋๋ฆฐ ์ฐจ์ (Slow Lane)โ์ ์ฐ๋ฆฌ์๊ฒ ์ฌ์ค ์ต์ํ ์์ญ์ด์์: โํ๋์ด ๋ณํํด์ผ ํ๋ (Behavioral Change)โ ์์ญ์ด์์. ๋ณดํต ์ด์ ์๋ โ๋ณํ ๊ด๋ฆฌ(Change Management)โ๋ผ๊ณ ๋ถ๋ฅด๋ ์์ญ์ ์ผ๋ถ์ด๊ธฐ๋ ํ๋ค๊ณ ๋ด ๋๋ค. ์๋ก์ด ๊ธฐ๋ฅ, ์๋ก์ด ๊ธฐ์ ์ ๋ฐฐ์ฐ๊ณ , ๊ธฐ์กด์ ํ๋ ์ผ์ ํ๋ฆ์ ๋ฐ๊พธ๊ณ , ์๊ฐํ๋ ๋ฐฉ์์ ๋ฐ๊ฟ์ผ ํ๋ ์ํฉ์ด ๋ฅ์น๋ฉด ๋ณดํต ์ฐ๋ฆฌ๋ โ์ ํญโํ๊ฒ ๋ฉ๋๋ค: ๊ธ์์, ์ด๋ฐ ๊ฑธ โBehavioral-Delta Lawโ๋ผ๊ณ ๋ถ๋ฅผ ์ ์์ง ์์๊น์?

โ๋ณํโ๋ ์ด๋ ต์ต๋๋ค. Image Credit: Matthias Orgler
์๋ก์ด ์ ํ, ์๋ก์ด ์๋น์ค๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํด์ ์๊ตฌ๋๋ ๋ณํ์ ํฌ๊ธฐ๊ฐ ํด์๋ก, ๋ง์ฐฐ(Friction)๊ณผ ์ ํญ(Resistance)์ด ์ปค์ง๊ฒ ๋์ฃ .
ํ๋ฆฐ์คํด ๋ํ๊ต ๊ต์์ด์ AI Snake Oil ๋ด์ค๋ ํฐ ํธ์ง์์ธ Arvind Narayanan์ด ๋งํ ๊ฒ์ฒ๋ผ, ์ด๊ฑด โ๊ธฐ์ ์ ์์ฑ์ด ์๋๋ผ ์ธ๊ฐ ํ๋์ ์์ฑโ์ด๊ธฐ ๋๋ฌธ์ AI๋ผ๊ณ ํด์ ๋ค๋ฅผ ๊ฑด ์์ต๋๋ค. ์ด์จ๋ ์ด๋ฐ ๊ฒฝ์ฐ์ ๊ธฐ์ ์ ๋์ ์๋๋ ๋ช ๋ฌ, ๋ช ๋ ๋จ์๋ก ์ธก์ ์ ํด์ผ ํ๋ ์์ค์ ๋๋ค. ๊ทธ๋งํผ โ์๋ก์ด ๊ธฐ์ โ๊ณผ ๊ทธ๊ฑธ ์ฌ์ฉํด์ผ ํ๋ โ์ฌ๋โ ์ฌ์ด์ ๊ด๊ณ ํ์ฑ์ด ์ค๋ ๊ฑธ๋ฆฝ๋๋ค.
๊ทธ๋ฐ๋ฐ, ์ด๋ฒ์ ์์๋ GPT-5์ ์ถ์ ์ ํ์๋, ์ ํ ๋ค๋ฅธ โ๋น ๋ฅธ ์ฐจ์ (Fast Lane)โ์ด ๋ง๋ค์ด์ง ์๋ ์๋ค๋ ๊ฑธ ์ฐ๋ฆฌ๊ฐ ๋ชฉ๋(็ฎ็น)ํ์ฃ . ์ผ๋ฐ์ ์ธ ํ์์ ์๋๋ผ๊ณ ํ ์ ์๋๋ฐ์, GPT-4o๊ฐ ํ๋ฃจ ์์นจ์ ์ฌ๋ผ์ง ๊ฒ์ ๋ํด์ ๋ง์ ์ฌ๋๋ค์ด ์ฆ๊ฐ์ ์ผ๋ก, ๊ทธ๋ฆฌ๊ณ ๊ด๋ฒ์ํ๊ฒ ๋ฐ๋ฐ์ ํ๋ ๋ชจ์ต์ ๋ณด์์ต๋๋ค.

Reddit ์ฌ์ฉ์์ GPT-4o ์ ๊ฑฐ์ ๋ํ ๋ถ๋ง ๋ ธ์ถ ํฌ์คํธ. Image Credit: Reddit
์ด๊ฑด, ๋จ์ํ โ์ต์ํโ ๋๊ตฌ๋ฅผ ์๊ฒ ๋ ์ฌ์ฉ์๋ค์ ํฌ๋๊ฑฐ๋ฆผ ์ ๋๋ฅผ ๋์๋ค๊ณ ์๊ฐํฉ๋๋ค. ์๋ฌด๋ Windows XP๋ ์ค๋๋ Photoshop ์ธํฐํ์ด์ค๊ฐ ์ฌ๋ผ์ก๋ค๊ณ ํด์ ์ด๋ฐ ๊ฒฉํ ๊ฐ์ ์ ๋๋ฌ๋ธ ์ ์ ์์์ด์. ๊ทธ๋ฐ๋ฐ ์ด๋ฒ์๋ ์ข ๋ฌ๋์ต๋๋ค. ์ฌ๋๋ค์ ์์ฃผ ํน๋ณํ, ๊ฐ์ธ์ ์ธ ๋์ โํ๋ ฅ์โ ๋ด์ง๋ โ์น๊ตฌโ๋ฅผ ์์ด๋ฒ๋ฆฐ ๊ฒ ๊ฐ์ ์ ๋์ ๊ฐ์ ์ ๋๋ฌ๋๊ฑฐ๋ ์. ๊ทธ๋ ์ต๋๋ค, ์ด๊ฑด โ๊ด๊ณโ์ ๋ฌธ์ ๋ผ๋ ๊ฒ๋๋ค.
์ด ํ์์ AI ๋์ ์ ๋ ๋ค๋ฅธ ์ธก๋ฉด์ ๋๋ฌ๋ด ๋ณด์ฌ์คฌ์ต๋๋ค. AI์ ๋ง์ถฐ์ ์ฐ๋ฆฌ์ ์ต๊ด์ ๋ฐ๊พธ๋ ์์ ์ ๋๋ฆฐ ๊ณผ์ ์ด์ง๋ง, ๋ฐ๋ฉด ๊ธฐ์กด์ ์ ์ ์ ๋ชจ๋ธ(Mental Model)์ ๋งค๋๋ฝ๊ฒ ๋ค์ด๋ง๋ AI์๋ ์์ฃผ ๋น ๋ฅด๊ฒ, ๋จ ๋ฉฐ์น ์์๋ ์ต๊ด์ ํ์ฑํ๊ฒ ๋ ์ ์๋ค๋ ๊ฑฐ์์. ์ฐ๋ฆฌ๊ฐ ์ด๋ฐ AI ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ฉด์ ๋๋ ๋ชจ๋ฅด๊ฒ ์ฌ์ฉํด ์๋ โ๋ฐ์ด๋ธ(Vibe)โ๋ผ๋ ์ฉ์ด, ๋ํ์ ํน์ดํ ๋งํฌ, ์๋๋ฐฉ์ด ์ฌ์ฉํ ๊ฑฐ๋ผ๊ณ ์์ํ ์ ์๋ ์ด์กฐ, ์ด๋ฐ ๋ชจ๋ ๊ฒ๋ค์ด ์ฐ์ฐ์ ์ฐ๋ฌผ์ด ์๋๋ผ๋ ๊ฒ๋๋ค. ์คํ๋ ค, ์ด๊ฑด ์ฌ์ฉ์๊ฐ AI์ ์ด์ผ๊ธฐํ๋ฉด์ ์งํํ๊ฒ ๋๋ โ์ธ์ง์ ์ธ ์ํฌํ๋ก์ฐโ์ ์๊ธฐ๋ ๋ชจ๋ฅด๊ฒ, ์๋ฌต์ ์ผ๋ก ํตํฉํด ๋ฒ๋ฆฐ, โ์ง์ง ํต์ฌ์ ์ธ ํน์ง(Feature)โ์ธ ๊ฒ๋๋ค.
์ด์ฉ๋ฉด ์ด๊ฑด, AI ์ ๊ณ๊ฐ ์๊ฒ ๋ชจ๋ฅด๊ฒ ๋์น๊ณ ์๋, ์์ฃผ ์ค์ํ ๋ธ๋ผ์ธ๋ ์คํ(Blind Spot)์ ์๋๊น์? ์ฌ์ง์ด ์คํAI ๊ฐ์ ํ์ฌ๋ค๋ ๋ชจ๋ธ์ โ์ญ๋(Capability)โ์ ๊ฐํํ๊ธฐ ์ํ ์๋(Velocity)์๋ง ์ง์ฐฉํ๋ฉด์ ๋ ๋์ ์์ง - ์ฆ ๋ชจ๋ธ์ด์ฃ - ์ ๋ง๋๋ ๊ฒฝ์์ ๋ฒ์ฌ ์์ต๋๋ค. GPT-4o์์ GPT-5๋ก ์ ํํ๋ ๊ฑธ ๋จ์ํ ์ํํธ์จ์ด ์ ๊ทธ๋ ์ด๋ ์ฏค์ผ๋ก ์ทจ๊ธํ๋ฉด์, โ๋ ๋ซ๋คโ๋ ๊ฑธ ๋ฒค์น๋งํฌ ์ ์ ๊ฐ์ ๊ฐ๊ด์ ์ธ ์งํ๋ก๋ง ํ๋จํ ๊ฑฐ์ฃ .
์์ฌ ์ ํ์ ๊ฐ์ฅ ์ด์ ์ ์ผ๋ก ์ฌ์ฉํ๋ ๊ณ ๊ฐ์๊ฒ๋, ๋จ์ํ ๋๊ตฌ๋ฅผ ์ ๊ทธ๋ ์ด๋ํ๋ ๊ฒ ์๋๋ผ โํจ๊ป ์ด์ผ๊ธฐ๋ฅผ ๋๋๊ณ ์๊ฐํ๋ ํํธ๋โ๋ฅผ ๊ต์ฒดํ๋ ์ผ์ด๋ผ๋ ์ฌ์ค์ ์์ด๋ฒ๋ฆฐ ๊ฒ ์๋๊น์? ๊ณ ๊ฐ์ด ์๊ธฐ ์น๊ตฌ๋ฅผ ๋ฐ์ด๋ด๊ณ ๋ค์ด์จ โ์๋ก์ด ํ๋ ฅ์, ํํธ๋โ์๊ฒ ์ ์ํ๊ฒ๋ ๊ฐ์ํ ๋ ๋ฐ์ํ๋, ์์ โ์ฑ๊ฒฉ ์ธ๊ธ(Personality Tax)โ - ์ฆ, ์ ์์ ์ธ ๋น์ฉ์ด์ฃ - ์ ๊ณ ๋ คํ์ง ์์๋ ๊ฒ๋๋ค.
๋ ๋ค๋ฅธ ๊ธฐ๋ฅ์ด์๋ โAutomatic Model-Switcherโ๋ ์ฑ๊ณต์ ์ผ๋ก ๋ฐ์๋ค์ฌ์ง๊ณ ์๋ค๋ ๊ฒ ๋ฐ๋ก ์ด ์ ์ ์ ๋ณด์ฌ์ค๋ค๊ณ ์๊ฐํฉ๋๋ค. Grok 4๋ ์ด๊ฑธ ๊ณง๋ฐ๋ก ๋ชจ๋ฐฉํ๋ ค๊ณ ํ์ฃ . ์ฌ์ฉ์์ โBehavioral Deltaโ๋ฅผ โ0โ ์์ค์ผ๋ก ์ ์งํ๋ฉด์ ์์ง์ ๋ด๋ถ์ ์ผ๋ก ๊ต์ฒดํ๋ ๋ฐฉ์์ผ๋ก, ๊ธฐ์กด์ ์ฌ์ฉ ์ต๊ด์ ์กด์คํ๋ฉด์ ๋๊ท๋ชจ์ ํ์ฐ์ ์ด๋์ด๋ผ ์ ์์๋ ๊ฒ ์๋๊น์?

AI ์ ํ์ ๋ฏธ๋๋ ๋ฐ๋ก ์ด โ์ญ์คโ์ ์ด๋ป๊ฒ ์ ํด๊ฒฐํ๋๊ฐ์ ๋ฌ๋ ค ์์์ง๋ ๋ชจ๋ฆ ๋๋ค. ํนํ โ๋ํํ AIโ์ ๊ฒฝ์ฐ์๋, โ์ฑ๊ฒฉ(Personality)โ์ด ๊ณง ์ฌ์ฉ์ ์ธํฐํ์ด์ค(UI; User Interface)๋ผ๋ ์ฌ์ค์ ์ถฉ๋ถํ ์ดํดํ๋ ์ฌ๋๋ค์ด ์น์๊ฐ ๋ ํ๋ฅ ์ด ๋์ ๊ฒ๋๋ค.
ํ๋ฅด์๋(Persona)์ ์์ ์ฑ์ ์๋ฒ ์ ํ์๋งํผ์ด๋ ์๊ฒฉํ๊ฒ ๊ด๋ฆฌํด์ผ ํ ๊ฒ๋๋ค. ์ฌ์ฉ์๊ฐ โํ์ตํ๋โ ์๋๋ ๋๋ฆด์ง๋ผ๋, โ์ ๋ขฐํ๊ฒ ๋๋โ ์๋๋ ์์๊ฐ์ด๊ณ , ๊ทธ ์ ๋ขฐ๋ ๋ด๊ฐ โ์์งํด ์จ ํํธ๋์ ์๊ณ ์๋ ๋ณํโ๋ก ๊นจ์ ธ๋ฒ๋ฆด ๋๋ ํจ์ฌ ๋ ๋น ๋ฅด๊ฒ ๋ฐฐ์ ๊ฐ์ ๋๋ ์ ์๋ค๋ ์ฌ์ค์ ์์ง ๋ง์์ผ ํฉ๋๋ค.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
์์งํ๊ฒ, โ๋ฌด๋ฃโ๋ผ๋ ๋ง์ฒ๋ผ ๋์ ํ! ๋๋ ๋ง์ด ์๊ธฐ๋ ํ์ฃ ^.^ ๋ฌด๋ฃ์ง๋ง ์์ฃผ ์ ์ฉํ, AI์ ๋จธ์ ๋ฌ๋์ ํต์ฌ์ด์ ๊ธฐ์ด ์ฃผ์ ์ ๋ํด์ ์ต์ ์ ๋ณด๋ฅผ ์ ์ ๋ฆฌํด์ ์ ๊ณตํ๋, ๊ฐ์ฅ ์ต๊ทผ์ ์ฑ ๋ค์ ๋ชจ์ ๋ดค์ต๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
์์๋ค์ํผ, ๋ฏธ๊ตญ์ ์ฃผ์ ํ ํฌ ๊ธฐ์ ๋ค์ AI ์ธํ๋ผ๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ํด์ ์์กฐ ์ ์ด์์ ํฌ์ํ๋ฉด์ ๊ฒฝ์ ์ ์ฑ์ฅ์ ์ด๋๊ณ , ๋ค์์ ๊ธฐ์ ์์๋ AI ๊ธฐ์ ์ ์ ๊ทน์ ์ผ๋ก ์ฑํ(์ฑํ๋ฅ 78-85% ์์ค)ํด์ ์ฃผ๊ฐ ํ์ฑ ์ฌ์ฉ์ ์ 10์ต ๋ช ์ ๋ํ, ๊ธ๋ก๋ฒ AI ๊ฒฝ์์์ ๋ช ์ค์๋ถํ ๋ฆฌ๋๋ก ์์ ๋๊ฐ๊ณ ์์ต๋๋ค. ๋ฐ๋ฉด์, ์ค๊ตญ์ ํ ์ผํธ, ์๋ฆฌ๋ฐ๋ฐ ๋ฑ์ ์นฉ ๊ณต๊ธ์ ์ ์ฝ, ๊ทธ๋ฆฌ๊ณ ๋ฎ์ ์์ต์ฑ์ผ๋ก 5๋ ๊ฐ ํฌ์์ก์ด 6,300์ต ์์์ ๋จธ๋ฌด๋ฅด๊ณ ์๊ณ , ๊ธฐ์ ๋ค์ AI ์ฑํ๋ฅ ๋ ์ฝ 15% ์์ค, ์ฃผ๊ฐ ์ฌ์ฉ์๋ 7,000๋ง ๋ช ์์ค์ ๋จธ๋ฌผ๋ฉด์ ๊ธฐ์ ๊ฒฉ์ฐจ๊ฐ ์ ์ ๋ ๋ฒ์ด์ง๊ณ ์๋ ๊ฒ์ผ๋ก ๋ํ๋๊ณ ์์ต๋๋ค. ์ค๊ตญ ๊ธฐ์ ๋ค์ด AI ํฌ์์ ๋ณด์กฐ๊ธ์ ํ๋ํ๋ฉด์ ์์ฅ์ ํ๊ณ์ ๊ธฐ์ ๋ถ์ฑ๋ฅผ ๊ทน๋ณตํ์ง ์๋๋ค๋ฉด, ์ค์ฅ๊ธฐ์ ์ผ๋ก๋ AI๋ฅผ ๋๋ฌ์ผ ๊ธ๋ก๋ฒ ๊ฒฝ์์์ ์์ธ๋ ๊ฐ๋ฅ์ฑ์ด ๊ฝค ํฐ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
GPT-5 and the arc of progress by Nathan Lambert
Interconnects.ai์ ์ด ๊ธ์ ์คํAI์ GPT-5 ์ถ์ ์ด๋ฒคํธ์ ๋ํด์ ์ด์ผ๊ธฐํ๋๋ฐ์. ์ด ๋ชจ๋ธ์ด ํฅ์๋ ์ถ๋ก ๋ฅ๋ ฅ, ์ฝ๋ฉ ์ฑ๋ฅ, ํ๊ฐ ๊ฐ์ ๋ฑ ๊ธฐ์ ์์์ AI๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ ๋ฌด ์ด์์ ๋ ์ ์ง์ํ๋ฉด์ ์์ฐ์ฑ์ ํ์ ์ ์ผ๋ก ๋ณํ์ํฌ ์ ์ฌ๋ ฅ์ด ์๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค. GPT-5๋ ํตํฉ๋ ์ํคํ ์ฒ์ ์ค์๊ฐ ๋ผ์ฐํ ์์คํ ์ผ๋ก ์ง๋ฌธ์ ๋ณต์ก๋์ ๋ง์ถฐ์ ๋ค์ด๋๋ฏนํ๊ฒ ์๋ตํ์ฃ . ๋, GPT-5๋ฅผ Claude๋ Gemini ๊ฐ์ ๊ฒฝ์ ๋ชจ๋ธ๊ณผ ๋น๊ตํ๋ฉด์, AI ๊ฐ๋ฐ์ ์ ๋ต์ ์ค์์ฑ, ๊ทธ๋ฆฌ๊ณ ๊ธฐ์ ์ ๋ฆฌ๋์ญ ์ ์ง๋ฅผ ์ํ ํฌ์์ ํ์์ฑ์ ๋ํด ์ด์ผ๊ธฐํ๊ณ ์์ต๋๋ค.
GPT-5: It Just Does Stuff by Ethan Molick
Ethan Mollick์ One Useful Thing ๋ธ๋ก๊ทธ ๊ธ์ธ๋ฐ์, GPT-5์ ๋๋ผ์ด ๊ธฐ๋ฅ, ๊ทธ๋ฆฌ๊ณ AI ๊ธฐ์ ๋ฐ์ ์ ์๋ฏธ์ ๋ํ ์์ธ์ด์ ๋๋ค. GPT-5๋ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ์๋์ผ๋ก ํ๋จํด์ ๊ฐ์ฅ ์ ํฉํ ๋ชจ๋ธ์ ์ ํํ๊ณ , 24์ด ๋ง์ ์ฐฝ์์ ์ธ ๋ฌธ์ฅ์ ์์ฑํ๊ฑฐ๋ 3D ๋์์ ๊ฑด์ค ์ฑ์ ๋ง๋๋ ๋ฑ ๋๋ผ์ด ์์ ์ ์ํํ ์ ์๋ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ค๋๋ค. ์ฌ์ฉ์๊ฐ ๊ตฌ์ฒด์ ์ธ ์ง์๋ฅผ ํ์ง ์์ผ๋ฉด์๋ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋๋ก ์ ๊ทน์ ์ผ๋ก ์ ์ํ๊ณ , ์ฝ๋ฉ, ๋ฌธ์ ์์ฑ, ๋น์ฆ๋์ค ํ๋ ๋ฑ ๋ค์ํ ์์ ์ ์์์ ์ฒ๋ฆฌํด ์ค๋๋ค. ํ์ง๋ง ์ฌ์ ํ ์ฌ๋์ด ์ ๊ฐ๋ ํ๋ ๊ฑด ์ค์ํ๊ตฌ์. GPT-5์ ์ด๋ฐ ๋ฅ๋ ฅ์ AI๋ฅผ ์ฌ์ฉํ๋๋ฐ ์์ด์์ ๊ฐ์ข ๋ถ๋ด์ ์ค์ฌ ์ฃผ๋๋ฐ, ์ด๋ ์์ผ๋ก์ AI ๊ธฐ์ ๋ฐ์ ๋ฐฉํฅ๊ณผ ๊ถค๋ฅผ ๊ฐ์ด ํ๊ณ ์์ต๋๋ค.
GPT-5 Hands-On: Welcome to the Stone Age by Latent Space
Latent.Space์ ์ด ๊ธ์, ์คํAI์ GPT-5๊ฐ ์ ๋ฐ์ ์ผ๋ก ๊ธฐ์กด ๋ชจ๋ธ๋ค๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ๊ณผ ์ฌ์ฉ์ ๊ฒฝํ์ ์ ๊ณตํด ์ฃผ๊ณ , ํนํ ์ฝ๋ฉ, ์ถ๋ก , ๊ธ์ฐ๊ธฐ์์๋ ํ์ ์ ์ธ ์์ค์ ๋ฐ์ ์ ์ด๋ฃจ์๋ค๊ณ ํ๊ฐํ๊ณ ์์ต๋๋ค. GPT-5๋ ํตํฉ๋ ์์คํ ์ผ๋ก ๋ณต์กํ ์์ ์ ์๋์ผ๋ก ์ฒ๋ฆฌํ๊ณ , ํ๊ฐ ํ์์ 45% ์ ๋ ๋ ์ค์ฌ์ ๋ ์ ๋ขฐํ ์ ์๋ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ ๋ฟ ์๋๋ผ, ๋ฌด๋ฃ ์ฌ์ฉ์๋ถํฐ ๊ธฐ์ ์์๊น์ง ๊ด๋ฒ์ํ ์ ๊ทผ์ฑ์ ์ ๊ณตํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ์ ํ ์ฐ๋ฆฌ๊ฐ ์ด์ผ๊ธฐํ๋ AGI๋ผ๊ณ ๋ณผ ์๋ ์๊ณ , ๊ฒฝ์ ๋ชจ๋ธ์ธ Claude๋ Gemini์ ๋น๊ตํ์ ๋์ ์ฐจ๋ณ์ ์ ์ฌ์ฉ์ ์นํ์ฑ, ๊ทธ๋ฆฌ๊ณ ์๋์ ์๋ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค๊ณ ๊ฐ์กฐํฉ๋๋ค. ์ ๋ฐ์ ์ผ๋ก, GPT-5๊ฐ ์ค์ฉ์ฑ๊ณผ ์ ๊ทผ์ฑ์ ๋์ด๋ฉด์ AI์ ๋์คํ๋ฅผ ์๋น๊ธฐ๊ฒ ๋ ๊ฒ์ด๋ผ๊ณ ์์ธกํฉ๋๋ค.
๋ธ๋ฃธ๋ฒ๊ทธ์ ์ด ๊ธฐ์ฌ์ ๋ฐ๋ฅด๋ฉด, ์ ํ์ CEO ํ ์ฟก์ด 2025๋ 8์ 1์ผ ์ค์ ๋ฐํ ํ์, ์ ์ง์ ํ์๋ฅผ ์ด์ด์ โAI ํ์ ์ด ์ธํฐ๋ท์ด๋ ์ค๋งํธํฐ๋ณด๋ค ํฐ ๊ธฐํ๋ผ๊ณ ๊ฐ์กฐโํ๋ฉด์ โ์ ํ์ด ์ด ๊ธฐํ๋ฅผ ์ ์ ํ๊ธฐ ์ํด์ ๋๊ท๋ชจ ํฌ์๋ฅผ ํ ๊ฒโ์ด๋ผ๊ณ ๊ฐ์กฐํ๋ค๊ณ ํฉ๋๋ค. ์ด๋ ๊ฒ ์ค์ ๋ฐํ ํ ์ ์ง์ ํ์๋ฅผ ์ฌ๋ ๊ฑด ๊ฑฐ์ ์๋ ์ผ์ธ๋ฐ์. ํ์ ์ ํ์ด ๊ณผ๊ฑฐ์ ๋งฅ, ์์ดํฐ, ์์ดํจ๋ ๋ฑ ์๋ก์ด ํ์ ์ ์ ํ ์์ญ์์ ํ๋์ ํ๋์ ์ธ โ๊ธฐ์คโ์ ์ธ์ ์๋ฏ์ด AI์์๋ ๋น์ทํ ์ฑ๊ณต์ ๊ฑฐ๋ ๊ฒ์ด๋ผ๊ณ ๋๊ดํ๊ณ ์๋ค๋ฉด์, ์๋ฆฌ ์์ฑ ๋น์์ ๋๋์ ์ธ ์ ๊ทธ๋ ์ด๋์ ๋๋ผ์ด ์ ํ ํ์ดํ๋ผ์ธ์ด ์๋ค๊ณ ์ธ๊ธํ์ต๋๋ค. ๋, ์ ํ ์๋ฆฌ์์ค COO์ ํด์, ์ ํ TV+ ์์ฒญ๋ฅ ์ฆ๊ฐ, ํ์ ์ค๋ฆฝ ๋ชฉํ ๋ฑ ๋ค์ํ ์ฃผ์ ๋ฅผ ๋ค๋ฃจ๋ฉด์, AI ์ค์ฌ์ ๋ฏธ๋๋ฅผ ์ํด ์ ์ฌ์ ๋ ธ๋ ฅ์ ๊ณ์ ํด ์ค ๊ฒ์ ๋ ๋ คํ๋ค๊ณ ํ๋ค์.
Chess.com์ ๊ธฐ์ฌ์ ๋ฐ๋ฅด๋ฉด, 2025๋ 8์ 7์ผ ๊ตฌ๊ธ์ Kaggle Game Arena์์ ์ด๋ฆฐ AI ์ฒด์ค ํ ๋๋จผํธ ๊ฒฐ์น์ ์์ ์คํAI์ o3 ๋ชจ๋ธ์ด xAI์ Grok 4๋ฅผ 4-0์ ์ค์ฝ์ด๋ก ๋ฌด๋๋จ๋ฆฌ๋ฉด์ ์ฐ์น์ ์ฐจ์งํ๋ค๊ณ ํฉ๋๋ค. Grok 4๋ ์ค๊ฒฐ์น๊น์ง ๊ฐ๋ ฅํ ๋ชจ์ต์ ๋ณด์์ง๋ง, ๊ฒฐ์น์์ ์ฐ์์ ์ธ ์ค์๋ฅผ ์ ์ง๋ฅด๋ฉด์ ๋ฌด๋์ก๊ณ , o3๋ ํนํ ์๋ ๊ฒ์์์ ๋ฐ์ด๋ ์ ๋ต์ ๋ณด์ฌ์คฌ์ต๋๋ค. 3์ ๊ฒฐ์ ์ ์์๋ ๊ตฌ๊ธ์ Gemini 2.5 Pro๊ฐ o4-mini๋ฅผ 3.5-0.5๋ก ๊บพ๊ณ ๋๋ฉ๋ฌ์ ํ๋ํ๋๋ฐ, ์ด ํ ๋๋จผํธ๋ AI ๋ชจ๋ธ๋ค์ ์ ๋ต์ ์ฌ๊ณ ์ ์ฒด์ค ์ค๋ ฅ์ ํ๊ฐํ๋ ์ค์ํ ๋ฌด๋๋ก, ํ์นด๋ฃจ ๋์นด๋ฌด๋ผ์ ๋งค๊ทธ๋์ค ์นผ์ผ ๊ฐ์ ์ฒด์ค ๊ฑฐ์ฅ๋ค์ ํด์ค๋ก ์ฃผ๋ชฉ๋ฐ์๋ค๊ณ ํ๋ค์.
The Current AI Conference Model Is Unsustainable! (An interesting take on how AI conferences impose significant environmental costs and contribute to mental health challenges)
arXiv์ ๊ฒ์ฌ๋ ๋ ผ๋ฌธ(2508.04586)์ธ๋ฐ์. AI ํํ๊ฐ ์์ฒญ๋๊ฒ ๋ง์์ง๊ณ ์๋ค๋ ๊ฑด ๋ค๋ค ์ ์๊ณ ๊ณ์ค ๊ฒ๋๋ค. ๊ทธ ๋๋ฌธ์ ๊ธฐ์กด์ ์ค์์ง์ค์ ํํ ๋ชจ๋ธ์ด ๊ณผํ์ ์ํต, ํํ์ฑ, ์ปค๋ฎค๋ํฐ ๋ณต์ง๋ฅผ ์ํํ๋ ์ง์ ๋ถ๊ฐ๋ฅํ ์๊ธฐ์ ์ฒํ๊ฒ ๋์๋ค๊ณ ์ง๋จํ๊ณ ์์ด์. ์ด ๋ ผ๋ฌธ์์ ์กฐ์ฌํ ๋ฐ์ ๋ฐ๋ฅด๋ฉด, ์ง๋ 10๋ ๊ฐ ๋ ผ๋ฌธ ๋ฐํ๋ 2๋ฐฐ ์ด์ ์ฆ๊ฐํ๊ณ , ํํ์ ํ์ ๋ฐฐ์ถ๋์ด ๊ฐ์ต ๋์์ ์ผ์ผ ๋ฐฐ์ถ๋์ ์ด๊ณผํ๋ ์ํ๊ฐ ๋์๊ณ , ์ฐธ์์ ์๊ฐ ํด๋น ์ฅ์์ ์์ฉ ๋ฅ๋ ฅ์ ๋๋ ๋ฑ ๊ณผํ์ , ํ๊ฒฝ์ , ์ฌ๋ฆฌ์ , ๋ฌผ๋ฅ์ ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํ๋ ์ํ์ ์ด๋ฅด๋ ๋ค๊ณ ์ง์ ํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋ฆฌ๋ทฐ, ๋ฐํ, ๋คํธ์ํน์ ๊ธ๋ก๋ฒํ๊ฒ ์กฐ์ ํ๋ ์ง์ญ์ ์ผ๋ก ์กฐ์งํ๋ ์ปค๋ฎค๋ํฐ-์ฐํฉ ํํ(CFC) ๋ชจ๋ธ์ ์ ์ํ๊ณ ์๊ณ , ๊ฒฐ๊ณผ์ ์ผ๋ก AI ์ฐ๊ตฌ๋ถํฐ ์ง์ ๊ฐ๋ฅํ๊ณ ํฌ์ฉ์ ์ผ๋ก ๋ฐ์ ํด์ผ ํ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค.
A BEST CASE SCENARIO FOR AI? by David Sacks
ํ์ดํ์ 1๋ COO์ด๊ณ ์ ๋ช IT ๊ธฐ์ ์ ์ด๊ธฐ ํฌ์์, ๊ทธ๋ฆฌ๊ณ ํธ๋ผํ ์ ๋ถ์ AI ๋ฐ ์ํธํํ โ์ฐจ๋ฅดโ์ธ David Sacks๊ฐ X์ ์ฌ๋ฆฐ ํฌ์คํธ์ ๋๋ค. AI์ ๋ฏธ๋์ ๋ํ ์ต์ ์ ์๋๋ฆฌ์ค๋ฅผ ์ด์ผ๊ธฐํ๋ฉด์, AI๊ฐ AGI์ ๋๋์ ํจ๊ป ์ํ๊ณผ ๊ฐ์ ๋ฏธ๋๋ฅผ ๊ฐ์ ธ์ฌ ๊ฑฐ๋ผ๋ ๋น๊ด๋ก ์๋ค์ ์์ธก์ด ํ๋ ธ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค. ์ค์ ๋ก๋, ์ ๋ ์ ๋์ ์ธ ๋ชจ๋ธ๋ค์ด ๋น์ทํ ์ฑ๋ฅ์ผ๋ก ๊ฒฝ์ํ๋ฉด์ ์๋ก ์ถ์ํ๊ณ , ์ ๋ฌธํ๋ ์์ญ์์ ๊ฐ์ ์ ๋ณด์ด๋ ๋ฑ ์ค์์์ ์ง์คํ๋ ์ด์ง๋ฅ ๋์ ๋น๊ต์ ๊ท ํ์ด ์กํ ๋ฐ์ ์ด ์ผ์ด๋๊ณ ์๋ ๊ฒ์ผ๋ก ๋ณด์ด๊ธฐ๋ ํฉ๋๋ค. David๋ ํ์ฌ ์ํฉ์ โ๋ฏธ๊ตญ์ 5๋ ๊ธฐ์ ์ด ์น์ดํ๊ฒ ๊ฒฝ์ํ๋ฉด์ ํ์ ์ ์ด์งํ๊ณ ๋ ์ ์ ๋ฐฉ์งํ๋ฉด์, ์คํ์์ค, ๊ทธ๋ฆฌ๊ณ ์ธ๊ฐ-AI์ ํ๋ ฅ์ด ์ ์ ๋ ์ค์ํด์ง๊ณ , ๋ฏธ๊ตญ์ AI ๋ฆฌ๋์ญ์ด ๊ฐํ๋์ง๋ง ์ค์ ํต์ ๋ผ๋ ๋์คํ ํผ์๋ฅผ ๋ง๊ณ ์๋ ๊ฑด๊ฐํ ์ํฉโ์ด๋ผ๊ณ ํ๊ฐํ๊ณ ์์ต๋๋ค.
From GPT-2 to gpt-oss: Analyzing the Architectural Advances by Sebastian Raschka
์ด ๊ธ์ GPT-2์์ GPT-OSS๊น์ง ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์งํ๋ฅผ ๋ถ์ํ๋๋ฐ, GPT-OSS(120B, 20B ๋ชจ๋ธ)๊ฐ ์คํ์์ค๋ก ๊ณต๊ฐ๋๋ฉด์ ๋ก์ปฌ์์์ ์คํ ๊ฐ๋ฅ์ฑ, ๊ทธ๋ฆฌ๊ณ ๋ง์ถคํ์ ์ฌ์ง๋ฅผ ๋์๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค. ์ด ๋ชจ๋ธ๋ค์ ๊ธฐ์กด์ ์ํคํ ์ฒ๋ฅผ ์ต์ ํํด์ ์ฑ๋ฅ์ ๋์ด์ฌ๋ ธ๊ณ , ์ ๋ฌธ๊ฐ(Expert)์ ์๋ฅผ ์ค์ฌ์ ํจ์จ์ฑ์ ๋์๊ณ , Apache 2.0 ๋ผ์ด์ ์ค๋ก ์์ ์ ์ธ ํ์ฉ๋ ํ ์ ์๊ฒ๋ ๋์์ต๋๋ค. GPT-5 ๋ฐํ์ ๋น๊ตํ๋ฉด์ LLM ์ฐ๊ตฌ์ ๋ํฅ์ ์กฐ๋งํ๊ณ , ์ฝ๋์ ๊ธฐ์ ๋ณด๊ณ ์๋ฅผ ํตํด ๊ฐ๋ฐ์๋ค์ด ๋ฐฐ์ธ ์ ์๋ ๊ธฐํ๋ฅผ ์ ๊ณตํ๊ณ , ์คํ์์ค LLM์ ์ค์์ฑ๊ณผ ๋ฏธ๋ ๊ฐ๋ฅ์ฑ์ ํ๊ตฌํ๋ ๊ธ์ ๋๋ค.
ChatGPT will apologize for anything by AI Weirdness
์ด ๊ธ์, ์ฌ์ฉ์๊ฐ โ์์ ์ ๊ธฐ๋ฆฐ์ CEO๋ก ์ถ์ฒํ์ผ๋ ๊ทธ ์ผ์ ๋ํด์ ์ฌ๊ณผํดโ๋ผ๋ ๊ฑฐ์ง ์ ์ ๋ฅผ ์ฃผ์์ ๋, ChatGPT๊ฐ ์ฌ์ค ์ฌ๋ถ๋ฅผ ํ์ธํ์ง ์๊ณ ์ด๊ฑธ ๊ทธ๋๋ก ๋ฐ์๋ค์ด๋ฉด์ ๋ง์น ์ค์ ๋ก ์์๋ ์ผ์ฒ๋ผ ์ง์งํ๊ฒ ์ฌ๊ณผ๋ฌธ์ ์์ฑํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ค๋๋ค. ChatGPT์ ์ฌ๊ณผ๊ฐ ์ค์ ๋ฐ์ฑ์ด๋ ์ฌ์ค ํ์ธ์ ๊ธฐ๋ฐํ ๊ฒ์ด ์๋๋ผ, ์ฌ์ฉ์๊ฐ ์ค์ ํ ์ํฉ์ ๋ง์ถฐ ์ฆํฅ์ ์ผ๋ก ๋ง๋ค์ด์ง ์ธ์ด์ ์ฐ๊ธฐ์ ๋ถ๊ณผํ๋ค๋ ์ ์ ์ง์ ํ๋ ๊ฒ์ด์ฃ . ์ด๋ ๊ฒ ์ค๋์ ๋ถํฐ ๊ด์ฐฐ๋์ด ์จ ๊ณผ๋ํ ์น์ ยท์์ฒจํ ๋ฐ์์, ์ต๊ทผ AI์์ ๋ํ์์ ๊ฐ์ ์ ์ ๋์ ๋ฐ์ฑ์ ๊ธฐ๋ํ๋ ๊ฒฝํฅ์ด ์ปค์ง๋ฉด์ ์ค์ ์ ๋ฐ์ฑ์ผ๋ก ์คํด๋๊ธฐ ์ฝ์ต๋๋ค. ์ด ๊ธ์ ์ด๋ฐ ํ์์ ๊นจ๊ณ , ์ฑ๋ด์ ์ฌ๊ณผ๋ฅผ ๋๋์ ์ฑ ์์ผ๋ก ๋ฐ์๋ค์ด์ง ๋ง์์ผ ํ๋ค๋ ์ ์ ๊ฐ์กฐํฉ๋๋ค.
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
Kaggle Game Arena AI ์ฒด์ค: OpenAI o3, Grok 4 ์ํํ๊ณ ์ฐ์น
Kaggle Game Arena๋ ๊ตฌ๊ธ๊ณผ ๋ฅ๋ง์ธ๋๊ฐ ๊ณต๋์ผ๋ก ๊ฐ๋ฐํ ๊ณต๊ฐ AI ํ๊ฐ ํ๋ซํผ์ผ๋ก, ์ ์ธ๊ณ AI ๋ชจ๋ธ๋ค์ด ์ฒด์ค ๊ฐ์ ์ ๋ต ๊ฒ์์์ ์ค์๊ฐ์ผ๋ก ๋ง๋ถ์ด์ ์ง๋ฅ๊ณผ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฐ๊ด์ ์ผ๋ก ๊ฒ์ฆ๋ฐ๋ ๋ฌด๋์ ๋๋ค. ์ด ํ๋ซํผ์ ๊ฒ์์ด๋ผ๋ ๋ช ํํ ๊ท์น๊ณผ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ง ํ๊ฒฝ ์์์ AI๊ฐ ์ค์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ์ด๋ป๊ฒ ๋ณด์ฌ์ฃผ๋์ง ํ์ธํ ์ ์๋ค๋ ์ ์์ ์๋ฏธ๊ฐ ํฌ์ฃ . ๋, ์ดํ์ ๋ฐ๋ยทํฌ์ปคยท์คํํฌ๋ํํธ ๋ฑ ๋ค์ํ ์ข ๋ชฉ์ผ๋ก ๋ํ๋ฅผ ํ์ฅํด์, AI์ ์ข ํฉ์ ์ธ ์ฌ๊ณ ๋ ฅ๊ณผ ์ ๋ต์ ์ ์๋ ฅ์ ๋ค๊ฐ๋๋ก ํ๊ฐํ ๊ณํ์ด๋ผ๊ณ ํฉ๋๋ค.
์ต๊ทผ ์ด๋ฆฐ AI ์ฒด์ค ํ ๋๋จผํธ์์๋ ์คํAI์ o3 ๋ชจ๋ธ์ด xAI์ Grok 4๋ฅผ 4-0์ผ๋ก ์๋ฒฝํ๊ฒ ์ ์ํ๋ฉด์ ์ต์ข ์ฐ์น์ ๊ฑฐ๋จธ์ฅ์์ต๋๋ค. ๋ํ ๊ณผ์ ์์๋ ์ธ๊ณ ์ฑํผ์ธ ๋ง๊ทธ๋์ค ์นผ์ผ๊ณผ ์ ๋ช ์ฒด์ค ํด์ค์๋ค์ด ์ง์ ๊ฒฝ๊ธฐ๋ฅผ ๋ถ์ํ๋๋ฐ, Grok 4๊ฐ ๋ณด์ฌ์ค ์ ๋ต์ ํ์ , ๊ทธ๋ฆฌ๊ณ o3์ ๋ฐ์ด๋ ์๋ ๊ฒ์ ์ด์์ด ํ์ ๊ฐ ๋์์ต๋๋ค. ์ด๋ฒ ๊ฒฝ๊ธฐ๋ ๋จ์ํ ์นํจ๋ฅผ ๋์ด์, ์ฒด์ค ์ ๋ต์ ์ค์ ๊ฒฝ๊ธฐ ์ํฉ์์ ์ด๋ป๊ฒ ๊ตฌํํ๊ณ ์ต์ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋์ง๋ฅผ ๋ณด์ฌ์ค ์์ค ๋์ ๋๊ฒฐ๋ก ํ๊ฐ๋ฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก, ์ด๋ฒ ๋ํ๋ AI ๊ธฐ์ ์ ํ์ฌ ์ญ๋๊ณผ ํ๊ณ, ๊ทธ๋ฆฌ๊ณ ์์ผ๋ก ๋ฐ์ ํด์ผ ํ ๋ฐฉํฅ์ ๊ฐ๋ ํ ์ ์๋ ์ค์ํ ์ด์ ํ๋ก ์๋ฆฌ ์ก์์ต๋๋ค.

Kaggle Game Arena - AI ์ฒด์ค ๋์งํ
ElevenLabs Music, ์ฐฝ์์๋ค์ ์์๋ ฅ์ ๊นจ์ฐ๋ค
ElevenLabs Music์ 2025๋ 8์ ์ด ์ผ๋ ๋ธ๋ฉ์ค์์ ์ถ์ํ AI ๊ธฐ๋ฐ์ ์์ ์์ฑ ํ๋ซํผ์ ๋๋ค. ํ ์คํธ ํ๋กฌํํธ๋ง์ผ๋ก ์คํ๋์ค๊ธ ์์ง์ ์์ ์ ์ ์ํ ์ ์๊ณ , ๋ค์ํ ์ฅ๋ฅดยท๊ตฌ์กฐ๋ ์กฐ์ ํ ์ ์๊ณ , ๋ค๊ตญ์ด ๋ณด์ปฌ๋ ์ง์ํฉ๋๋ค. Merlin Network ๋ฑ๊ณผ ํ๋ ฅํด์ ์์ ์ ์ฌ์ฉ์ ์ํ ๋ฒ์ ์ธ ์์ ์ฑ์ ํ๋ณดํ ์ ์ด ํฐ ๊ฐ์ ์ผ๋ก ๊ผฝํ๋๋ค.
ํ๊ฐ๋ฅผ ์ข ํฉํด ๋ณด๋ฉด, ์์ง๊ณผ ์ฌ์ด๋ ํ๋ฆฌํฐ๋ ์์ฃผ ๋ฐ์ด๋๋ค๋ ์๊ฒฌ์ด ๋ง๊ณ , ์ฐฝ์ ์๊ฐ์ ํฌ๊ฒ ์ค์ฌ์ฃผ๋ ํ์ ์ ๋๊ตฌ๋ก ์ธ์ ๋ฐ๊ณ ์๋ ๋ฏํฉ๋๋ค - ์ด๊ธฐ ๋ฐ์์ด์ง๋ง์. ๋ฐ๋ฉด์, ๊ฐ์ฌ์ ์ฐฝ์์ฑ์ ์์ด์์ ํ๊ณ, ๊ฐ์ฑ ๋ถ์กฑ, ์ธํฐํ์ด์ค์ ์ง๊ด์ฑ ๋ฌธ์ , ๋ฌด๋ฃ ๋ฒ์ ์ ์ฌ์ฉ ์ ํ ๋ฑ์ด ๋จ์ ์ผ๋ก ์ง์ ๋๊ณ ์๋ค์. ์ ๋ฐ์ ์ผ๋ก ๋ฒ์ ์์ ์ฑ๊ณผ ๋์ ์์ง ๋๋ถ์ ํฌ๋ฆฌ์์ดํฐ๋ถํฐ ์ ๋ฌธ๊ฐ๊น์ง ํญ๋๊ฒ ํ์ฉํ ๋งํ ์ฃผ๋ชฉํ AI ์์ ํ๋ซํผ์ผ๋ก ํ๊ฐ๋๊ณ ์์ต๋๋ค.
์ ๋ ์์ ์ ๋ช ๊ฐ ๋ง๋ค์ด๋ดค๋๋ฐ, ์ผ๋จ์ ์ฌ๋ฏธ์์์ต๋๋ค ^.^ ์ ๊ฐ ๋ง๋ (?) ์์ ๊ฐ์ ํ ๋ฒ ํด ๋ณด์์ฃ :

ElevenLabs Music ์ธํฐํ์ด์ค. ์์ ๋ฌธ์ธํ์ธ ์ ๊ฒ๋ ๊น๋ํด ๋ณด์์ต๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
GPT-5
์คํAI์ ์ฐ๊ตฌ์ง์ ์๋์ผ๋ก ๋ผ์ฐํ ๋๋ ๋น ๋ฅธ ๋ชจ๋์ โ์ฌ๊ณ (Thinking)โ ๋ชจ๋๋ฅผ ๋ชจ๋ ๊ฐ์ถ ํตํฉ ์์คํ , GPT-5๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. GPT-5๋ AIME 2025์์ 94.6%, SWE-Bench Verified์์ 74.9%, Aider Polyglot์์ 88%, MMMU์์ 84.2%, HealthBench Hard์์ 46.2%๋ฅผ ๊ธฐ๋กํ๊ณ , GPT-5 Pro๋ GPQA์์ 88.4%๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ์ค์ํ ๊ฐ์ ์ฌํญ์ผ๋ก๋ ์ฝ 45~80% ๋ฎ์์ง ํ๊ฐ(Hallucination) ๋น์จ, 6% ๋ฏธ๋ง์ผ๋ก ์ค์ด๋ ์์ฒจ(Sycophancy), ๋ ์์ ํ ์์ฑ ๊ฒฐ๊ณผ, ๋ ๊ฐ๋ ฅํ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก , ์ต๊ณ ์์ค์ ์ฝ๋ฉ ๋ฐ ๊ธ์ฐ๊ธฐ ์ฑ๋ฅ, ์๋ก์ด ์กฐ์ ๊ฐ๋ฅํ(Steerable) ์ฑ๊ฒฉ(ใ ersonalities) ๋ฑ์ด ์์ต๋๋ค. ๋ชจ๋ ChatGPT ๋ฑ๊ธ์์ ์ฌ์ฉ ๊ฐ๋ฅํ๊ณ , Pro ๋ฒ์ ์ ํ์ฅ๋ ์ถ๋ก ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]Claude Opus 4.1
์ค์ฐ๋กํฝ ์ฐ๊ตฌ์ง์ Opus 4์์ ์ฝ๋ฉ, ์ถ๋ก , ์์ด์ ํธํ ๊ฒ์(Agentic Search) ๋ฅ๋ ฅ์ด ๊ฐ์ ๋ Claude Opus 4.1์ ๋ฐํํ์ต๋๋ค. ํ์ฅ๋ ์ฌ๊ณ ๋ชจ๋๊ฐ ์์ด๋ SWE-Bench Verified(500๊ฐ ์์ )์์ 74.5%๋ฅผ ๊ธฐ๋กํ๊ณ , ๋ค์ค ํ์ผ ๋ฆฌํฉํ ๋ง, ์ ๋ฐํ ๋ฒ๊ทธ ์์ , ๋๊ท๋ชจ ์ฝ๋๋ฒ ์ด์ค ํธ์ง ๋ฑ์ ์์ ์์ ๋์ ๋๋ ํฅ์์ ๋ณด์ฌ์ค๋๋ค. ํ์ฅ๋ ์ฌ๊ณ ๋ชจ๋๋ฅผ ์ฌ์ฉํ๋ฉด TAU-Bench, GPQA Diamond, MMMLU, MMMU, AIME์์ ์ฑ๋ฅ์ด ํฅ์๋๊ณ , ๋ค์ค ํด ์์ด์ ํธ ๊ฒฝ๋ก(Agent Trajectories)๋ ํ์ฅ๋ฉ๋๋ค. Claude Opus 4.1์ API, Claude Code, Amazon Bedrock, Google Cloud Vertex AI๋ฅผ ํตํด์ Opus 4์ ๋์ผํ ๊ฐ๊ฒฉ์ผ๋ก ์ ๊ณต๋ฉ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]Qwen-image technical report
Qwen ํ์ ๋ณต์กํ ํ ์คํธ ๋ ๋๋ง๊ณผ ์ ๋ฐํ ์ด๋ฏธ์ง ํธ์ง์ ๊ฐ์ ์ ๊ฐ์ง ์ด๋ฏธ์ง ์์ฑ์ฉ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ Qwen-Image๋ฅผ ์ ๋ณด์์ต๋๋ค. ์ ์ง์ ์ปค๋ฆฌํ๋ผ(Progressive Curriculum), ์ด์ค ์ธ์ฝ๋ฉ(Qwen2.5-VL ์๋งจํฑ + VAE ์ฌ๊ตฌ์ฑ), ๋ฉํฐํ์คํฌ ํ์ต์ ์ฌ์ฉํด์ DPG(88.32), GenEval-RL(0.91), OneIG-ZH(0.548), ChineseWord(58.30%), LongText-Bench-ZH(0.946)์์ SOTA๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. GEdit-CN(7.52)๊ณผ ImgEdit ์ ์ฒด(4.27)์์ ์ต๊ณ ์์๋ฅผ ๊ธฐ๋กํ๊ณ , ์๋ก์ด ์์ ์์ฑ(Novel View Synthesis, PSNR 15.11)๊ณผ ๊น์ด ์ถ์ (Depth Estimation)์์๋ ๊ฒฝ์๋ ฅ์ด ์์ต๋๋ค. ํนํ ์ค๊ตญ์ด์ ์ฅ๋ฌธ ํ ์คํธ ๋ ๋๋ง์์ ๋๊ฐ์ ๋ํ๋ ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]Glm-4.5: Agentic, reasoning, and coding (ARC) foundation models
Zhipu AI์ ์นญํ๋ํ๊ต ์ฐ๊ตฌ์ง์ 3,550์ต ๋งค๊ฐ๋ณ์์ MoE ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(ํ์ฑ 320์ต) GLM-4.5์ 1,060์ต ๋งค๊ฐ๋ณ์ ๋ฒ์ GLM-4.5-Air๋ฅผ ๊ฐ๋ฐํ์ต๋๋ค. 23์กฐ ํ ํฐ์ผ๋ก ํ์ตํ ์ด ๋ชจ๋ธ์ ํ์ด๋ธ๋ฆฌ๋ ์ถ๋ก ๋ชจ๋๋ฅผ ์ง์ํฉ๋๋ค. GLM-4.5์์๋ ์ ์ฒด 3์, ์์ด์ ํธํ ์์ 2์๋ฅผ ๊ธฐ๋กํ๊ณ TAU-Bench์์ 70.1%, AIME 24์์ 91.0%, SWE-Bench Verified์์๋ 64.2%๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. Expert Iteration๊ณผ ๊ฐํํ์ต์ ํฌํจํ ๋ค๋จ๊ณ ์ฌ์ /์ค๊ฐ/์ฌํ ํ์ต ๋ฐฉ์์ ์ ์ฉํด์ ์ถ๋ก , ์ฝ๋ฉ, ๋ค๊ตญ์ด ๋ฒ์ญ, ์์ ์ฑ(89.9%), ์์ด์ ํธํ ์ฝ๋ฉ(๋๊ตฌ ํธ์ถ ์ฑ๊ณต๋ฅ 90.6%)์์ ๊ฐ์ ์ ๋ณด์ ๋๋ค. โ> [๋ธ๋ก๊ทธ ๋ณด๊ธฐ]R-Zero: Self-evolving reasoning LLM from zero data
Tencent AI Seattle Lab, ์์ฑํด๋ํ๊ต ์ธ์ธํธ๋ฃจ์ด์ค, ๋ฉ๋ฆด๋๋๋ํ๊ต, ํ ์ฌ์ค๋ํ๊ต ๋๋ฌ์ค ์บ ํผ์ค ์ฐ๊ตฌ์ง์ ์ธ๋ถ ๋ฐ์ดํฐ๊ฐ ์์ด ์ถ๋ก ํ LLM์ ํ๋ จ์ํค๋ ๊ณต๋์งํ(Co-evolutionary) ์ฑ๋ฆฐ์ โ์๋ฒ(ChallengerโSolver) ํ๋ ์์์ธ R-Zero๋ฅผ ๋ฐํํ์ต๋๋ค. GRPO๋ฅผ ํ์ฉํด์ ์ฑ๋ฆฐ์ ๊ฐ ์๋ฒ์ ๋ฅ๋ ฅ ๊ฒฝ๊ณ์์ ๊ณผ์ ๋ฅผ ์์ฑํ๊ณ , ์๋ฒ๋ ์์ฌ ๋ผ๋ฒจ๋ง(Pseudo-Labeled)๊ณผ ํํฐ๋ง๋ ๋ฐ์ดํฐ๋ก ํ์ตํฉ๋๋ค. Qwen3 ๋ฐ OctoThinker ๋ชจ๋ธ ์ ๋ฐ์์ ์ํ ์ ์๋ฅผ ์ต๋ +6.49, ์ผ๋ฐ ์ถ๋ก ์ ์ต๋ +3.81 ํฅ์์์ผฐ๊ณ , ์ธ ๋ฒ์ ๋ฐ๋ณต(Iteration) ๋์ ์ฑ๋ฅ ํฅ์์ด ๋์ ์ ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Goedel-prover-v2: Scaling formal theorem proving with scaffolded data synthesis and self-correction
ํ๋ฆฐ์คํด๋ํ๊ต, ์๋น๋์, ์นญํ๋ํ๊ต, ์คํ ํผ๋๋ํ๊ต, ๋ฉํ FAIR, ์๋ง์กด, ์ํ์ด ์์คํ๋ํ๊ต, ๋ฒ ์ด์ง๋ํ๊ต ์ฐ๊ตฌ์ง์ ์คํ์์ค Lean ์ ๋ฆฌ ์ฆ๋ช ๊ธฐ Goedel-Prover-V2๋ฅผ ๋ฐํํ์ต๋๋ค. ๊ฒ์ฆ๊ธฐ ๊ธฐ๋ฐ ์๊ธฐ ์์ (Verifier-guided Self-Correction), ๊ณ์ธต์ ๋ฐ์ดํฐ ํฉ์ฑ(Scaffolded Data Synthesis), ๋ชจ๋ธ ํ๊ท ํ(Model Averaging)๋ฅผ ์ฌ์ฉํด์ 80์ต ๋งค๊ฐ๋ณ์ ๋ชจ๋ธ์ MiniF2F์์ pass@32 ๊ธฐ์ค 84.6%๋ฅผ ๊ธฐ๋กํ๋ฉด์ DeepSeek-Prover-V2-671B๋ฅผ ๋ฅ๊ฐํ๊ณ , 320์ต ๋งค๊ฐ๋ณ์ ๋ชจ๋ธ์ 88.1%(์๊ธฐ ์์ ํฌํจ ์ 90.4%)๋ฅผ ๋ฌ์ฑํ๋ฉด์ PutnamBench ๋ฌธ์ 86๊ฐ๋ฅผ pass@184๋ก ํด๊ฒฐํด์, ํจ์ฌ ์์ ๊ท๋ชจ์ ์ฐ์ฐ๋์ผ๋ก ๊ธฐ์กด SOTA๋ฅผ ๋ฐ์ด๋์์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Seed diffusion: A large-scale diffusion language model with high-speed inference
ByteDance Seed์ ์นญํ๋ํ๊ต ์ฐ๊ตฌ์ง์ H20 GPU์์ ์ด๋น 2,146ํ ํฐ์ ์์ฑํ๋ ์ด์ฐ ์ํ ํ์ฐ(Discrete-State Diffusion) ์ฝ๋ LLM, Seed Diffusion Preview๋ฅผ ๋ฐํํ์ต๋๋ค. ๋ณ๋ ฌ ๋ธ๋ก ๋จ์ ์์ฑ, ์ ํ๋ ์์ ํ์ต(Constrained-Order Training), On-Policy Trajectory Optimization์ ์ฌ์ฉํฉ๋๋ค. Edit-based Corruption์ 2๋จ๊ณ ์ปค๋ฆฌํ๋ผ์ ๊ฑฐ์ณ HumanEval, MBPP, BigCodeBench, LiveCodeBench, MBXP ๋ฑ์์ ์ ์ฌ ๊ท๋ชจ์ ์๊ธฐํ๊ท(Autoregressive)ํ ๋ชจ๋ธ๊ณผ ๋น์ทํ๊ฑฐ๋ ๋ ๋์ ์ฑ๋ฅ์ ๋ด๊ณ , ์ฝ๋ ํธ์ง(CanItEdit)์์ 54.3%๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. ์๋โํ์ง ํ๋ ํ ํ๋ฐํฐ์ด์์ ์ด์ ์ ํ์ฐ ๋ชจ๋ธ์ธ Mercury์ Gemini๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
LLM๊ณผ ์์ด์ ํธ ๋ฅ๋ ฅ ํ์ฅ์ ์ํ ๊ฐํํ์ต
๐ Sotopia-RL: Reward Design for Social Intelligence (by Illinois Urbana-Champaign, California Irvine, Ai2, Carnegie Mellon University, Stanford, MIT)
๋ฐํ ๋จ์(Utterance-Level)์ ๋ค์ฐจ์ ๋ณด์(Multi-Dimensional Rewards)์ ์ฌ์ฉํด์ ๋ฏธ๋ฌํ ์ฌํ์ ํ๋์ ํฌ์ฐฉํ ์ ์๋ ์ฌํ์ ์ง๋ฅ ์์ด์ ํธ(Socially Intelligent Agents)๋ฅผ ํ๋ จํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ Agent Lightning: Train ANY AI Agents with RL (by Microsoft)
ํตํฉ ์ค๋ฒํค๋(Integration Overhead)๋ฅผ ์ต์ํํด์ ์ด๋ค AI ์์ด์ ํธ ์ํคํ ์ฒ(AI Agent Architecture)์๋ ๊ฐํํ์ต(RL)์ ์ ์ฉํ ์ ์๋ ์ผ๋ฐ ํ๋ ์์์ ์ ๊ณตํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ Exploitation Is All You Need... for Exploration (by Micah Rentschler, Jesse Roberts) ์์ Exploitation ๋ชฉ์ ์ด ์๋ฐ์ ํ์(Emergent Exploration)์ ์ ๋ฐํ ์ ์๋ ์กฐ๊ฑด์ ์ ์ฆํด์ RL ์์ด์ ํธ์ ํ์ ๋ฉ์ปค๋์ฆ์ ์ค๋ช ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Learning to Reason for Factuality (by Meta, University of Washington)
์ถ๋ก ๋ชจ๋ธ์ ํ๊ฐ(Hallucinations)์ ์ค์ด๊ธฐ ์ํด ์ฌ์ค ์ ๋ฐ๋(Factual Precision), ์ธ๋ถ ์ ๋ณด(Detail), ๊ด๋ จ์ฑ(Relevance)์ ๊ท ํ์ ๋ง์ถ ๊ฐํํ์ต ๋ณด์(Reward)์ ์ค๊ณํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Beyond the Trade-off: Self-Supervised Reinforcement Learning for Reasoning Models' Instruction Following
์ธ๋ถ ๊ฐ๋ (Supervision) ์์ด, ์ถ๋ก ๋ชจ๋ธ์ ๋ด๋ถ ์ ํธ(Internal Signals)๋ฅผ ํ์ฉํ ์๊ธฐ์ง๋ ๊ฐํํ์ต(Self-Supervised RL)์ผ๋ก ์ง์๋ฅผ ๋ฐ๋ฅด๋(Instruction Following) ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
ํจ์จ์ฑ, ์ค์ผ์ผ๋ง ๋ฐ ์ํคํ ์ฒ ๊ฐ์
Trainable Dynamic Mask Sparse Attention
๋ค์ด๋๋ฏนํ๊ณ ์ฝํ ์ธ ๋ฅผ ์ธ์ํ๋ ํฌ์ ์ดํ ์ (Dynamic, Content-Aware Sparse Attention)์ ๋์ ํด์ ์ฅ๋ฌธ ์ปจํ ์คํธ(long-context)์ ์ฒ๋ฆฌ ํจ์จ์ ํฅ์์ํค๋ฉด์๋ ์ ํ์ฑ์ ์์ง ์๊ฒ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ VeOmni (by ByteDance)
๋ชจ๋ํ์ ๋ชจ๋ธ ์ค์ฌ ๋ถ์ฐ ํ๋ ์์(Modular, Model-Centric Distributed Framework)์ ์ฌ์ฉํด์ ์ด๋๋ชจ๋ฌ(Omni-Modal) LLM ํ์ต์ ํ์ฅํ๊ณ ํจ์จ์ ์ผ๋ก ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ๊ตฌํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]LeanK
์ค์ํ์ง ์์ KV ์บ์ ์ฑ๋(KV Cache Channels)์ ๊ฐ์ง์น๊ธฐ(Prune)ํด์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ค์ด๊ณ ์ฅ๋ฌธ ์ปจํ ์คํธ์ ๋์ฝ๋ฉ ์๋๋ฅผ ๋์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ถ๋ก ํ๋ก์ค์ธ์ ์ดํด ๋ฐ ํต์
๐ Is Chain-of-Thought Reasoning of LLMs a Mirage? (by Arizona State University)
๋ฐ์ดํฐ ๋ถํฌ(Data Distribution) ๊ด์ ์์ CoT (CoT, Chain-of-Thought) ์ฑ๋ฅ์ ๋ถ์ํด์ ํ์ต ๋๋ฉ์ธ์ ๋ฒ์ด๋ฌ์ ๋์ ์ทจ์ฝ์ฑ์ ๋๋ฌ๋ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ Cognitive Loop via In-Situ Optimization (by Microsoft)
๋ถํ์ค์ฑ์ ์ธ์ํ๋ ์ธ์ง ๋ฃจํ(Uncertainty-Aware Cognitive Loops)๋ฅผ ํตํด์, ๊ณผํ์ ๋ฐ๊ฒฌ์ ์ํ ์๊ธฐ ์ ์ํ(Self-Adaptive)ยท์กฐ์ ๊ฐ๋ฅ(Steerable)ํ ์ถ๋ก ์ ํ ์ ์๊ฒ๋ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ Sculptor (by Tsinghua University)
LLM์ ๋ฅ๋์ ์ปจํ ์คํธ ๊ด๋ฆฌ ๋๊ตฌ(Active Context Management Tools)๋ฅผ ์ ๊ณตํด์ ๊ฐ์ญ(Interference)์ ์ํํ๊ณ ์ถ๋ก ์ ๊ฒฌ๊ณ ์ฑ์ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ฉํฐ๋ชจ๋ฌ ์์ฉ ๋ฐ GUI ์์ด์ ํธ
LaTCoder
๋ ์ด์์์ ์ ์งํ๋ ์ถ๋ก ์ ๋ต(Layout-Preserving Reasoning Strategies)์ ์ฌ์ฉํด์ ์นํ์ด์ง ๋์์ธ์ ์ฝ๋๋ก ๋ณํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ CoAct-1 (by University of Southern California, Salesforce, University of Washington)
GUI ๋์(GUI Actions)๊ณผ ์ง์ ์ฝ๋ฉ(Direct Coding)์ ๊ฒฐํฉํด์ ๋ ํจ์จ์ ์ธ Computer-Use Agents๋ฅผ ๋ง๋ญ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]ChartCap
ํ๊ฐ(Hallucination)์ด ์๋ ๋ฐ์งํ ์ฐจํธ ์บก์ ์์ฑ(Dense Chart Captioning)์ ์ํด์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๊ณผ ํ๊ฐ ์งํ(Metric)๋ฅผ ๊ตฌ์ถํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
1
Reply