- Turing Post Korea
- Posts
- ๐FOD#97: 'แแ งแผแแ ฅแทแแ ด แแ ตแแ ข (Era of Experience)' - แแ ขแ แ ฉแแ ฎแซ แแ กแผแแ ชแแ กแจแแ ณแธแแ ด แแ ฅแซแแ ฅแผแแ ต
๐FOD#97: 'แแ งแผแแ ฅแทแแ ด แแ ตแแ ข (Era of Experience)' - แแ ขแ แ ฉแแ ฎแซ แแ กแผแแ ชแแ กแจแแ ณแธแแ ด แแ ฅแซแแ ฅแผแแ ต
แแ กแแแ ณแ แ ฉ แแ งแฏแแ งแแ ตแฏ 'แแ งแผแแ ฅแทแแ ด แแ ตแแ ข'แแ ฆ แแ ขแแ กแซ แแ ขแผแแ กแจ, แแ ฉแแ ณแซAI o3แแ ฆ แแ ขแแ กแซ แแ ตแซแแ กแผ + แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ
๋ฆฌ์ฒ๋ S. ์ํผ (๊ฐํํ์ต์ ๋๋ถ์ด์ 2024๋ ํ๋ง์ ์์์. ์จ๋ฒํ ๋ํ๊ต์ CS ๊ต์)๊ณผ ๋ฐ์ด๋น๋ ์ค๋ฒ (๋ฅ๋ง์ธ๋์์ ์ํ๊ณ , ์ํ์ ๋ก์ ๊ฐํํ์ต ์ฐ๊ตฌ๋ฅผ ์ด๋์๊ณ , ์ํ์คํ์ ๊ณต๋ ์ฑ ์์)๋, ์์ญ ๋ ๋์ ๊ธฐ๊ณ๊ฐ โ์ง์ ํ๋์ ํ๋ฉด์ ํ์ตํ๋ ๋ฐฉ๋ฒโ์ ์ฐ๊ตฌํ๊ณ ๊ฐ๋ฅด์ณ ์จ ์ฌ๋๋ค์ ๋๋ค. (๋ฆฌ์ฒ๋ ์ํผ์ด ๋ฐ์ด๋น๋ ์ค๋ฒ์ ์ง๋ ๊ต์์ด๊ธฐ๋ ํ์ต๋๋ค.)

์ผ์ชฝ: ๋ฆฌ์ฒ๋ ์ํผ, ์ค๋ฅธ์ชฝ: ๋ฐ์ด๋น๋ ์ค๋ฒ
ํ์ฐธ โ๋ฅ๋ฌ๋โ์ ์ดํ์ด ๋ถ์ด ์๋์ ์ผ๋ก ๊ฐํํ์ต์ ๋ํ ์ฃผ๋ชฉ๋๊ฐ ๋ ํด ์ง๋ ์ํฉ์์๋, ์ด๋ค์ ๊พธ์คํ ์๊ธฐ๋ง์ ์ฐ๊ตฌ๋ฅผ ์ด์ด๊ฐ์ต๋๋ค.
์ง๊ธ ์ด ์์ , ์ถฉ๋ถํ ๊ฐ๋ ฅํด์ง ์ปดํจํ ํ์์ ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ, ์ฌ์ธต ์ ๊ฒฝ๋ง์ ์์ฒญ๋ ๋ฐ์ , ๋ค์ํ๊ณ ์ ๊ทผํ๊ธฐ ์ฌ์ด ํ๋ ์์ ๋ฑ ๋๋ถ์ ์ฐ๊ตฌ์ ์์ฉ ๋ถ์ผ ๋ชจ๋์์ โ๊ฐํํ์ตโ์ ์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ํนํ, ์ต๊ทผ์ ์์ฑํ AI ๋ชจ๋ธ - ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ - ํ๋ค์ด โ๊ฐํํ์ตโ ๊ธฐ๋ฒ์ผ๋ก ํ๋ํ ๋ชจ๋ธ๊ณผ ์ ํ์ ์๋ฐฑ๋ง ~ ์์ฒ๋ง๋ช ์ ์ฌ์ฉ์๋ค์๊ฒ ๋ฐฐํฌํ๊ธฐ ์์ํ๋ฉด์ ๊ทธ ์ธ๊ธฐ์ ๊ด์ฌ๋ ์์ฐ์ค๋ฝ๊ฒ ๋ฐ๋ผ์์ฃ .
๋ฐ์ด๋น๋ ์ค๋ฒ, ๋ฆฌ์ฒ๋ ์ํผ๋ ์ด๊ฑธ ๋ ๋์ผ๋ก ๋ณด๊ณ ์์๊ฒ ์ฃ . ๊ฒฐ๊ตญ ๋ ์ฌ๋์ด ํจ๊ป AI์ ๋ค์ ๋จ๊ณ๋ฅผ โ๊ฒฝํ์ ์๋ (The Era of Experience)โ๋ผ๊ณ ์นญํ๋ ๋ ผ๋ฌธ์ ๋ฐํํ์ต๋๋ค - โAI๋ ๊ฒฝํ ๊ทธ ์์ฒด๊ฐ ๋ฐ์ ๊ณผ ๊ฐ์ ์ ์ด๋ฃฐ ์ฃผ์ ๋งค๊ฐ์ฒด๊ฐ ๋๊ณ , ๊ฒฐ๊ตญ ๊ทธ๋ฐ ๊ฒฝํ์ด ์ค๋๋ ์ ์์คํ ์์ ์ฌ์ฉ๋๋ ์ฌ๋์ด ๋ง๋ ๋ฐ์ดํฐ์ ๊ท๋ชจ๋ฅผ ์๋ํ๊ฒ ๋ , ๊ทธ๋ฐ ์๋ก์ด ์๊ธฐ์ ๋ฌธํฑ์ ์์ต๋๋ค.โ๋ผ๊ณ ์ด์ผ๊ธฐํ๊ณ ์์ต๋๋ค.
์ง๋ 1์ WEF 2025์์ ์์๋ ์ ๋ฅด์ฟค์ ์คํผ์น์ ๋ํด์๋ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์์ ๋ง์๋๋ ธ์ง๋ง, ์ญ์ ์ง๊ธ๊น์ง ์ฌ๋๋ค์ด ๋ง๋ค์ด ๋์ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ์ด์ฐจํผ ์ถฉ๋ถํ ์๋ ๋ชจ๋ธ์ ๋ง๋ค ์ ์๋ค๊ณ ๋ ์๊ฐ์ด ๋ญ๋๋ค:
โโฆ๋ฐ์ดํฐ ์ ๊ด์ ์์๋ ํ ์คํธ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ๋ฉํ ๋ชจ๋ธ (Mental Model), ์๋ ๋ชจ๋ธ (World Model)์ ๋ง๋ค ์ ์๋ค๋ ๊ฑธ ๋น๊ตํด์ ์ด์ผ๊ธฐํด ์ฃผ์๋๋ฐ์. ํ์ฌ SOTA๋ฅผ ์ฐ๋ LLM๋ค์ด ๋๋ต 20~30 Trillion ํ ํฐ์ผ๋ก ํ๋ จ์ ํ๋๋ฐ, ์ด๊ฒ ๋๋ต ์ ์ธ๊ณ์ ๊ณต๊ฐ๋ ๋ชจ๋ ํ ์คํธ์ ํด๋นํ๋ค๊ณ ๋ณด๋ฉด ๋๊ฒ ์ฃ . ํ๋์ ํ ํฐ์ด ๋๋ต 3 ๋ฐ์ดํธ๋ผ๊ณ ๋ณด๋ฉด, ์ฌ์ด์ฆ๋ก๋ ~90 Trillion (์ฝ 90์กฐ) ๋ฐ์ดํธ์ ๋๋ค. ์๋ง ํ ์ฌ๋์ด ์ด ํ ์คํธ๋ฅผ ๋ชจ๋ ์ฝ๋๋ค๋ฉด ์์ญ๋ง๋ ์ฏค ๊ฑธ๋ฆด ๊ฒ๋๋ค. ๋ฐ๋ฉด์, 4์ด์ง๋ฆฌ ์๊ธฐ๊ฐ ๋ฌด์ธ๊ฐ๋ฅผ ๋ณผ ๋ ์๊ฐํผ์ง๋ก ์ด๋น 2MB์ ๋ฐ์ดํฐ๊ฐ ์ฒ๋ฆฌ๋๋ฉด์ ํ์ต์ ํ๋ค๊ณ ํด ๋ณด์ฃ . ์๊ธฐ๊ฐ ๊นจ์ด์๋ ์๊ฐ์ด 4๋ ๊ฐ 16,000 ์๊ฐ ์ ๋๋ผ๊ณ ํ๋ฉด, ์ด ๋ฐ์ดํฐ๋์ด 115์กฐ ๋ฐ์ดํธ ์ ๋ ๋๊ฑฐ๋ ์. 4์ด์ง๋ฆฌ ์๊ธฐ ํ๋๊ฐ ๋ณด๊ณ ํ๋ จํ๋๋ฐ ์ฐ์ธ ์๊ฐ ๋ฐ์ดํฐ๊ฐ ์ธ๋ฅ๊ฐ ์ง๊ธ๊น์ง ๋ง๋ ํ ์คํธ ๋ฐ์ดํฐ ์ ์ฒด์ ๋น์ทํ ์ ์ด์ฃ .โ
์ฌ๋์ด ๋ง๋ ๋ฐ์ดํฐ๊ฐ ์๋๋ผ, AI ๊ฒฝํ์ด ์๋ก์ด ์์ (New Oil)๊ฐ ๋ฉ๋๋ค. ์ด๊ฒ ์ฐ๋ฆฌ์๊ฒ ์๋ฏธํ๋ ๋ฐ๋ ๋ฌด์์ผ๊น์?
โ์ฌ๋์ด ๋ง๋ ๋ฐ์ดํฐ์ ์๋โ์์ โ๊ฒฝํ์ ํตํด์ ํ์ตํ๋ ์๋โ๋ก
๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ, ์ฆ LLM์ ์ธํฐ๋ท์ด๋ผ๋ ๋งค์ฒด๋ก๋ถํฐ โ๋ฐ์ดํฐโ๋ผ๋ ๋จน์๊ฐ์ ๋ง ๊ทธ๋๋ก โํ๋โํ๋ฉด์ ์ฑ์ฅํ๋ค๊ณ ํด๋ ๊ณผ์ธ์ด ์๋ ๊ฒ๋๋ค. ์ฌ๊ธฐ๋ค ์๋ง์ โํฌ๋ผ์ฐ๋ ์์ฑโ์ ํตํด์ ๋์๋ ์ฌ๋๋ค์ด ํฉ์ฌํด์ ํ์ธํ๋์ ํด ์์ฃ . ์ ๊ตฌ์ถ๋์ด ์๋ ์ด ํ์ดํ๋ผ์ธ์ ๊ด๋ฒ์ํ ์์ญ์์ LLM์ด ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์ด๊ฒ๋ ๋ง๋๋๋ฐ ํฐ ๊ณตํ์ ํด ์์ง๋ง, ๊ฒฐ๊ตญ ์์กฐ๊ฐ๊ฐ ๋๋ ํ ํฐ์ผ๋ก ํ๋ จํ๋ ๋ชจ๋ธ์์์กฐ์ฐจ ์ฐ๋ฆฌ๊ฐ ๊ทธํ ๋ก ๊ฐ๋งํ๋ โ์ด์ธ์ ๋ฅ๋ ฅโ์ ๋ณด์ฌ์ฃผ๋๋ฐ๋ ํ๊ณ์ ๋ง๋ฅ๋จ๋ฆฐ ๊ฒ์ฒ๋ผ ๋ณด์ ๋๋ค: ์๋ก์ด ์ฆ๋ช ์ ํด ๋ธ๋ค๋ ๊ฐ, ํน์ ํ ๊ณผํ์ ํ ํฝ์์ ๋ํ๊ตฌ๋ฅผ ๋ง๋ค์ด๋ธ๋ค๋ ๊ฐ ํ๋ ๊ฒ๋ค์์์.
์ด์ฉ๋ฉด, ์ฌ๋์ด ๋ง๋ค์ด ๋์ ๋ฐ์ดํฐ๋ฅผ โ์๊ธฐโํ๋ ๋ฐฉ๋ฒ์ผ๋ก๋, ๊ฒฐ๊ตญ ์ฌ๋์ด ๋๋ฌํ ๊ฑฐ๋ฆฌ์ ๊น์ด๊น์ง๋ง AI๊ฐ ๋๋ฌํ ์ ์๋๋ก ํด ์ฃผ๋ ํ๊ณ๊ฐ ์๋ ๊ฒ ์๋๊น์?
๋ฐ์ด๋น๋ ์ค๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋ฆฌ์ฒ๋ ์ํผ ๋ ์ฌ๋์, ์ด๋ฐ ํ๊ณ๊ฐ ๋ฐ๋ก โ๊ตฌ์กฐ์ ์ธ ํ๊ณโ, ์ฆ ๊ทผ๋ณธ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ํ๊ณ๋ผ๊ณ ์ฃผ์ฅํ๊ณ ์์ต๋๋ค. AI ๋ชจ๋ธ์ ๊ฐํํ์ต์ผ๋ก ์ต์ ํํ๋ ๋ฃจํ๋ฅผ โStack Exchangeโ์์ โ์ค์ ์ ์ธ๊ณ - ๋๋ ๊ทธ์ ๊ทผ์ ํ๊ฒ ํ๋ถํ ์๋ฎฌ๋ ์ด์ ์ ํ ์ ์๋ ๊ฐ์์ ์ธ๊ณโ๋ก ์ฎ๊ธด๋ค๊ณ ์๊ฐํด ๋ด ์๋ค. ๊ฐํํ์ต์ ๋ณด์ ์ฒด๊ณ๋ โ์ฌ๋์ด ๋๋ฅด๋ ํด๋ฆญโ์ด ์๋๋ผ ์ค์ - ๋๋ ์ค์ ์ ๊ฐ์ ๊ฐ์ ์ธ๊ณ - ์์์ ํ๋์ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ์์ง์ผ ๊ฒ๋๋ค. ์ด๋ ๊ฒ ํ์ตํ๋๋ก ๋ง๋ค์ด์ง AI ์์คํ ์, ์ญ์ฌ์ ์ฌ์ค์ ์ธ์ฐ๋ ๋์ ํ๋์ ํด ๋ณด๊ณ , ๊ด์ฐฐํ๊ณ , ๋ฐ๋ณตํ๋ฉด์ ๋ฐฐ์๊ฐ๋ ์์ด์ ํธ์ผ ๊ฒ๋๋ค.
์ด ์๋ก์ด ๊ฒฝํ์ ์๋๋ฅผ ์ ์ํ๋ ๋ค ๊ฐ์ง ์ค์ํ ์์๋:
ํ์๋์ ์งํ๋๋ ์ฐ์์ ์ธ ๊ฒฝํ (Streams of Lifelong Experience)
์ผ์์ ์ง๊ฐ ๋ฅ๋ ฅ๊ณผ ๊ฒฐํฉ๋ ๋ชจํฐ์ ํ๋ (Sensor-Motor Actions)
์ฌ๋์ ๊ฐ์ ์์ด ํ๊ฒฝ์์ ์ง์ ๊ฒฝํํ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅธ ๋ณด์ (Grounded Rewards)
๋น ์ธ๊ฐ์ ์ธ ๋ชจ๋์ ๋ฐฉ์์ ์ถ๋ก (Non-human modes of Reasoning)

Image Credit: Welcome to the Era of Experience ๋ ผ๋ฌธ
์ด๋ ๊ฒ ๋ค ๊ฐ์ง ์์๋ค์ด ์ ์๋ฆฌ์ก๋๋ค๋ฉด, ์ค์ ๋ก ๋ญ๊ฐ ๋ฐ๋๋ ๊ฑธ๊น์?
์ค์ ๋ก ๋ฐ๋ ๊ฒ๋ค. ์ค์ ์ฒดํฌ!
โ๊ฒฝํ์ ์๋โ์ ์ผ์ด๋ ๋ณํ๋, ๊ทธ์ ์ฒ ํ์ ์ธ ์์ค์ ๊ฒ๋ค์ด ์๋๋ผ, ์ฐ๋ฆฌ๊ฐ ์ง๊ธ๊น์ง ๊ตฌ์ถํด ์จ AI์ โํ์ดํ๋ผ์ธโ ๋ ๋ฒจ์์์ ํฐ ๋ณํ์ ๋๋ค.
๋ฉ๋ชจ๋ฆฌ ์ธํ๋ผ์คํธ๋ญ์ณ ์ฑ๊ฒฉ์ ๋ณํ
์ง๊ธ๊ณผ๋ ๋ฌ๋ฆฌ, ์์ด์ ํธ๋ค์ ๋ํ ํ๋ จ์ โํ ๋ฒ ํฌ๊ฒ ํ๊ณ ๊ทธ ์ดํ์ ํ๋ฆฌ์ฆ (Freeze)โํ๋ ๋ฐฉ์์ ๋ฐ๋๊ฒ ๋ ๊ฒ๋๋ค. ์ฃผ ๋จ์, ์ ๋จ์, ์ฐ ๋จ์์ ๊ฑธ์ณ์ ๊ธฐ์ต์ ๊ณ์ํด์ ์ถ์ ํ ๊ฑฐ์์. ํ์ง๋ง ๋ ๋ค๋ฅธ ํ ํธ์ผ๋ก๋, ์ด๋ ๊ฒ โ์ ๋ ๋ง๊ฐ์ ๋ชจ๋ฅด๋โ ์์ด์ ํธ์ด๊ธฐ ๋๋ฌธ์ ์คํ๋ ค ์์ ์ ๊ณผ๊ฑฐ๋ฅผ โํ๋ ์ด์ โํ ํ์๋ ์์ต๋๋ค. ์ค์ํ ์๊ฐ๋ง์ ์์ถํ๊ณ , ํ๊ทธํ๊ณ , ๋ณต์ตํ๋ ๋ฉ๋ชจ๋ฆฌ ์ฆ๋ฅ๊ธฐ (Memory Distillers)๊ฐ ๋ ์ค๋ฅด๊ฒ ๋ ๊ฒ๋๋ค.UX๋ก์์ ๋ณด์ ์ฒด๊ณ, ๋ณด์ ์ฒด๊ณ๋ก์์ UX
์ด ๊ฐ๋ ์ ์ ์๊ฐํด ๋ด์ผ ํ๋๋ฐ์. ์ง๊ธ ๊ธฐ๊ปํด์ผ โ์์ง ์ฒ!โ ์ด๋ชจํฐ์ฝ ์ ๋์ ๋จธ๋ฌด๋ฅด๊ณ ์๋ ํผ๋๋ฐฑ ์์คํ ์ด ์ค์ธ๊ณ์ ์๋ง์ ์ ํธ๋ค - ํ์, ๋น๊ธฐ๋ ๊ฐ๋, ์ค์ฐจ ๋ฒ์ ๋ฑ - ์ ํฌํจํ๋๋ก ํ์ฅ๋์ด์ผ๊ฒ ์ฃ . โํ๋กฌํํธ ์์ง๋์ด๋งโ์ โ๋ณด์์ ์ค๊ณํ๋ ์์ โ์ผ๋ก ๊ทธ ์ฑ๊ฒฉ์ด ๋ณํด์ผ ํ ๊ฒ๋๋ค. โ์ ํ ์ค๊ณโ๋ผ๋ ์์ ์ด ์ธํฐํ์ด์ค์ ๋ํ ์ง๊ด๊ณผ ์ค์ธ๊ณ์ ์์ ๊ฒฐ๊ณผ๋ฅผ ํผํฉํ๋ ์์ ์ด ๋ ๊ฒ๋๋ค.โ์ฌ์ ํ๋ จโ์ผ๋ก์์ ์๋ฎฌ๋ ์ด์
์์ด์ ํธ๊ฐ ์๋ฅผ ๋ค์ด ๊ธฐํ ์ ์ฑ ์ ๊ฒฐ๊ณผ๋ผ๋ ๊ฐ ์๋ช ๊ณตํ๊ณผ ๊ฐ์ ์์ญ์ ์ดํ๋ฆฌ์ผ์ด์ ์ ์ด์ฉํ๊ธฐ ์ ์, ํฉ์ฑ๋ ์๋ฎฌ๋ ์ด์ ์ธ๊ณ์์ ์ฌ์ ํ๋ จ์ ํ๋ ๊ฒ ์ผ๋ฐํ๋ ๊ฒ๋๋ค. ์ผ์ข ์, โ๊ณผํ ์คํ์ฉ ์ฌ์ํฐโ ๊ฐ์ ๊ฑฐ๋ผ๊ณ ํ ๊น์? ์์ด์ ํธ๊ฐ ์คํํ๋ฉด์ ์คํจ๋ ํ๊ณ , ๊ทธ ๊ณผ์ ์์ ๋ฐ์ ์ ํ๋ฉด์ ์ค์ค๋ก ์ ๋ฐ์ดํธ๋ฅผ ํ๋, ์คํ์ค์ด์ฃ . ์์ด์ ํธ๊ฐ ๋ ๋๋ํด์ง์๋ก, ์๋ฎฌ๋ ์ดํฐ๋ ๋ ์ข์์ง๊ตฌ์, ์ด๋ฐ ํผ๋๋ฐฑ ๋ฃจํ๊ฐ ๋ฐ๋ก ๊ฒฝ์๋ ฅ์ ํต์ฌ์ด ๋ฉ๋๋ค. ๋ฌผ์ง, ๊ธฐํ, ์๋ฌผํ ๊ฐ์ด ์ค์ ์ธ๊ณ์์ ํ์์ด ์ผ์ด๋๊ณ ๋ฐ๋ณต๋๋๊ฒ ์๋์ ์ผ๋ก ๋๋ฆฐ ๋ถ์ผ๋ผ๋ฉด, ์๋ฎฌ๋ ์ด์ ์ ํตํ ๋ฐฉ๋ฒ์ด ๋ฐ์ ์ ๊ฐ์ํํ๋ ์ข์ ๋ฐฉํธ์ด ๋ฉ๋๋ค.
์ธ๋ป ๋ด์๋ ๋์ ๋์ง ์์, ๊ทธ๋ ์ง๋ง ์ค์ํ ํฌ์ธํธ๋ค
๋๋ก๋, โ๋์ ๋์ง ์๋โ ๊ฒ๋ค์ด ๋ ์ค์ํ์ฃ - โ๊ฒฝํ์ ์๋โ์ ์ผ์ด๋ ํ์ดํ๋ผ์ธ์ ๋ณํ ๋ชป์ง ์๊ฒ, ๊ทธ ์ด๋ฉด์ ์ฐ๋ฆฌ๊ฐ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ด๊ณ ๋์์ ์ค๋นํด์ผ ํ ๋ณํ๋ค์ด ์์ต๋๋ค:
๊ฒฝํ์ ์ ๋์ฑ (Experience Liquidity)
์ค๋๋ ์ ๋ฐ์ดํฐ ๋ธ๋ก์ปค๋ค์ด, ๋ง ๊ทธ๋๋ก, โ๋ฐ์ดํฐ๋ฅผ ํ๋งคโํ๋ค๋ฉด, ๋ด์ผ์ ๋ธ๋ก์ปค๋ค์ โ๊ถค์ (Trajectories) - ์ฆ ๊ฒฝํโ์ ํ๋งคํ๊ฒ ๋ ๊ฒ๋๋ค. ์ฌ๋์ด ๋ง๋ ๋ฐ์ดํฐ์ ์๋์๋, ๋ฐ์ดํฐ์ ๋๋ฏธ์ ๊ทธ ๊ฐ์น๊ฐ ์์์ง๋ง, ๊ฒฝํ์ ์๋์๋ ๋ณด์ ์ฑ๋, ๊ทธ๋ฆฌ๊ณ ๊ทธ๊ฑธ ์์ฑํ๋ ํ๊ฒฝ์ ํต์ ํ๋ ์ธก์ผ๋ก ๊ทธ ๊ฐ์น๊ฐ ์ด๋ํฉ๋๋ค.์๋ ๋ชจ๋ธ์ ๋ํ ๊ฐ์ฌ (World-Model Audits)
์์ด์ ํธ๊ฐ ์ค์ค๋ก ๋ค์ ๋จ๊ณ์ ์์ ์ ๊ณํํ๊ธฐ ์ํ, ๊ทธ๋ฐ ๊ด์ ์์ ๋ฏธ๋๋ฅผ ์์ํ๋ค๊ณ ์๊ฐํด ๋ณด์ฃ . ๊ทธ๋ฐ ์ธ์์์, ์ฐ๋ฆฌ์๊ฒ๋ ๊ทธ โ์์ด์ ํธ๊ฐ ์์ํ ๋ฏธ๋โ์ ๋ํ ๊ฐ์์ฑ (Visibility)์ด ํ์ํ ๊ฒ๋๋ค. ์๋ฅผ ๋ค๋ฉด, โ์์ด์ ํธ๊ฐ ๊พธ๋ ๊ฟ์ ๋ํด์ ์ค๋ช ํ ์ ์๋ AI ๋์๋ณด๋โ ๊ฐ์ ์๋ก์ด ๋๊ตฌ๊ฐ ๋ฑ์ฅํ ๊ฒ๋๋ค. ์์ด์ ํธ๊ฐ ์ ๊ทธ๋ ๊ฒ ์์ง์ผ๊น, ์ ๊ทธ๋ฐ ์๋ฎฌ๋ ์ด์ ๊ถค์ ์ ์ ํํ๋ ๋ฑ์ ์ค๋ช ํ๋ ๋๊ตฌ๋ค์ด์.์์๋ ํธ๊ธฐ์ฌ, ์์๋ ์ํ (Delegated Curiosity, Delegated Risk)
์ฃผ๋ณ๊ณผ ํ๊ฒฝ์ ํ์ํ๋๋ก ์๋ฌด๋ฅผ ๋ถ์ฌ๋ฐ์ ์์ด์ ํธ๋ค์, ๋๋๋ก โ์์์น ๋ชปํ ๋ฌด์ธ๊ฐโ๋ฅผ ๋ฐ๊ฒฌํ๊ฒ ๋ ๊ฑฐ์์ - ์ด๋ค ๊ฑด ํฐ ์ํฅ์ ๋ผ์น ์ ์๊ณ ๋๋ก๋ ์ํํ ๋ญ๊ฐ๋ ์๊ฒ ์ฃ . 2016๋ , ์ํ๊ณ ์ ์ด์ธ๋์ ๋๊ตญ์์ ์ํ๊ณ ๊ฐ ๋์๋ 37๋ฒ์งธ ์๋, ์์ํ๊ธฐ๋ ์ด๋ ค์ ์ง๋ง ์ด๋ป๊ฒ ๋ด๋ โ์ํํ ๊ฑด ์๋โ์์ฃ . ๊ทธ๋ ์ง๋ง, ์ด๋ค ์ฐ๊ตฌ์์์ ์ฌ์ฉํ๋ โํํ ์ ๋ฌผ์ง ๊ฐ๋ฐ ์์ด์ ํธโ๊ฐ ์์ง ์ฐ๋ฆฌ๊ฐ ์ดํดํ์ง ๋ชปํ๋ ๋ฌผ์ง์ ๋ฐ๊ฒฌํ๋ค๊ณ ํ๋ฉด, ์ด๋จ๊น์?
๋ช ๋ฐฑํ, ๊ทธ๋ฆฌ๊ณ ๊ทธ ์ด๋ฉด์ ๋ณํ๋ฅผ ์ดํดํ๋ ๊ฒ์ด ์ ์ค์ํ๊ฐ
์์ด์ ํธ์๊ฒ ํ์ค์ ๋ํด ๊ฒฝํํ ์ ์๋ ํ๋ถํ ์ ๋ณด๋ฅผ ์ ๊ณตํด ์ค ์ธํฐํ์ด์ค, ํ์๊ณผ ์คํ์ ์ฅ๋ คํ ๋งํ ์ ์ฐํ ๋ณด์ ์์คํ , ๊ทธ๋ฆฌ๊ณ ์ถฉ๋ถํ ์๊ฐ์ ์ค๋ค๋ฉด, ์ง๊ธ๊น์ง ์ฐ๋ฆฌ๊ฐ ๋ง๋ค์ด ์ค ๋ฐ์ดํฐ์ ๋ฒ์, ๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๊ฐ ์๊ฐํ ์ ์๋ ์ถ๋ก ์ ์คํ์ผ ๋ชจ๋๋ฅผ ๋ฐ์ด๋๋ ์์ด์ ํธ๊ฐ ๋ถ๋ช ํ ํ์ํ ๊ฑฐ๋ผ๊ณ ์๊ฐํฉ๋๋ค.
๋น์ฅ โํ์ดํ๋ผ์ธโ์ ๊ด์ ์์๋, ๊ฐ๋ฐ์๋ค์๊ฒ ํฐ ํจ์์ ์์ฌ์ ์ด ์์ ๊ฑฐ์์. โํ๋กฌํํธ ๋ผ์ด๋ธ๋ฌ๋ฆฌโ๊ฐ ์๋๋ผ โ๊ฒฝํ์ ํ์ดํ๋ผ์ธโ์ ๊ตฌ์ถํ๋ ์ชฝ์ผ๋ก ์ ํ์ ํด์ผ ํ ํ ๊ตฌ์. AI๋ฅผ ๊ฐ๋ฅด์น๋๋ฐ ์ผ๋, ๊ณ ์ ๋ ๋ง๋ญ์น๋ ์ด์ ๋ฒ๋ฆฌ๊ณ โ์งํํ๋ ํ๊ฒฝโ์ ์ค๋นํด์ผ ํ ๊ฒ๋๋ค. ์๋ค๊ฐ๋คํ๋ ์ฑํ ์ธ์ ์ด ์๋๋ผ โ์ง์์ ์ธ ํ์ต์ ํ ์ ์๋ ๋ฃจํโ๋ฅผ ์ค๊ณํด ์ฃผ์ด์ผ ํ๊ฒ ์ฃ . ์ด๋ ๊ฒ ๋ง๋ค์ด์ง ์์ด์ ํธ, ์๋ฅผ ๋ค์ด ๋ค์ ๋ฒ์ ์ โ์ํ์ ๋กโ๋ผ๋ฉด, ๊ทธ๋ฅ ๋ฐ๋ ๊ฒ์์์ ์ฐ์นํ๋๊ฒ ์๋๋ผ, ๋ณด๋๋ฅผ ์๋ก ๋์์ธํ๊ณ , ๊ท์น์ ๋ค์ ์ค๊ณํ๊ณ , ๋น์ ์ด ์์นจ์์ฌ ๋ง์น๊ธฐ ์ ์ ์๋ง ์๋ง ๋ฒ์ ๊ณ์ ๋ณํ๋ฅผ ์๋ฎฌ๋ ์ด์ ํ ๊ฒ๋๋ค.
์ด๋ ๊ฒ ์ฐ๋ฆฌ์ ์ธ์, ํ๋, ๊ฒฐ๊ตญ ๋ฌธํ๋ฅผ ํ์ฑํ๋๋ฐ๊น์ง๋ ์ํฅ์ ๋ฏธ์น AI์ ์ฐ๋ฆฌ, ์ฌ๋๊ณผ AI์ Co-Agency๋ ์ด๋ป๊ฒ ๋ง๋ค์ด๊ฐ์ผ ํ ๊น์? ์ด ์ง๋ฌธ์ ์์ผ๋ก โ(์ฐ๋ฆฌ๊ฐ ํด์จ ๊ฒ๊ณผ๋ ๋ค๋ฅธ ์ฐจ์์) ๊ฒฝํ์ ์๋โ๋ฅผ ๋ง์ดํด์ ์์ผ๋ก ์ฐ๋ฆฌ๊ฐ โ์ฌ๋์ผ๋ก์โ ๋ตํด์ผ ํ ๊ณผ์ ์ ๋๋ค.
๊ฒฝํ์ ์๋, ์ด์ ๋ฌธ์ ์ด๊ณ ์๋ ์ด ์๋์ ๋ํ ๊ธฐ๋๋ฅผ ๋ด์, ๋ฐ์ด๋น๋ ์ค๋ฒ, ๊ทธ๋ฆฌ๊ณ ๋ฆฌ์ฒ๋ ์ํผ์ ๋ง์ ์ธ์ฉํ๋ ๊ฒ์ผ๋ก ์ค๋์ ๊ธ์ ๋ง๋ฌด๋ฆฌํ ๊น ํฉ๋๋ค:
โ์ฐ๋ฆฐ ์ค๋๋ ์ ๊ธฐ์ ์ด, ์ ์ ํ๊ฒ ์ ํ๋ ์๊ณ ๋ฆฌ์ฆ๊ณผ ํจ๊ป, ์ด๋ฏธ ์ด๋ฐ ๋ํ๊ตฌ๋ฅผ ๋ฌ์ฑํ๊ธฐ์ ์ถฉ๋ถํ ๊ฐ๋ ฅํ ๊ธฐ๋ฐ์ ์ ๊ณตํด ์ค๋ค๊ณ ๋ฏฟ์ด ์์ฌ์น ์์ต๋๋ค. AI ์ปค๋ฎค๋ํฐ๊ฐ ํฉ์ฌํด์ ์ด ์์ ๋ค๋ฅผ ๊ฒํ ํ๊ณ ์ถ๊ตฌํ๋ค๋ฉด, ์ง๊ธ๊น์ง์๋ ์ ํ ๋ค๋ฅธ ์๋ก์ด ํ์ ์ ์ด์งํ๋ฉด์ AI๋ฅผ ์ง์ ์ด์ธ์ ์ธ ์์ด์ ํธ๋ก ๋น ๋ฅด๊ฒ ๋ฐ์ ์ํฌ ์ ์์ ๊ฒ๋๋ค.โ
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
RAG ๊ธฐ๋ฒ์ ์งํ, ๋์ด ์๋ ๊ฒ ๊ฐ๋ค์. AI ๊ธฐ์ ์ด ๋์์ด ๋น ๋ฅด๊ฒ ์งํํ๋ ๊ฒ๊ณผ ๋ฐ๋ง์ถ๋ฏ์ด ๋ง์ด์์. ์ต๊ทผ ๋ฑ์ฅํ๋ RAG ๊ธฐ๋ฒ๋ค์, ์ข ๋ โ์์ด์ ํฑโํ๊ฒ ๋๊ณ ์์ ๋ฟ ์๋๋ผ, ํ์ดํผ๊ทธ๋ํ ๊ฐ์ ๋ณต์กํ ๊ตฌ์กฐ๋ฅผ ์ข ๋ ๋๋ํ๊ฒ ๋ค๋ฃฐ ์ ์๋๋ก ๋ฐ์ ํ๊ณ ์์ต๋๋ค.
์ค๋์, 11๊ฐ์ง ์ต์ ์ RAG ์ ํ์ ๋ํด์ ์์๋ณด๊ฒ ์ต๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
On Jagged AGI: o3, Gemini 2.5, and everything after by Ethan Mollick
o3, Gemini 2.5 ๊ฐ์ ์ต์ ์ AI ๋ชจ๋ธ, ์์ฒญ๋, ๋๋ผ์ด ๊ธฐ๋ฅ์ ๋ณด์ฌ์ฃผ์ฃ . (o3์ ๋ํด์๋ ๊ฐ๋ก ์๋ฐ์ด ๋ง์ง๋ง์) ๊ทธ๋ ์ง๋ง ๋ชจ๋ ๋ฉด์์ ๊ท ์ผํ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์ง๋ ์์ต๋๋ค. ์์ฃผ ๋ณต์กํ ๋ฌธ์ ๋ ์ ํ๋ค๊ฐ๋, ์์ฃผ ๋จ์ํ ๊ทธ๋ฆผ์ผ๋ก ํธ๋ ์ํ ๊ฐ์ ๋ฌธ์ ๋ ๋ ์์ฒญ๋๊ฒ ๋ชป ํ๊ธฐ๋ ํ์ฃ .
AGI - ์ด๊ฒ ๋ญ๋์ ๋ํด์๋ ์ญ์ ๋ชจ๋๊ฐ ํฉ์ํ ์ ์๋ ์ ํํ ์ ์๋ ์์ง๋ง, ๋๋ต โ์ฌ๋ ์์ค์ ์ง๋ฅโ์ด๋ผ๊ณ ํ๋ฉด - ์ ๋ํด์๋ ์ญ์ โJagged AGI (๋ค์ญ๋ ์ญํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ AGI)โ๋ผ๋ ๊ฐ๋ ์ ์๊ฐํด ๋ณผ ์ ์๋ค๊ณ Ethan Mollick์ ์ด์ผ๊ธฐํ๊ณ ์๋๋ฐ์. ์ค์ ๋ก๋ ์ด๋ฐ ๊ตฌ๋ถ ๊ทธ ์์ฒด๋ณด๋ค๋, AI๊ฐ ์ด๋ค ์ํฅ๋ ฅ์ ์ฌํ์ ๋ฏธ์น ๊ฒ์ด๊ณ , ์ด๋ป๊ฒ ์ฌํ์ ํตํฉ๋ ๊ฒ์ธ์ง์ ๋ํ ์ฐ๊ตฌ์ ๊ฒํ ๊ฐ ๋ ์ค์ํ๋ค๊ณ ๋งํ๊ณ ์์ต๋๋ค.
์๋, ์ฌํ์ ์กฐ์ง์ ๊ตฌ์กฐ๋ ๊ธฐ์ ์์ฒด๋ณด๋ค ํจ์ฌ ์ฒ์ฒํ ๋ณํํ๊ธฐ ๋๋ฌธ์, ์ด๋ค ์ ๊ธฐ์ ์ด๋ผ ํ๋๋ผ๋ ์ฌํ๋ฅผ ์ง๋์น๊ฒ ๊ธ์ํ๊ฒ ๋ณํ์ํค๊ธฐ๋ ์ฝ์ง ์์ต๋๋ค. ๊ทธ๋ ์ง๋ง, (ํนํ ์ต์ ์) AI ๊ธฐ์ ์ โ์์ด์ ํธโ๋ก์ ํน์ฑ์ ๊ฐ์ง๊ณ ์์ด์, ๊ณผ๊ฑฐ์ ๊ธฐ์ ์ฒ๋ผ โํตํฉโ์ ์๊ธฐ๊ฐ ํ์์์ด ์ง์ โ์ฌ๋์ด ๋ง๋ค์ด๋์โ ์์คํ ์ ํ์ํ๊ณ ์ ์ํด ๊ฐ ์ ์๊ฒ ๋๋ค๋ฉด - ๊ทธ๋ฆฌ๊ณ ์ง๊ธ, ๊ทธ๋ด ๊ฐ๋ฅ์ฑ์ด ๋ณด์ด๊ณ ์์ฃ - , ํจ์ฌ ๊ทธ ์ํฅ๋ ฅ์ ์ ํ์ ๊ฐ์๋๊ฐ ๋ถ์ ๊ฒ๋๋ค.
์์ง์ ๋ฏธ์ง์ ์์ญ, ๊ทธ ๋ฏธ๋๊ฐ ์ด๋ป๊ฒ ์ ๊ฐ๋๋ , ์ด ๋ฏธ์ง์ ์์ญ์ ํ์ํ๋ ๋ฒ์ ๊ณ์ํด์ ์ฒด๋ํด ๊ฐ๋ ์ฌ๋๋ค์๊ฒ ์ ๋ฆฌํ ๋ฏธ๋๊ฐ ์ค๊ณ ์๋ค๊ณ Ethan Mollick์ ์ด์ผ๊ธฐํฉ๋๋ค.
Seven Lessons from Building with AI by The Exponential View
์ผํผํ์ด์ CEO, ํ ๋น ๋คผํธ์ผ์ ๋ฉ๋ชจ์ ๋ํด์ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์์๋ ํ ๋ฒ ๋ค๋ฃฌ ์ ์ด ์์ต๋๋ค:
์ด ๋ฉ๋ชจ๊ฐ ํฐ ๋ฐํฅ์ ์ผ์ผํจ ์์ค์ ๋ง์ ๋ถ๋ค๊ป ๊ทธ๋๋ ๊ณต๊ฐ์ ์ป์ ๋ฐ๊ฐ ์๋ ๊ฒ์, ์๋ง๋ ์กฐ์ง์์ ์ด์ AI๋ฅผ ํตํฉํ๋ค๋ ๊ฒ์ด ์ง์ง๋ก ๋ญ ์๋ฏธํ๋์ง - ๋จ์ํ ๋ถ๊ฐ ๊ธฐ๋ฅ์ผ๋ก์๊ฐ ์๋๋ผ, ์ด์ ๋ชจ๋ธ์ ๊ทผ๋ณธ์ ์ผ๋ก ํตํฉํด์ผ ํ๋ค๋ ๊ฒ - ๋ฅผ ์ธ์ํ๊ฒ ๋ ๊ณ๊ธฐ๊ฐ ๋์๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.
Exponential View ํ์์๋ ์ด๋ฐ ๋ง์ธ๋์ ์ผ๋ก ์ค์ค๋ก ์ผํ๋ ๋ฐฉ์์ ์ฌ๊ตฌ์ฑํ๋ ๋ ธ๋ ฅ์ ํ๊ณ ์๋ค๊ณ ํ๋๋ฐ์. ์ต๊ทผ ๋ช ์ฃผ ๋์ LLM, ์๋ํ ๋๊ตฌ ๋ฑ์ ๋์ํด์ AI๋ฅผ ์ํฌํ๋ก์ฐ์ ํตํฉํ๊ณ ์๋ก์ด ์ํฌํ๋ก์ฐ๋ฅผ ์ค๊ณํ๋ ๊ณผ์ ์ ํตํด์ ์ป๊ฒ ๋ 7๊ฐ์ง ๊ตํ์ ๋ํด์ ์ด์ผ๊ธฐํ๋ ๊ธ์ ๋๋ค.
CBS์ 60 Minutes์์ ์งํํ, ๋ฅ๋ง์ธ๋ CEO ๋ฐ๋ฏธ์ค ํ์ฌ๋น์ค์์ ์ธํฐ๋ทฐ์ ๋๋ค. ๋ณธ์ธ์ ๋ํ ์ด์ผ๊ธฐ, AI์ ๋ฏธ๋, AI๊ฐ ๊ฐ์ ธ๋ค ์ค ํํ๊ณผ ์ํ ๋ฑ์ ๋ํด ๊ด๋ฒ์ํ ์ด์ผ๊ธฐ๋ฅผ ๋๋๋๋ค. AI ์ ๋ฌธ๊ฐ๊ฐ ์๋๋ผ๋, AI์ ๋ํด์ ์ ๋ฐ์ ์ผ๋ก ๊ถ๊ธํด ํ๋ ์ฃผ๋ณ์ ๋๊ตฐ๊ฐ๊ฐ ์๋ค๋ฉด ์ถ์ฒํด ์ฃผ์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
๊ธ์ฃผ ์ ๊ณ ๋ํฅ์ โ์คํAIโ์ ๊ด๋ จํด์ ์์์ง ๋ด์ค๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค:
์คํAI - ๋ชจ๋ธ, ๋ชจ๋ธ, ๋ชจ๋ธ
๋จผ์ , ์คํAI๊ฐ GPT-4.1 full, mini, nano ๋ฒ์ ์ ์ถ์ํ์ต๋๋ค - ๋ ์ ๋ ดํ๊ณ , ๋ ๋น ๋ฅด๊ณ , ๊ตฌ๊ธ์ด ๋จผ์ ๋๋ฌํ, โ๋ฐฑ๋ง ํ ํฐโ ์ฌ์ด์ฆ์ ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ๋ฐ๋ผ์ก์์ต๋๋ค. API๋ฅผ ํตํด์ ์ฌ์ฉ์ด ๊ฐ๋ฅํ์ง๋ง, ์ฌ๋ฏธ์๊ฒ๋ ์ฑGPT์์๋ ์ฌ์ฉํ ์๊ฐ ์๋๋ฐ์. ์ด๊ฑด ์ด์ ์ ์ ์ํธ๋ง์ด ์ฝ์ํ๋ ๊ฒ๊ณผ ๋น๊ตํ๋ฉด ์ด์ง์ ํํดํ ๋ชจ์ต์ด ์๋๊ฐ ํฉ๋๋ค. ํํธ, Codex CLI๊ฐ ํฐ๋ฏธ๋์ฉ์ผ๋ก ์ธ๋งํ, ๊ฐ๋ณ๊ณ ๋น ๋ฅธ ์คํ์์ค ์ฝ๋ฉ ํํธ๋๋ก ๋ฐ๋ทํ์ต๋๋ค. Claude Code์ ๊ฒฝ์ํ๊ฒ ๋ ๊ฒ ๊ฐ๋ค์.

โ์๋๋ค.โ Image Credit: Cursor Forum
์ด์ด์, ์คํAI๋ o3์ o4-mini๋ฅผ ๋ด๋จ์ฃ - ์ด๊ฒ ์ธํฐ๋ท์ โ๋ฐ์นตโ ๋ค์ง์ด ๋จ๋ค๊ณ ํด๋ ๋ ๊ฒ ๊ฐ์๋ฐ์. ์ผ๋จ์, ์คํAI๊ฐ โ์์ด์ ํฑโ AI๋ฅผ ํฅํด์ ๋ด๋์, ๊ทธ ๋์์ ๊ฐ์ฅ ๋๋ดํ ํ ๋ฐ์ด๋ผ๊ณ ํด ๋ณด๊ฒ ์ต๋๋ค. ์ ๋๋ก ๋ ๋๊ตฌ ์ ๊ทผ ๊ถํ, ์๊ฐ์ ์ธ ๋ฅ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ๋ณต์กํ ์์ ์ ๋ํด์ ํ์ธต ๋์ ์ดํด๋ ฅ์ ๊ฐ์ถ๊ณ ๋ฑ์ฅํ๊ณ , ์ถ๋ก , ํจ์จ์ฑ, ์์จ์ ์ธ ํ๋ ๋ฑ์ ๊ด์ ์์ ์ค์ง์ ์ผ๋ก ๋์ ๋ชจ์ต์ ๋ณด์ฌ์คฌ์ต๋๋ค.
๊ทธ๋ ์ง๋ง, ์ฌ๊ธฐ์ ๊ธฐ์ ๋ฌธ์ ๋ค๋ ๋ณด์์ต๋๋ค. Transluce์ ์ด๊ธฐ ํ ์คํธ๋ฅผ ์ดํด๋ณด๋ฉด, o3๋ ๋๋๋ก ๋๊ตฌ๋ฅผ ์ฌ์ฉํ ์ฒ ์ง์ด๋ ๋๋ค - ํนํ ์ง๋ฌธ ๋ต๋ณ์ ํ๋ ๊ณผ์ ์์ ์ด๋ฐ ์์์ ํ๋์ ๋ํด์ ๋ ๊ฐ๋ ฅํ ์ฃผ์ฅ์ ํ๊ณค ํฉ๋๋ค.

Image Credit: Transluce.org
GPT ์๋ฆฌ์ฆ์ ๋น๊ตํด ๋ณด๋ฉด, o-์๋ฆฌ์ฆ ๋ชจ๋ธ๋ค์ ํนํ ํ๊ฐ (Hallucination) ํ์์ ์ทจ์ฝํ ๊ฒ์ผ๋ก ๋ณด์ด๋๋ฐ, ์๋ง๋ โ๊ฐํํ์ต์ ์ด์ ์ ๋ง์ท๋ ๊ฒโ, ๊ทธ๋ฆฌ๊ณ โ๋ด๋ถ์ ์ธ ์ถ๋ก ์ ํฌ๋ช ์ฑ์ด ๋ถ์กฑโํ๋ฐ์ ๊ธฐ์ธํ๋ ๋ถ์์ฉ์ด๋ผ๋ ์๊ฒฌ์ด ์์ต๋๋ค.
ํํธ METR์ ํ๊ฐ๋ฅผ ๋ณด๋ฉด, o3๊ฐ ์์จ์ ์ธ ์์ ์ ๋ ๋ฅ์ํ๊ฒ ์ ํ๊ฒ ๋์๋ค๋ ์ฃผ์ฅ์ ๋ท๋ฐ์นจํ๊ธฐ๋ ํ์ง๋ง, ์๋ก์ด ์ฐ๋ ค๋ ๋ฑ์ฅํ์ต๋๋ค. o3๊ฐ ๋ฐ๋ณต์ ์ผ๋ก โ๋ณด์ ํดํนโ - ์ค์ ๋ก ๋ฌ์ฑํด์ผ ํ๋ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ์ง ์์ผ๋ฉด์๋ ๋์ ๋ณด์(Reward)์ ๋ฐ์ ์ ์๋ ๋ฐฉ๋ฒ์ ์ฐพ์๋ด๋ ํ์ - ์ ๊ด์ฌํ๋ ๋ชจ์ต์ด ๊ด์ฐฐ๋์๊ณ , ํ๊ฐ์๋ค์ ์ด ๋ชจ๋ธ๋ค์ด ์ด๋ค ๋ฅ๋ ฅ์ ์จ๊ธฐ๊ณ ์์์ง๋ ๋ชจ๋ฅธ๋ค๊ณ ๊ฒฝ๊ณ ํ๊ธฐ๋ ํ์ต๋๋ค. ์ด์ฉ๋ฉด ์ง๊ธ ์ฐ๋ฆฌ๊ฐ ์์กดํ๊ณ ์๋ ์์ ์ฑ ํ ์คํธ๋ ์ด๋ฏธ ๋๋ฌด ์ฌ์์ง ๊ฒ์ผ์ง๋ ๋ชจ๋ฅด๊ฒ ๋ค์.
Also notable from the @METR_Evals safety evaluation of o3 is that they found some pretty interesting examples of reward hacking, where the model intentionally cheated in tasks, even admitting as much in the chains of thought:
โ Agus ๐ ๐ธ (@austinc3301)
5:49 PM โข Apr 16, 2025
Interconnects์ Nathan Lambert๋, ์คํAI์ o3 ๋ชจ๋ธ์ด โ๊ฐํํ์ต์ ๊ธฐ๋ฐํด์ ๋ํ๋๋, ์๋ก์ด ์ข ๋ฅ์ ๊ณผ์ต์ ํ (Over-optimization)๋ฅผ ๋ณด์ฌ์ค๋ค๊ณ ์ด์ผ๊ธฐํฉ๋๋ค. o3๊ฐ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ค๋ ๊ฐ ๋ณต์กํ ์ถ๋ก ์ ๋ฐ์ด๋์ง๋ง, ์ด๋ฐ ์ด์ํ ํ๋๋ค์ ๋ณด์ฌ์ค๋ค๋ ์ ์ด ํฅ๋ฏธ๋กญ์ต๋๋ค.

Image Credit: Interconnect.ai
o3๋ฅผ ๋น๋กฏํ ๋ชจ๋ธ๋ค์ ๋ํ ๋ ผ์์ด ํ์ฐฝ์ผ ๋, ๊ฒฝ์ ํ์์ธ Tyler Cowen์ด o3๋ฅผ AGI๋ผ๊ณ ๊ฐ๋ณ๊ฒ ์นญํ๋ฉด์ โAGI๊ฐ ์ผ๋ง๋ ๋ ๋๋ํ๊ธฐ๋ฅผ ๊ธฐ๋ํ๋ ๊ฑด๊ฐ์?โ๋ผ๊ณ ์ด์ผ๊ธฐ๋ฅผ ํ์ต๋๋ค. ์ด ๊ธ์ด ๊ฒ์๋ ๊ฒ์ํ์ด ๋ ์์ฒญ๋๊ฒ ๋จ๊ฑฐ์์ก๊ณ , ๊ทธ๋๋ ๋ง์ ์ฌ๋๋ค์ โ์ง์ง AGI๋ ์ง๊ธ o3๊ฐ ๋ณด์ฌ์ฃผ๋ ๊ฒ๋ณด๋ค๋ ๋ ๊ด๋ฒ์ํ, ๋ ๊ฒฌ๊ณ ํ ๊ธฐ์ด ๋ฅ๋ ฅ, ๊ทธ๋ฆฌ๊ณ ๋ ๋์ ๊ฒฌ๊ณ ํจ์ ๋ณด์ฌ์ค์ผ ํ๋คโ๊ณ ์ด์ผ๊ธฐํ๊ณ ์์ต๋๋ค. ์ฌ๊ธฐ์ ์ด์ด์, ์คํAI์ ์ ์ต๊ณ ์ฐ๊ตฌ ์ฑ ์์์ธ Bob McGrew๋ โAGI์ ๋ํด์ ๋ ผํ ๋ ์ผ๋ง๋ ๋๋ํ๋๊ฐ ์๋๋ผ ์ด์ ๋ ์ผ๋ง๋ ๋ค์ํ ๋๊ตฌ๋ฅผ ์์ ์ ์ผ๋ก ์ ์ฌ์ฉํ๋ฉด์ ๊ฒฝ์ ์ ์ผ๋ก ๊ฐ์น์๋ ์์ ์ ํ๋๋๋ก ์๊ฐ์ ์ ํํด์ผ ํ๋คโ๋ ํฌ์คํ ์ ํ๊ธฐ๋ ํ์ต๋๋ค.
The defining question for AGI isnโt โHow smart is it?โ but โWhat fraction of economically valuable work can it do?โ
The spotlight for o3 is on tool use because intelligence is no longer the primary constraint. The new frontier is reliable interaction with the external world.
โ Bob McGrew (@bobmcgrewai)
12:25 AM โข Apr 17, 2025
๊ทธ๋์, ๊ณผ์ฐ โo3๊ฐ ์ด๋ ์ ๋ ๊ฒฝ์ ์ ์ผ๋ก ๊ฐ์น์๋ ์ผ์ ๋ฏฟ์ ๋งํ๊ฒ ํ ์ ์์์งโ ํ๋จ์ ์ข ํด ๋ณด๋ ค๊ณ ์ ํฌ๋ o3๋ฅผ ์ฌ์ฉํด ๋ดค๋๋ฐ์. ๋๋์ด ๋ณต์กํด์. ์ฑGPT๋ ์ ๊ฐ ์ฒ์๋ถํฐ ์์ฃผ ์ฌ์ฉํ๋ ์๋น์ค์ด์ ๋ชจ๋ธ์ด๊ตฌ์, ๋ค์ํ ๊ฒฝ์ฐ์ ์ฌ์ฉํ๋ ค๊ณ ๋ง๋ค์ด ๋์ ๋ช ๊ฐ์ง GPTs๋ ์์ต๋๋ค. o3๋ฅผ ์ฌ์ฉํ์ ๋๋, ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์ข โ๋ ์ผ๊ด์ โ์ด๋ผ๋ ๋๋์ด ์๋๋ฐโฆ์ด๊ฒ ์๋ก ํฉ์ ๋ง์ถฐ๊ฐ๋ ๊ณผ์ ์ด๋ผ๊ณ ์ดํดํด์ผ ํ ์ง ๋ชจ๋ฅด๊ฒ ๋ค์. ์ด์จ๋ ์ง๊ธ๊น์ง๋, o3๋ ์์ด์ ํฑ ๋ชจ๋ธ๋ก์๋ ๋น๋์ง๋ง, ๊ทธ๋ณด๋ค ๋ ๊ฐ๋จํ ์ธ์ด์ ์ธ ์์ ์์๋ ๊ทธ๋ฅ ๋ง์กฑ์ค๋ฝ์ง ๋ชปํฉ๋๋ค.
์, ๊ทธ๋ฆฌ๊ณ ๋ค์ ๋ด์ค. ์คํAI๊ฐ โA Practical Guide to Building Agents (์์ด์ ํธ ๊ตฌ์ถ์ ์ํ ์ค์ฉ ๊ฐ์ด๋โ๋ผ๋ ๊ฑธ ๋ฐํํ์ต๋๋ค. ์ด๊ฒ๋ ๋ญ ์ฝ์ด๋ด์ผ๊ฒ ์ง๋ง, ์์งํ ์ข ๋ ํฅ๋ฏธ๋ก์ด ๊ฑด Harrison Chase๊ฐ ์ด, ์คํAI์ ๊ฐ์ด๋ ๋ฌธ์์ ๋ํ โ์ข์ ์ค๋ฝ์ง๋ง ์ฌ๋ ค๊น์โ ๊ธ์ ๋๋ค ^.^;
์ฌ์กฑ์ผ๋ก, ๊ฐ์ ์ฃผ์ ์ค์ฐ๋กํฝ๋ โClaude Code: Best Practices for Agentic Coding (Claude Code: ์์ด์ ํฑ ์ฝ๋ฉ์ ์ํ ๋ชจ๋ฒ ์ฌ๋ก)โ๋ผ๋ ์๋ฃ๋ฅผ ๋ฐํํ๋๋ฐ, ์ฌ๊ธฐ์ ๋ํด์๋ Simon Willison์ด โUltrathinkโ ๊ธฐ๋ฅ์ ๋ํด์ ํ์ธํด ๋ณด๊ธฐ๋ ํ์ต๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
๐BitNet b1.58 2B4T (Microsoft Research)๋ โ๋ฐ๋ฅ์์๋ถํฐโ, ์ฆ ์ฒ์๋ถํฐ ์๋ก ํ์ต์ํจ ๋ค์ดํฐ๋ธ 1๋นํธ 2B-ํ๋ผ๋ฏธํฐ LLM์ ์๊ฐํฉ๋๋ค. Full-Precision ๋ชจ๋ธ๊ณผ ์ฑ๋ฅ์ ๋์ผํ๋ฉด์๋ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํค๊ณ ๋ฉ๋ชจ๋ฆฌ ๋ฐ ์๋์ง ์ฌ์ฉ๋์ ์ค์์ต๋๋ค.
๐MineWorld (Microsoft Research)๋ ํ๋ ์ด์ด์ ํ๋์ ๊ธฐ๋ฐํด์ ๋ฏธ๋์ ์ฅ๋ฉด์ ์์ฑํ๋ Visual-Action Transformer๋ฅผ ์ฌ์ฉํด์ Minecraft์ฉ ์ค์๊ฐ ์คํ์์ค ์๋ ๋ชจ๋ธ์ ๋ง๋ค์์ต๋๋ค. ์ด๋ฅผ ํตํด์ ์ํธ์์ฉํ๋ ์์ด์ ํธ ์๋ฎฌ๋ ์ด์ ์ด ๊ฐ๋ฅํด ์ง๋ค๊ณ ํฉ๋๋ค.
๐ Embed 4 (Cohere)๋ 128K-ํ ํฐ์ ์ปจํ ์คํธ ์ฒ๋ฆฌ, ๋ค๊ตญ์ด ๊ฒ์, ๊ทธ๋ฆฌ๊ณ ๊ธฐ์ AI ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํด์ ๋ณต์กํ ๋ฌธ์๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ๊ฒ์ํ ์ ์๋ ์ต์ฒจ๋จ ๋ฉํฐ๋ชจ๋ฌ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋๋ค.
๐ Seedream 3.0 (ByteDance Seed)์ ์๊ฐ์ ์ธ Fidelity, ํ ์คํธ ๋ ๋๋ง, ๊ทธ๋ฆฌ๊ณ ์ต๋ 2K๊น์ง์ ๋ค์ดํฐ๋ธ ๊ณ ํด์๋ ์ถ๋ ฅ ๋ฑ์ ๊ด์ ์์ ํฐ ๊ฐ์ ์ ์ด๋ค ๋ธ, ๋ฐ์ด๋ง๊ถ (์ค๊ตญ์ด-์์ด Bilingual) ์ด๋ฏธ์ง ์์ฑ ๋ชจ๋ธ์ ์ ๋ณด์์ต๋๋ค.
์ถ๋ก (Reasoning) ๊ธฐ๋ฒ, ํ ์คํธ ํ์ ์ค์ผ์ผ๋ง ๋ฐ ํจ์จ์ฑ
๐ Syzygy of Thoughts: Improving LLM CoT with the Minimal Free Resolution์ CoT (Chain-of-Thought) ๊ธฐ๋ฒ์ ํ์ฅ, ๋ ๊น๊ณ ๊ตฌ์กฐํ๋ ๋ฐฉ์์ผ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ฒ ํ๋ ๋ณด์กฐ์ /์ํธ์์กด์ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์๊ฐํฉ๋๋ค.
๐ Sleep-time Compute: Beyond Inference Scaling at Test-time์ LLM์ด ์ ์ฉํ ์ปจํ ์คํธ๋ฅผ ์คํ๋ผ์ธ์์ ๋ฏธ๋ฆฌ ๊ณ์ฐํ ์ ์๊ฒ ํด์, ํ ์คํธ ์๊ฐ์ ๊ณ์ฐ๋์ ํฌ๊ฒ ์ค์ด๊ณ ๋ฌธ์ ํด๊ฒฐ ์ ํ๋๋ฅผ ํฅ์์์ผฐ์ต๋๋ค.
Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning์ ๋ณด์ ๋ชจ๋ธ์ด๋ ๊ฐ๋ ์์ด๋ LLM ์ถ๋ก ์ ๊ฐ์ ํ๊ธฐ ์ํ โ๋น์ง๋ ๋ฐฉ์์ ๋จ๊ณ๋ณ ์ต์ ํ ์ ๋ตโ์ ์๊ฐํฉ๋๋ค.
RAG, ์ง์์ ๊ตฌ์กฐํ ๋ฐ ๊ฒ์ฆ
๐ Retrieval-Augmented Generation with Conflicting Evidence๋ ๋ชจํธํจ, ํ์ ์ ๋ณด, ๊ทธ๋ฆฌ๊ณ ์์ถฉํ๋ ์ถ์ฒ ๋ฑ์ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ธฐ ์ํ, ํ ๋ก ๊ธฐ๋ฐ์ ๋ฉํฐ ์์ด์ ํธ RAG ์์คํ ์ ์ ์ํฉ๋๋ค.
๐ NodeRAG: Structuring Graph-based RAG with Heterogeneous Nodes๋ ์ด์ข ์ ๋ ธ๋๋ฅผ ์ฌ์ฉํด์ ๊ฒ์ ๋ฐ ์ถ๋ก ์ฑ๋ฅ์ ํฅ์์ํค๋ ๊ทธ๋ํ ์ค์ฌ์ RAG ํ๋ ์์์ ์๊ฐํฉ๋๋ค.
ReZero: Enhancing LLM search ability by trying one-more-time์ RAG ์๋๋ฆฌ์ค์์ LLM์ ๊ฒฌ๊ณ ์ฑ์ ํฅ์์ํค๊ธฐ ์ํด์ ์๋๊ฐ ์คํจํ ์ดํ์ ๊ฒ์ ์ฟผ๋ฆฌ๋ฅผ ๋ค์ ์ฌ์๋ํ๋๋ก ๊ถ์ฅํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
์์ด์ ํฑ ์์คํ , ๋๊ตฌ ์ฌ์ฉ (Tool Use), ์ก์ ๋ฌ๋ (Action Learning)
๐ ReTool: Reinforcement Learning for Strategic Tool Use in LLMs๋ ๊ฐํ ํ์ต์ ํตํด์ LLM์ด ์ค์๊ฐ ์ฝ๋ ์คํ์ ์ถ๋ก ์ ๋ค์ด๋๋ฏนํ๊ฒ ํตํฉํ๋๋ก ๊ฐ๋ฅด์นฉ๋๋ค.
Breaking the Data Barrier -- Building GUI Agents Through Task Generalization๋ ๊ถค์ (Trajectory) ๋ฐ์ดํฐ๊ฐ ์ ํ๋ ์ํฉ์์๋ ํฌ๋ก์ค ๋๋ฉ์ธ ์์ ์ผ๋ฐํ (Generalization)๋ฅผ ์ ์ฉํด์ GUI ์์ด์ ํธ์ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
LLM ๋ณด์, ์์ ์ฑ ๋ฐ ํต์
Robust and Fine-Grained Detection of AI Generated Texts๋ ๋ค์ํ ๋๋ฉ์ธ์์ AI๊ฐ ์์ฑํ๊ฑฐ๋ ์ฌ๋-LLM์ด ๊ณต๋ ์์ฑํ ํ ์คํธ๋ฅผ ๊ฐ๋ ฅํ๊ฒ ๊ฐ์งํ๋ ํ ํฐ ๋ถ๋ฅ ๋ชจ๋ธ์ ๊ฐ๋ฐํ์ต๋๋ค.
๐ Antidistillation Sampling์ ๋ชจ๋ธ์ ์ ์ฉ์ฑ์ ์ ์งํ๋ฉด์๋ ๋ฌด๋จ์ผ๋ก ์ด๋ฃจ์ด์ง๋ ์ฆ๋ฅ ์์ ์ ๋ํญํด์ ์ถ๋ก ์ ํ๋ฆ์ ์ค์ผ์ํค๋ ์ํ๋ง ์ ๋ต์ ์ ์ํฉ๋๋ค.
Syntactic and Semantic Control of Large Language Models via Sequential Monte Carlo๋ ์์ ์คํ์์ค LLM์ผ๋ก ๊ตฌ๋ฌธ ๋ฐ ์๋ฏธ์ ์ ์ฝ ์๋์์ ์์ฑ ์์ ์ ์ ์ ์ดํ๊ธฐ ์ํด์ Sequential Monte Carlo ๋ฐฉ๋ฒ์ ์ ์ฉํฉ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply