- Turing Post Korea
- Posts
- ๐FOD#122: 'แแ ขแผแแ กแจ แแ ฉแแ ณแซ(Thinking Tokens)', AI แแ ฅแแ ณแฏ แแ ฃแผแแ กแผแแ ด แแ ตแแ ญ
๐FOD#122: 'แแ ขแผแแ กแจ แแ ฉแแ ณแซ(Thinking Tokens)', AI แแ ฅแแ ณแฏ แแ ฃแผแแ กแผแแ ด แแ ตแแ ญ
+ แแ ฎแแ ญ แแ ฒแแ ณ, แแ ฒแ แ ตแผแแ ฉแแ ณแแ ณ แแ ฉแ แ ตแแ ก แแ ตแทแแ ต แแ ตแฐแแ ฉ แแ ตแปแแ ณแซ แแ ฅแบแแ ณแฏ, แแ ขแ แ ฉแแ ฎแซ แแ งแซแแ ฎ
๋ฏผ์กฑ์ ๋๋ช ์ โ์ถ์โ์ ๋ง์, ํ๋งํฌ์คํธ ์ฝ๋ฆฌ์๋ ์ฌ๋ฌ๋ถ๋ค๊ณผ ํจ๊ป ํ ์ฃผ ์ฌ๊ณ ๋์์์ต๋๋ค. ๊ฐ์กฑ, ์ง์ธ๋ค๊ณผ ํจ๊ป ์ฆ๊ฒ๊ณ ํ์ํ ์ฐํด ๋์ จ๊ธฐ๋ฅผ ๋ฐ๋ผ๋ฉด์, ๊ทธ๋ผ ํ๋งํฌ์คํธ ์ฝ๋ฆฌ์ ๋ค์ ์์ํฉ๋๋ค!
โ์๊ฐ ํ ํฐโ, AI ๊ฒฝ์ (๊ทธ๋ฆฌ๊ณ AI ๋ฒ๋ธ) ๊ด์ ์์์ ๊ทธ ์๋ฏธ

๋ฅ๋ง์ธ๋์ ์ผ๋น ๋จธํผ๊ฐ ์ด 10์ 15์ผ ํธ์
์ ํธ์์ ์ด ์ผ๋น ๋จธํผ(Kevin Murphy)๋ ๋จธ์ ๋ฌ๋์ ์ด๋ก ๋ฟ ์๋๋ผ ์ค๋ฌด๋ ํต๋ฌํ ๋ํ์ ์ธ ์ ๋ฌธ๊ฐ๋ก, ํ์ฌ ๋ฅ๋ง์ธ๋์ ์์ต๋๋ค. ์ผ๋น์ โAI๊ฐ ์ค์ ์ฐ์ ์์ ์ ์ฐ์ด๋ ค๋ฉด ํจ์จ์ฑ์ด ์ค์ํ๋คโ๋ ์ ์ฅ์ ๊ฒฌ์งํด ์จ ์ฌ๋์ ๋๋ค.
์์ ํ๊ดํ์ผ๋ก ํ์ํ ์ผ๋น์ ์ด ํ ๋ฌธ์ฅ์, ์ง๊ธ AI ์ฐ์ ์ ๋ณธ์ง์ ์ธ ๊ณ ๋ฏผ์ ์ ํํ ์ง์ด๋ ๋๋ค: AI๊ฐ ๋ง๋ค์ด๋ด๋ ๊ฒฝ์ ์ ์ธ ์ด์ต ๋๋น ํ๋ จ๊ณผ ์ด์์ ๋๋ ๋น์ฉ์ด ํจ์ฌ ๋ง๋ํ ์ํฉ์ด, ์๊ฐ๋ณด๋ค ์ค๋ ์ง์๋ ๊ฑฐ๋ผ๋ ๊ฑฐ์ฃ .
ํนํ โ์๊ฐ ํ ํฐ(Thinking Tokens)โ - ๋ชจ๋ธ์ด ์ค์ค๋ก ์ฌ๋๊ณผ ๊ฐ์ด ์ฌ๊ณ ํ๋ ๊ฒ์ฒ๋ผ ํ๋ด๋ฅผ ๋ด๊ธฐ ์ํด์ ๋ด๋ถ์ ์ผ๋ก ์ํํ๋ ์ถ๊ฐ ๊ณ์ฐ - ์ด ๊ทธ โ๋นํจ์จโ์ ๋ํ์ ์ธ ์์ง์ด๋ผ๋ ์ ์ ๊ผฌ์ง๊ณ ์๋ ๊ฑด๋ฐ์. ์ด ๋ฉ์์ง๋ ๋จ์ํ ๋นํ์ผ๋ก ๋ฐ๋ผ๋ณผ ๊ฒ ์๋๋ผ ๋ค์ ๋จ๊ณ AI์ ์งํ๋ โ๋ ๋ง์ GPUโ๊ฐ ์๋๋ผ โ๋ ๋๋ํ๊ฒ ํจ์จ์ฑ์ ํ๋ณดํ๋ ๊ฒโ์ ๋ฌ๋ ค์๋ค๋, ์กฐ์ฉํ์ง๋ง ๋ช ํํ ์ ์ธ์ผ๋ก ๋ณผ ํ์๊ฐ ์์ต๋๋ค.
โ์ฌ๊ณ ํ ํฐโ์ด ๋ญ๊น์?
๋์ด์ผ ๋ณด๋ฉด, ์ด๊ธฐ์ ์ธ์ด ๋ชจ๋ธ๋ค์ โ์ฆ๊ฐ์ ์ผ๋กโ ํ๋ฉด์ ๋จ์ด๋ค์ ๋ง๋ค์ด ๋๊ฐ์ฃ . ๊ทธ๋์ ํ๋กฌํํธ ์์ง๋์ด๋ค์ด โ๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ณด์โ๋ผ๋, ์์ CoT(Chain-of-Thought) ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํด์ ๊ธฐ์กด ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ์ฐํํ๋ ค๊ณ ํ๊ธฐ๋ ํ๊ตฌ์. ํจ๊ณผ๋ ์ข ์์์ง๋ง, ์ง์ ๋ถํ์ฃ . ๊ธธ๊ณ ์ฅํฉํด์ ๋น์ฉ๋ ๋ง์ด ๋ค์๊ตฌ์.
๊ทธ๋์ ์ฐ๊ตฌ์๋ค์ด CoT๋ฅผ โ๋ด๋ถโ๋ก ๋๋ ค๋ฒ๋ ธ์ต๋๋ค.

Herel, Mikolov๊ฐ ์ด โThinking Tokens for Language Modelingโ ๋ ผ๋ฌธ์ ์ด โ์๊ฐ ํ ํฐโ์ ๊ฐ๋ ์ ๊ณต์ํํ ์ด๊ธฐ ์ฌ๋ก ์ค ํ๋์ ๋๋ค.
์ด โ์๊ฐ ํ ํฐโ์ ํน๋ณํ ์จ๊ฒจ์ ธ ์๋ ํ ํฐ์ด๊ณ , ๋ชจ๋ธ์ด ์ด๋ ค์ด ๋ฌธ์ ์ ๋ฅ์ณค์ ๋ ์ถ๊ฐ์ ์ธ ๊ณ์ฐ ์๊ฐ์ ํ์ฉํ ์ ์๊ฒ๋ ํด ์ค๋๋ค - ํ ํฐ์ด ์ถ๊ฐ๋ก ์ฐ์ด๋๊น ๋น์ฉ์ด ๋๋ ์ ์ด์ฃ . ์ด๊ฒ๊ณผ ๋น์ทํ ์์ด๋์ด๋ก Pause Token์ด๋ผ๋ ๊ฐ Filler Token ๊ฐ์ ๊ฒ๋ค์ด ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์ ์ฐ๊ตฌ ๊ณผ์ ์์ ๋ ์ผ์ฐ ๋ฑ์ฅํ๊ธฐ๋ ํ์ง๋ง, ์ด ํน๋ณํ ํ ํฐ์ โ์๊ฐ ํ ํฐโ์ด๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค.
์ค๋๋ ์ฐ๋ฆฌ๊ฐ ๋ณด๊ณ ์ฐ๋ ๋ง์ ์ถ๋ก ๋ชจ๋ธ๋ค - Claude 4.5, Gemini 2.5, GPT-5 ๋ฑ - ์ ๋๋ถ๋ถ ๊ฒ์ผ๋ก ๋ณด์ด์ง ์๋ ๋ทํธ์์ ๋ง์ ์์ ๊ณผ ์๊ฐ์ ํ์ฃ . ์๋ต์ ํ๊ธฐ ์ ์ ๋ด๋ถ์ ์์ ์ ์ถ์ ํ๊ณ , ํ๋ฉด์๋ ๋ณด์ด์ง ์๋ ์จ๊ฒจ์ ธ ์๋ ํ ํฐ๋ค์ ์ฌ์ฉํด์์.
โ์ ๊น ๋ฉ์ถค(Pause)โ์ ๋๊ฐ
๊ฒฐ๊ณผ์ ์ผ๋ก, ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ๋ค์ ์๋ตํ๊ธฐ ์ ์ โ์ ๊น ๋ฉ์ถ ์ค์โ ์๊ฒ ๋์ฃ . ๋ต๋ณ์ ํ์ ์ง๊ธฐ ์ ์ ์ถ๊ฐ์ ์ธ ์ฐ์ฐ๋์ ๋น์ฉ์ ์น๋ฅด๊ณ ์ฌ์ฉํ๋ ๊ฒ๋๋ค.
์ฅ์ ์ ์ด์จ๋ ํ์ง์ด ์ข์์ง๋ค๋ ๊ฒ์ด๊ฒ ์ฃ - ๋ ์ด๋ ค์ด ์ํ๋ฌธ์ ๋ฅผ ํ๊ณ ๊ตญ์ ์ํ ์ฌ๋ฆผํผ์๋์์ ์ ์ํ๋ค๋ ๊ฐ, ์ฝ๋ ๊ณํ์ ๋ ์ ํ๋ค๋ ๊ฐ์.
๋จ์ ์, ์ญ์ โ๋น์ฉโ์ ๋๋ค. ์์ฒญ๋ ๋น์ฉ์ด์. ๋ชจ๋ ํ๋ ํ๋์ ์จ๊ฒจ์ ธ ์๋ ํ ํฐ์ด GPU ํ์, ๊ทธ๋ฆฌ๊ณ ์ ๋ ฅ์ ์๋นํ์์์. ํ๋์ โ์ฌ๋ ค๊น์โ ๋ต๋ณ์ ๋ง๋ค์ด๋ด๊ธฐ ์ํด์, Forward Pass๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์์ฒ๋ฒ ๋ ํด์ผ ํ ์๋ ์๋ ๊ฒ๋๋ค. ๋ญ, ๊ด์ฐฎ์ ๊ฒฝ์ฐ๋ ์๊ฒ ์ง๋ง, ๊ฐ๋จํ ์ง๋ฌธ์ด๋ผ๋ฉดโฆ๊ธ์์, ๋ญ๋น ์๋๊น์?
โ์ถ๋ก (Reasoning) ์ฐ๊ตฌ์ ๋ ๊ฐ์ง ์ ์ (Frontline)
์ธ์ด๋ชจ๋ธ์ ์ถ๋ก ์ ์ฐ๊ตฌํ๋ ์ฌ๋๋ค์, ์ด์ ๋ ๊ฐ์ ์ ์ ์์ ์ธ์ฐ๊ณ ์์ต๋๋ค:
๊ทธ ์ค ํ ์ชฝ ์ง์์์๋ โ๋ ๊ฐ๋ฒผ์ด ์๊ฐ(Leaner Thinking)โ์ ๋ฐฉํฅ์ ํ๊ตฌํฉ๋๋ค. ๋ด๋ถ์ ํธ๋ ์ด์ฑ์ ์ค์ฌ์ ๋ ์งง๊ฒ ํ๊ณ , ํ ํฐ ์์ฐ์ ์กฐ์ ํด ๊ฐ๋ฉด์, ๋์์ด ๋ ๋๋ง ์ถ๋ก ์ ํ๊ฒ๋ ํฉ๋๋ค.
๋ค๋ฅธ ํ ์ชฝ ์ง์์์๋ โ์์ ํ ๋ค๋ฅธ ๋ฐฉ์์ ์๊ฐ(Different Thinking Altogether)โ์ ์ถ๊ตฌํ๋๋ฐ, โํ ํฐ ์ค์ฌ์ ์ถ๋ก โ, ์ฆ ๋์์ด ํ ํฐ์ ๊ตด๋ ค๊ฐ๋ฉด์ ๋ฌธ์ฅ์ ์ด์ด๋ถ์ด๋ ๊ตฌ์กฐ๊ฐ ์๋๋ผ, ํ ํฐ ๊ฐ๋ ์ ๋ฐ๊นฅ์์ ์ด๋ฃจ์ด์ง๊ฒ ๋ โ์ง์ง ์ดํด์ ์๊ฐโ์ ์ด๋ป๊ฒ ํ๋๋ก ํ ์ ์์๊น ํ๋ ๊ฒ๋๋ค.
์ฒซ ๋ฒ์งธ ์ง์์ ๋ฌด๊ธฐ๋ ๊ธฐ๋ณธ์ ์ผ๋ก โ์์ถ(Compression)โ์ ๋๋ค. ์ฌํด ์ด์ ๊ด๋ จํด์ ๋ง์ ์ฐ๊ตฌ๋ค์ด ์งํ๋๊ธฐ๋ ํ์ต๋๋ค:
โWait, We Donโt Need to โWaitโ ! Removing Thinking Tokens Improves Reasoning Efficiencyโ๋ผ๋ ๋ ผ๋ฌธ์ โํ โฆโ์ด๋ โ์ ๊นโฆโ ๊ฐ์ Filler Token์ ์ ๊ฑฐํด์ ์ถ๋ก ์ ๊ธธ์ด๋ฅผ ๋๋ต 40% ์ ๋ ์ค์ด๋ฉด์๋ ์ ํ๋๋ ๋น์ทํ ์์ค์ผ๋ก ์ ์งํ ์ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์คฌ๊ตฌ์.
โSoft Thinking: Unlocking the Reasoning Potential of LLMs in Continuous Concept Spaceโ ๋ ผ๋ฌธ์ ๋ชจ๋ธ์ด ๋จ์ด ํ๋ํ๋๋ฅผ ๋์ดํ๋ฉด์ ์๊ฐํ๋๊ฒ ์๋๋ผ, ๋จธ๋ฆฌ์์์ ๊ฐ๋ ์ ์ฐ๊ฒฐํ๋ฏ์ด ๋ถ๋๋ฝ๊ฒ ์๊ฐํ๊ฒ๋ ํด์, ๋ถํ์ํ ๊ณ์ฐ์ ์ค์ด๊ณ ์ ์ฒด ํ ํฐ ์ฌ์ฉ๋์ ์ฝ 22% ์ค์ฌ์ค๋ค๊ณ ํฉ๋๋ค.
๊ทธ๋ฆฌ๊ณ ์์ฃผ ์ฃผ๋ชฉํ ๋งํ ๋ ผ๋ฌธ, โMARCOS: DEEP THINKING BY MARKOV CHAIN OF CONTINUOUS THOUGHTSโ๋ ์ฌ๊ธฐ์ ๋ ๋์๊ฐ์, ์์ CoT๋ฅผ ์์ ๊ณ ์๊ฐ์ด ์ ๋๊ธฐ๋ฉด์ ํ๋ฌ๊ฐ๋ โ์ฐ์์ ์ฌ๊ณ ํ๋ฆ(Hidden Markov Flow of Continuous Thoughts)โ์ผ๋ก ๋ฐ๊ฟ๋ฒ๋ฆฝ๋๋ค. ๊ทธ๋์, ๊ธฐ์กด๋ณด๋ค ์ต๋ 15๋ฐฐ ๋น ๋ฅด๊ฒ ์ถ๋ก ์ ํ๋ฉด์๋ ์ ํ๋๋ ๊ทธ๋๋ก ์ ์งํ๋ ์ง ์๋๋ฉด ๋์ด๋ ์ง ํ ์๊ฐ ์๋ค๊ณ ํฉ๋๋ค.
๋ ๋ฒ์งธ ์ง์์ ๋ฌด๊ธฐ๋ โ๋ณํ(Transformation)โ์ด์์. ๋ ์๊ฐํ๋๊ฒ ์๋๋ผ โ๋ค๋ฅด๊ฒโ ์๊ฐํ๋ ๊ฑฐ์ฃ . ์ง๋ ์ฃผ์ ์ด ์ฃผ์ ์ ๋ํด์ ๊ฝค ๋ง์ ์ ๋ ผ๋ฌธ๋ค์ด ๋์๋๋ฐ์:
โLess is More: Recursive Reasoning with Tiny Networksโ ๋ ผ๋ฌธ์ 700๋ง๊ฐ ํ๋ผ๋ฏธํฐ ๊ท๋ชจ์ ์์ ๋คํธ์ํฌ๊ฐ ๋ต๋ณ์ ๋ฐ๋ณต์ ์ผ๋ก ๋ค๋ฌ์ด์, ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ๊ณผ์ ARC-AGI ํผ์ฆ ๋๊ฒฐ์์ ์น๋ฆฌํ ์ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์ค๋๋ค. โ๋์ด(Width)โ๋ฅผ ํฌ๊ธฐํ๊ณ ๋์ โ๋ฐ๋ณต(Iteration)โ์ ์ ํํ๋, ์ฆ, ๊ฑฐ๋ํ ๋๊ฐ ํ ๋ฒ ์๊ฐํ๋๊ฒ ์๋๋ผ ์์ ๋๊ฐ ์ฌ๋ฌ ๋ฒ ์๊ฐํ๋ ๊ฒ๋๋ค.
โLADIR: LATENT DIFFUSION ENHANCES LLMS FOR TEXT REASONINGโ ๋ ผ๋ฌธ์, ์ ์ฌ ์ถ๋ก ๊ณต๊ฐ์ ๋ํจ์ ผ ์คํ์ผ์ ๋ ธ์ด์ฆ ์ ๊ฑฐ ๊ธฐ๋ฅ์ ๋์ ํ๋๋ฐ์. ์ข ๋ ์ฝ๊ฒ ๋งํ์๋ฉด, ๋ง๋ก ์๊ฐ์ ๋ด๋ฑ๊ธฐ ์ ์ ๋จธ๋ฆฟ์์์ ์ฌ๋ฌ ๊ฐ๋ฅํ ์๊ฐ๋ค์ ๋์์ ๋ ์ฌ๋ฆฐ ๋ค์, ๊ทธ ์ค์์ ์ ์ ์ก์์ ์ ๊ฑฐํด ๊ฐ๋ฉด์ ๊ฐ์ฅ ์ผ๊ด์ ์ธ ์ฌ๊ณ ๊ฒฝ๋ก๋ฅผ ๋จ๊ธฐ๋ ๋ฐฉ์์ ๋๋ค.
โEncode, Think, Decode: Scaling test-time reasoning with recursive latent thoughtsโ๋ AI๊ฐ ๋ฌธ์ ๋ฅผ ํ ๋ฒ์ ๋ค ๊ณ์ฐํ์ง ์๊ณ , ํ์ํ ๋ถ๋ถ๋ง ์ง์คํด์ ๋ค์ ์๊ฐํ๋๋ก ๋ง๋๋ ๊ตฌ์กฐ์ ๋๋ค. ๋ชจ๋ธ์ด ์ ๋ ฅ์ ์ ์ฌ๊ณต๊ฐ(๋จธ๋ฆฟ์ ๊ฐ๋ ํํ)์ผ๋ก ๋ฐ๊พผ ๋ค์, ๊ทธ ์ค ์ค์ํ ์์ญ๋ง ์ฌ๋ฌ ๋ฒ ๋์ง์ด ๋ณด๋ฉด์ ์ฌ๊ณ ๋ฅผ ์ ์ ํ๊ณ , ๋ง์ง๋ง์ ๊ฒฐ๊ณผ๋ฅผ ๋ฌธ์ฅ์ผ๋ก ํํํฉ๋๋ค. ์ฝ๊ฒ ๋งํด, โ์ ์ฒด๋ฅผ ๋ฐ๋ณต ํ์ตํ๋ ๋์ , ํต์ฌ๋ง ์ฌ๋ฌ ๋ฒ ๊ณฑ์น๋ ๋๋ํ ์ฌ๊ณ ๋ฐฉ์โ ์ด๋ผ๊ณ ๋ณด๋ฉด ๋ฉ๋๋ค.
์ด๋ฐ ๋ฐฉํฅ์ ์ฐ๊ตฌ๋ค์, ๋ฌด์์ ๋ฐ๋ณตํ๋ฉด์ โ์โ์ผ๋ก ์น๋ถํ๋ ๋ฐฉ์์ด ์๋๋ผ, ๋ ๊ตฌ์กฐ์ ์ด๊ณ , ์ฌ์ฌ์ฉ๋ ๊ฐ๋ฅํ๊ณ , ํ๋ฅ ์ ๊ธฐ๋ฐํด์ ์ฑ๋ฅ์ ๋์ด๋ ์๋ก์ด ์ถ๋ก , โ์งโ์ ๋ฐฉํฅ์ผ๋ก ๋์๊ฐ๋ ์ฐ๊ตฌ๋ค์ด๋ผ๊ณ ํ๊ฒ ์ต๋๋ค.
์, ๊ทธ๋ผ ์ด๊ฒ ์ง๊ธ์ โAI ๋ฒ๋ธโ์ ๋ํ ๋ ผ์, ๋ ผ์ํ๊ณ ์ด๋ค ๊ด๋ จ์ด ์๋ ๊ฑธ๊น์?
โ์๊ฐ ํ ํฐโ๊ณผ ์ด๊ฑธ ๋๋ฌ์ผ โ์ถ๋ก ๋น์ฉโ์ ๋ํ ๋ ผ์์ ๋ค์ํ ์ ๊ทผ์, ๊ธฐ์ ์ ๋ฐ์ ๊ณผ ๊ฒฝ์ ์ ์ด์๊ฐ ์ ๋ฉด์ผ๋ก ์ถฉ๋ํ๋ ํ์ฅ์ด๊ธฐ๋ ํฉ๋๋ค. ์ง๋ 10์ 7์ผ ๋ธ๋ฃธ๋ฒ๊ทธ์ ๊ธฐ์ฌ "OpenAI, Nvidia Fuel $1 Trillion AI Market With Web of Circular Deals"์์ ๋ฐ๋ก AI ๋ชจ๋ธ์ โ์๊ฐ์ ํ๋ ๋น์ฉ(Cost of Thinking)โ์ด ์คํAI, ์๋น๋์, AMD, ์ค๋ผํด ๋ฑ์ ๋๋ฌ์ผ 1์กฐ ๋ฌ๋ฌ ๊ท๋ชจ์ โ์ํธ ์์กด์ ์ธ ๊ฑฐ๋โ๋ฅผ ๋๋ผ์ด๋ธํ๋์ง ์ถ์ ํ๊ณ ์์ต๋๋ค. ์๋น๋์๋ ์คํAI์ ์ต๋ 1,000์ต ๋ฌ๋ฌ๋ฅผ ํฌ์ํด์ ๊ฑฐ๋ํ ๋ฐ์ดํฐ์ผํฐ ๊ฑด์ค์ ์ํ ์๊ธ์ ์ง์ํ ๊ฒ๋๋ค. ์คํAI๋ ๋ฐ๋๋ก ๊ทธ ๋ฐ์ดํฐ์ผํฐ ์ฌ์ใ ฃํธ๋ฅผ ์๋น๋์์ ์นฉ์ผ๋ก ์ฑ์ฐ๊ฒ ์ฃ . ๊ทธ๋ฆฌ๊ณ ๋ฉฐ์น ์์ 3,000์ต ๋ฌ๋ฌ ๊ท๋ชจ์ ์ค๋ผํด ํด๋ผ์ฐ๋ ๊ณ์ฝ, ์์ญ์ต ๋ฌ๋ฌ ๊ท๋ชจ์ AMD ํํธ๋์ญ ๊ธฐ์ฌ๊ฐ ๋์์ต๋๋ค. ๋ชจ๋์คํ์์๋ ์ด โ์๋น๋์-์คํAIโ ํํธ๋์ญ ๊ตฌ์กฐ๊ฐ AI ๋ฒ๋ธ์ด ํฐ์ง๋ ์๊ฐ โ๋นต ๋ถ์ค๋ฌ๊ธฐโ์ฒ๋ผ ๋ ๊ฑฐ๋ผ๊ณ ํ๊ธฐ๋ ํ์ต๋๋ค. ์ฐธ๊ณ ๋ก ์คํAI๋ 2030๋ ์ ๋๊น์ง๋ ํ๊ธ ํ๋ฆ์ด (+)๋ก ์ ํ๋๊ธฐ๋ฅผ ๊ธฐ๋ํ์ง ์๋๋ค๊ณ ํ๊ตฌ์.

Image Credit: ๋ธ๋ฃธ๋ฒ๊ทธ โOpenAI, Nvidia Fuel $1 Trillion AI Market With Web of Circular Dealsโ
๊ฑฐ๋ฏธ์ค์ฒ๋ผ ์ฐ๊ฒฐ๋ ์ด ๊ด๊ณ๋ค ์์, ๋ฐ๋ก AI ๋ชจ๋ธ ์ถ๋ก (Reasoning)์ ๋๋ฌ์ผ ์ํ๊ณผ ๊ณ์ฐ์ด ์๋ฆฌํ๊ณ ์์ต๋๋ค.
AI ์์คํ ์ด โ์๊ฐโํ๋๋ฐ๋ ๋น์ฉ์ด ๋ค๊ณ , ๋ชจ๋ AI ์์คํ ์ ์ฌ์ด ์ง๋ฌธ์ ๋น ๋ฅด๊ฒ, ์ด๋ ค์ด ๋ฌธ์ ๋ ๋ ๊น์ด ์๊ฐํ๊ฒ๋ ์ค๊ณํ๊ณ ์์ฃ . ๊ทธ ๊ณผ์ ์์, ๋์ ์ ๋ณด์ด๋ โ์จ์ ํ ํฐ(Hidden Tokens)โ์ ๋๋ฌ์ผ ๊ณ์ฐ๋์ด ๊ณ์ ๋์ ๋ฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ ํ๋๋ฅผ ๋์ผ ์๋ ์์ง๋ง, ์ด๋ฐ ๊ณ์ฐ ๋๋ฌธ์ ์ปดํจํ ์์์ ์์ฒญ๋๊ฒ ๋น ๋ฅด๊ฒ, ๊ทธ๋ฆฌ๊ณ ๋ง์ด ์๋ชจ๋ฉ๋๋ค.
์, AI ๋ชจ๋ธ์ด ๋งค์ผ ์์ญ์ต ํ์ ์์ฒญ์ ์ฒ๋ฆฌํ๋ค๊ณ ํ๋ฉด, ์ด ์ฐ์ ์, ๋ง์น โ์ ๋ ฅ๋ง์ฒ๋ผ ์๋์ง๋ฅผ ์๋นํ๋ ๊ตฌ์กฐโ๊ฐ ๋ ๊ฒ๋๋ค. ๊ทธ๋ฐ๋ฐ๋ ์ ๋์ ๊ณ์ํด์ ์์๋ถ์๊น์? ๋ต์ ๊ฐ๋จํด์: ์ฒ ๋๋ง์ ๊น ๋์ฒ๋ผ, ๋จผ์ ๊น์๋๊ณ ํ๋ ๋์ค์ ํ๊ฒ ๋ค๋ ๊ฒ๋๋ค.
โ์ง๋ฅโ์ ์๋ก์ด ๋น์ฉ ๊ณก์
AI ๊ธฐ์ ์ โ์จ์ ์ถ๋ก (Hidden Reasoning) ๋น์ฉโ์ ์ด์ ์ด์ฝ๋ ธ๋ฏน์ค ์์ฒด์ ํฐ ์ํฅ์ ์ฃผ๊ณ ์์ต๋๋ค.
์์ฅ์ ๋ ๊ฐ์ ๋ฐฉํฅ, ์ฆ ๋น ๋ฅธ ์๋ต์ ์ํ ๊ฒฝ๋ ๋ชจ๋ธ, ๊ทธ๋ฆฌ๊ณ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๊น์ด ํ๊ณ ๋๋ ๊ณ ์ฑ๋ฅ ๋ชจ๋ธ์ ๋ฐฉํฅ์ผ๋ก ๋๋๊ณ ์์ง๋ง, ์ฌ์ ํ ์ฌ๊ณ ๊ณผ์ ์ด ๋ด๋ถ์ ์จ๊ฒจ์ง์๋ก, ๊ทธ ์์ ์๋ ํธํฅ์ด๋ ์ค๋ฅ๋ ํจ๊ป ๋ณด์ด์ง ์๊ฒ ๋๋ค๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ์ด ๋๋ฌธ์๋ผ๋, ์คํ๋ ค ์ฃ์ง ๋๋ฐ์ด์ค์์ ์ง์ ์คํํ ์ ์๋ ์๊ณ ํจ์จ์ ์ธ ๋ชจ๋ธ์ ํ์์ฑ์ด ๋ ์ปค์ง๋ ๊ฒ ๊ฐ๊ธฐ๋ ํฉ๋๋ค.
์์์ ์ ๊น ์ดํด๋ณธ, ๋ฌด์์ฐ๋ฆฌ๋งํผ ๊ฑฐ๋ํ AI ์ฐ์ ์ ์ํ ํฌ์ ๊ตฌ์กฐ, ๊ทธ์ ๋ฐ๋ผ์ฌ ๊ธฐ๋ก์ ์ธ ์ค๋น ํฌ์๋, ๊ฒฐ๊ตญ์ ์ถ๋ก ํจ์จ์ด ์ปดํจํ ๋น์ฉ์ ์์น ์๋๋ณด๋ค ๋น ๋ฅด๊ฒ ๊ฐ์ ๋ ๋์๋ง ์๋ฏธ๊ฐ ์์ต๋๋ค. ๊ทธ๋ ์ง ์์ผ๋ฉด, ์๋ก ๋ง๋ค์ด์ง๋ ๋ฐ์ดํฐ์ผํฐ๋ค์ โ์์ง ๋์ด ๋์ง ์์ AI ๋ชจ๋ธ์ ์๊ฐ๋คโ์ด ์์ฌ์๋ ์ฐฝ๊ณ ์ผ ๋ฟ์ด์ฃ .
์ค๋ผํด์ GPU ํด๋ผ์ฐ๋๊ฐ ๋ํ์ ์ธ ์๊ฐ ๋ ๊ฒ ๊ฐ๋ค์: AI ์๋ฒ ๋งค์ถ 1๋ฌ๋ฌ๋น ์ด์ต์ 14์ผํธ ์ ๋์ ๋ถ๊ณผํฉ๋๋ค. ์ธ๋๊ฐ ๋ฐ๋์๋ก ๋ชจ๋ธ์ ๋ ๋ง์ด ์๊ฐ์ ํด์ผ ํ ํ ๋ฐ, ๊ทธ๋งํผ ์ด ์ ์ ๋ง์งํญ์ ๋ ์ค์ด๋ค๊ธฐ ์ฌ์ธ ๊ฒ๋๋ค.
โ๊ฐ๋นํ ์ ์๋ ์๊ฐ(Affordable Thought)โ์ ํฅํ ์๋ก์ด ๊ฒฝ์ฃผ
์ด โ์จ์ ์ถ๋ก (Hidden Reasoning)โ ๊ฐ๋ ์, ํ ๋ AI๊ฐ ๋ง์น ์ฌ๋์ฒ๋ผ ์ฌ๊ณ ํ๊ธฐ ์์ํ๋ค๋ ์ ํธ๋ก ๋ฐ์๋ค์ฌ์ก๋๋ฐ์.
2025๋ ์ง๊ธ์ ์์๋, ์ด์ฉ๋ฉด โ์ง๋ฅ์ผ๋ก ํฌ์ฅ๋, ๊ณผ์ฅ๋๊ณ ๋ถํ๋ ค์ง ๊ณ์ฐโ์ผ ๋ฟ์ธ๊ฐ ์ถ๊ธฐ๊น์ง ํฉ๋๋ค. ๊ฒ์ผ๋ก๋ ๋ ๋๋ํด์ง ๊ฒ ๊ฐ์ง๋ง, ๊ธ์์, ์ฌ์ค์ ๋ณด์ด์ง ์๋ ๊ณณ์์ ๊ณ์ฐ๋๋ง ์กฐ์ฉํ ๊ฐ์ด๋ฐ ํญ์ฆํ๊ณ ์๋ ๊ฒ์ด๋ผ๊ณ ๋ณด๋ฉด, ๋๋ฌด ์ง๋์น ์๊ฐ์ผ๊น์?
AI ์ฐ์ , AI ์ด์ฝ๋ ธ๋ฏธ๊ฐ ์์ผ๋ก ์์ ๋์ด๊ฐ๋ฉด์ ์ฑ์ฅํ ์ง, ์๋๋ฉด ๋ฒ๋ธ์ด ํฐ์ง๊ฒ ๋ ์ง๋, ๊ฒฐ๊ตญ ๋จ ํ๋์ ์ซ์, ๋น์จ(Ratio)์ ๋ฌ๋ ค ์๋ ์ ์ ๋๋ค:
๊ธฐ๊ณ๊ฐ 1๋ฌ๋ฌ๋ฅผ ๋ฒ๊ธฐ ์ํด์ ์ผ๋ง๋ ๋ง์ ํ ํฐ์ ์จ์ ์๊ฐํด์ผ ํ๋๊ฐ?
๊ทธ๋ฐ ์๋ฏธ์์, ์ด์ AI ์ฌ์ ๋ค์ ๊ฒฝ์ ๋ฌด๋๋ โ์ฑ๋ฅโ์ด ์๋ โํจ์จโ์ ๋ฌด๋์ ๋๋ค. โ์ผ๋ง๋ ๊น์ด ์๊ฐํ๋๋โ๊ฐ ์๋๋ผ, โ์ผ๋ง๋ ์ ์ ๋น์ฉ์ผ๋ก ์๊ฐํ๋๋โ๊ฐ ํต์ฌ์ด ๋ ๊ฒ๋๋ค.
๊ทธ๋ฆฌ๊ณ , ๊ทธ ์ธ์์์๋ผ๋ฉด โ์ธ๊ฐ์ ์์ง ์๋์ ์ธ ์ฐ์โ๋ฅผ ์ง๋๊ณ ์๋ ๊ฒ ๊ฐ๋ค์.
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
์ต๊ทผ ๋ช ์ฃผ๊ฐ, Sora 2๊ฐ ํฐ ํ์ ๋ฅผ ๋ชจ์ผ๋ฉด์ โ๊ณ ํ์ง ์์์ ์์ฑํ๋ค๋ ๊ฑด ์ด๋ฐ ๊ฑฐ๋คโ๋ ์๋ก์ด ๊ธฐ์ค์ ๋ณด์ฌ์ฃผ๊ณ ์์ฃ . ์ด ํธ๋ ๋์ ๋ง์ถฐ์, Sora 2 ๋ฟ ์๋๋ผ Sora 2์ ๊ด์ฐฎ์ ๋์, ๋๋ ๋ณด์์ฑ ์ด ๋ ๋งํ ๋น๋์ค ์์ฑ ๋๊ตฌ๋ค์ ํ ๋ฒ ์๊ฐํด ๋๋ฆฝ๋๋ค:
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
SemiAnalysis, โ์ผ๋ง๋ ํจ์จ์ ์ผ๋ก ์๊ฐํ๋๋โ๋ ์ถ๋ก ๋ฒค์น๋งํน
์ธ์ด๋ชจ๋ธ์ ์ถ๋ก ๋ฒค์น๋งํน, ์ง๊ธ๊น์ง๋ ๋ฟ์ฐ ์ฐ๊ธฐ ์์์ ์ด๋ ดํ์ด๋๋ง ๋ญ๊ฐ ์๋์ง ๋ณด๋ ค๋ ๋ ธ๋ ฅ์ด์๋ค๊ณ ํด ๋ณผ ์ ์์๊น์? ํ์ง๋ง, SemiAnalysis์ ๋ฒค์น๋งํน Inference Max๋ ๋ชจ๋ธ์ ์ค์ ํ๋์จ์ด์์ ๋งค์ผ ๋ฐค ๋ฒค์น๋งํฌํ๊ณ , ์ค์ ์ฒ๋ฆฌ๋ vs. ์ง์ฐ ์๊ฐ ํธ๋ ์ด๋์คํ๋ฅผ ๋ณด์ฌ์ค๋๋ค. ๋ ๊ฒ ๊ทธ๋๋ก์, ํ์ค์ ์ธ ์คํ์์ค ์ฑ๋ฅ ๋ฐ์ดํฐ์ ๋๋ค. ์ญ์, ์์์ ์ธ๊ธํ โ์ผ๋ง๋ ์โ์ด ์๋๋ผ โ์ผ๋ง๋ ํจ์จ์ ์ผ๋กโ๋ผ๋ ๋ฐฉํฅ์ ํ ์์ง์์ด๋ผ๊ณ ๋ณผ ์๋ ์๊ฒ ์ต๋๋ค

InferenceMax vs. ์ฌํ ์ถ๋ก ๋ฒค์น๋งํน ๋น๊ต. Image Credit: ํ๋งํฌ์คํธ ์ฝ๋ฆฌ์
Reflection AI: ์ค๊ตญ์ด ๋ฆฌ๋ํ๋ (๋ชจ์์์ธ) ์คํ์์ค AI์ ๋ํ ๋ฏธ๊ตญ์ ์นด๋
PaLM, AlphaGo, Gemini๋ฅผ ๋ง๋ ๋ฒ ํ ๋ ์ฐ๊ตฌ ๊ฐ๋ฐ์ง์ด ๋ง๋ ํ, Reflection AI๊ฐ ์คํ ์ค ๋ชจ๋์์ ๋ฐ์ฐจ๊ณ ๋์ 20์ต ๋ฌ๋ฌ์ ์ ํฌ ์๊ธ์ ํ๋ณดํ์ต๋๋ค. Reflection AI์ ๋ฏธ์ ์, โ์คํAI์ ์ต์ ์ ์ ๋ค์ ๋ฏธ๊ตญ์ด ์ฐจ์งํ๋๋ก ํ๊ฒ ๋คโ๋ ๊ฒ๋๋ค. ๋น ํ ํฌ ๋ฉ์ ํ์ ํ๋ ํ๋ฐํฐ์ด ๊ท๋ชจ์ MoE, ๊ฐํํ์ต ํ๋ซํผ์ ๊ตฌ์ถํ๋ค๊ณ ์ฃผ์ฅํ๊ณ ์๋๋ฐ์. ์ด ํ์ฌ์ ํ์์๋ ์๋น๋์, ์ธ์ฟผ์ด์ ์บํผํ, ์๋ฆญ ์๋ฏธํธ์ ๋๋ค. ๊ธ์์, ์ง๊ธ ์๋ ๋ฆฌ์คํธ๋ ์ฐจ๊ณ ๋์น๋๋ฐ, ๋ ํ๋? ์์ผ๋ก ์ง์ผ๋ด์ผ๊ฒ ์ต๋๋ค.
Figure, ์ ํ ์ถ์
Figure๊ฐ ๋๋์ด ํ๋กํ ํ์ ์ด ์๋ ์ ํ์ผ๋ก์ 3์ธ๋ ํด๋จธ๋ ธ์ด๋๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. Figure 03์ด๋ผ๋ ์ด๋ฆ์ ์ด ๋ก๋ด์, ์ญ์ Helix๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ง, ๋ฒ์ฉ ๋ก๋ณดํฑ์ค๋ฅผ ํฅํ Figure์ ํ ๋จ๊ณ ๋์ฝ์ด๋ผ๊ณ ํ ์ ์๊ฒ ์ต๋๋ค.
์๋ก์ด ์ด๊ฐ ์ผ์, ์ ์ง์ฐ์ ์๊ฐ ์ผ์, ์์ญ์ด๋ ๊ฒ๋ง๋ฅ ์์ฃผ ์กฐ์ฉํ, ๊ฐ์ ์์๋ ์ธ๋งํ ์์๋ก ๋ง๋ค์ด์ก๋ค๊ณ ํ๋๋ฐ, ์๋ก์ด ๊ณต๊ธ๋ง๊ณผ ์์ฒด์ ์ผ๋ก ๊ตฌ์ถํ ๊ณต์ฅ์์ ์์ฒ๋์ ๊ณต๊ธ ์ญ๋์ ๊ฐ์ท๋ค๊ณ ํฉ๋๋ค. ๊ทธ๋ฐ๋ฐ, ๋ค ์ข์๋ฐ, ํ๋ ์ผ์ ๊ฐ์ฌ์ผ์ธ๋ฐ ์์ ์ ์ข Spookyํ๋ค์? ^.^;
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
์ค๊ตญ์ด ํฐ๋ฒ ํธ ๊ณ ์์ ์ฝ 162ํ๋ฐฉ๋ง์ผ(์ฝ 420 kmยฒ) ๊ท๋ชจ์ ํ์๊ด ํจ๋ ๋จ์ง๋ฅผ ์กฐ์ฑํ ๊ฒ์ ๋ํ ๋ด์ํ์์ฆ ๊ธฐ์ฌ์ ๋๋ค. ์ด ํ๋ก์ ํธ๊ฐ, ๋จ์ํ ์นํ๊ฒฝ ์ ์ธ์ ๋์ด์ ์ ๋ต์ ์ธ ์๋์ง ์ธํ๋ผ ๊ตฌ์ถ์ผ๋ก ํด์๋๋ค๊ณ ํ๋๋ฐ์, ๋์ ๊ณ ๋ ๋๋ถ์ ์ผ์ฌ๋์ด ๊ฐํ๊ณ ๊ณต๊ธฐ ๋ฐ๋๊ฐ ๋ฎ์์ ํจ๋ ํจ์จ์ด ๋ ์ข๊ณ , ๋๊ฐ ๋ถ๋ด๋ ์ค์ด๋ ๋ค๊ณ ํฉ๋๋ค. ์ด ์ ๋ ฅ์ ์์ฒ ํฌ๋ก๋ฏธํฐ ๋จ์ด์ง ๋๋ถ ์ฐํด ์ง์ญ์ผ๋ก ์ก์ ๋์ด์ ๊ณต์ฅ๊ณผ ๋์์ ์ ๊ธฐ๋ฅผ ๊ณต๊ธํ๋ ๋ฐฉ์์ผ๋ก ์ฐ๊ฒฐ๋๊ณ ์๋๋ฐ์. ์ ์ฅ ์์คํ ๊ณผ ๊ณ ์ ์ก์ ๋ง ๊ตฌ์ถ ๊ฐ์ ๋ณด์ ์ฅ์น๋ค์ด ๊ฐ์ถฐ์ง๋ฉด, ์ด ์ง์ญ์ด ๊ฑฐ๋ํ โ๊ธฐ์ ๋ฐ์ ์ผํฐโ๋ก ์ฑ์ฅํ ๊ฐ๋ฅ์ฑ์ด ์์ต๋๋ค.
Advertisement, Privacy, and Intimacy: Lessons from Social Media for Conversational AI by Hugging Faceโs Ethics Team
์์ ๋ฏธ๋์ด์ ๋ฐ์ดํฐ ์์ง ๊ดํ, ์ด ๊ดํ์, ์ฐ๋ฆฌ์๊ฒ ์ ๋๋ผํ๊ฒ โ์ฌ์ฉ์๋ ์ํโ์ด๋ผ๋ ๋ถํธํ ์ง์ค์ ์๋ ค์คฌ์ฃ . ์ด์ ๋ํํ AI์๋ ๋น์ทํ ๋ฐ์ด๋๋ฆฌ์ ๋ํ ๋ ผ์๊ฐ ํ์ํ๋ค๋ ๊ธ์ ๋๋ค. AI์ 1:1๋ก ๋ํํ๋ ํ๊ฒฝ์ ๊ณต๊ฐ ํ๋ซํผ๊ณผ๋ ๋ค๋ฅด๊ฒ ๋ ๊น๊ณ ๋ด๋ฐํ, ๊ฐ์ธ์ ์ธ ์ ๋ณด๋ฅผ ๋์ด๋ด๊ธฐ ์ฝ๊ณ , ์ด ๊ณผ์ ์ด ๊ด๊ณ ์์ต๊ณผ ๊ฒฐํฉ๋๋ค๋ฉด ์ฌ์ฉ์์ ์ธ์ง์ ์ ํ์ ์ํฅ์ ์ค ์ ์์ต๋๋ค. ์ด ๊ธ์ AI ํ์ฌ๋ค์ด ํฌ๋ช ํ๊ฒ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ์์ ๋ฐํ์ผ ํ๊ณ , ์ฌ์ฉ์๋ค์ด ์ค์ค๋ก ๋ฐ์ดํฐ ํ๋ฆ์ ํต์ ํ ์ ์์ด์ผ ํ๋ค๊ณ ๊ฐ์กฐํฉ๋๋ค. ๋, ์คํ์์ค ๋ชจ๋ธ์ ํ์ฉํ๋ฉด โ๋ด ๋ฐ์ดํฐ๊ฐ ์ด๋๋ก ๊ฐ๋๊ฐโ์ ๋ํ ์ ํ๊ถ์ ๋ ๊ฐ์ง ์ ์๋ค๋ ์ ์๋ ๋ง๋ถ์ด๊ณ ์์ต๋๋ค.
์คํAI๊ฐ LLM์ด ์ ์น์ ํธํฅ์ ๋ดํฌํ ๊ฐ๋ฅ์ฑ์ ์ฒด๊ณ์ ์ผ๋ก ์ง๋จํ๊ณ ์ค์ด๋ ค๋ ์์ฌ์ ๋ ธ๋ ฅ์ ์๊ฐํฉ๋๋ค. ์ฝ 500๊ฐ์ ์ฃผ์ ์ ๋ค์ํ ์ ์น ์ฑํฅ์ ์ปค๋ฒํ๋ ํ๋กฌํํธ ์ธํธ๋ฅผ ๊ตฌ์ฑํ๊ณ , ํธํฅ์ด ๋ํ๋๋ ์ถ(์ฌ์ฉ์ ๋ฌด์, ๊ฐ์ ๊ณผ์, ์ผ๋ฐฉ์ ์์ ๋ฑ)์ ๋ค์ฏ ๊ฐ์ง๋ก ์ ์ํด์ ์๋์ ์ธ ํ๊ฐ ์์คํ ์ ๋ง๋ค์์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ต์ GPT-5 ๋ชจ๋ธ์ ์ค๋ฆฝ์ ํน์ ์ฝํ ํธํฅ ํ๋กฌํํธ์๋ ์์ ์ ์ธ ์๋ต์ ๋ณด์ด๋ฉฐ, ๊ฐ์ ์ ์ผ๋ก ์๊ทน์ ์ธ ๋ฌธ์ฅ์ ์ฌ์ ํ ํธํฅ ์ํ์ด ์กด์ฌํ์ง๋ง ์ด์ ๋ชจ๋ธ ๋๋น ๊ฐ์ ๋์๋ค๋ ๊ฒฐ๊ณผ๊ฐ ๋์์ต๋๋ค. ์์ผ๋ก๋ ํธํฅ์ ๋ ์ธ๋ฐํ๊ฒ ๊ฒ์ถํ๊ณ ๋ณด์ ํ๋ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ตฌ๋ฅผ ์ด์ด๊ฐ๊ฒ ๋ค๋ ๋น์ ๋ ํฌํจ๋ผ ์์ต๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
๊ธ์ฃผ์๋ โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ 3๊ฐ์ง๋ฅผ ์๊ฐํ๊ฒ ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
Liquid AI์ LFM-8B-A1B
LFM2-8B-A1B just dropped on @huggingface!
8.3B params with only 1.5B active/token ๐
> Quality โ 3โ4B dense, yet faster than Qwen3-1.7B
> MoE designed to run on phones/laptops (llama.cpp / vLLM)
> Pre-trained on 12T tokens โ strong math/code/IFโ Maxime Labonne (@maximelabonne)
1:58 PM โข Oct 7, 2025
Apriel-1.5-15B-Thinker by SLAM Lab and ServiceNow
SLAM Lab๊ณผ ServiceNow๊ฐ ๊ณต๊ฐํ Apriel-1.5-15B-Thinker๋ 150์ต ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ์คํ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ๋ชจ๋ธ์ ๋๋ค. Pixtral-12B๋ฅผ ๊ธฐ๋ฐ์ผ๋ก, ๊น์ด ์ ์ค์ผ์ผ๋ง(Depth Upscaling)๊ณผ ๋จ๊ณ์ ์ฐ์ ์ฌ์ ํ์ต(Staged Continual Pretraining), ๊ทธ๋ฆฌ๊ณ ์ถ๋ก ๊ณผ์ (Reasoning Traces)์ด ํฌํจ๋ ๊ณ ํ์ง์ ์ง๋ ํ์ธํ๋(Supervised Fine-Tuning)์ ๊ฒฐํฉํด์ ๋ง๋ค์ด์ก์ต๋๋ค. ์ด ๋ชจ๋ธ์ Artificial Analysis Intelligence Index์์ 52์ ์ ๊ธฐ๋กํ๋ฉด์, ๋ ์ ์ ์์์ผ๋ก DeepSeek-R1-0528 ๋ชจ๋ธ๊ณผ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค. ๋ AIMEโ25์์ 87%, CharXiv์์ 88.2%์ ์ ์๋ฅผ ๊ธฐ๋กํด์, ๋จ์ผ GPU ํ๊ฒฝ์์๋ ๋ ํฐ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ๋ ์ถ๋ก ํจ์จ์ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Ling-1T from Ant Group
Ant Group์ด ๋ฐํํ Ling-1T๋ 1์กฐ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ฒ์ฉ ๋ํ ์ธ์ด ๋ชจ๋ธ๋ก, Ling(๋ฐฑ๋ น, BaiLing) ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ์ ์ต์ ๋ฒ์ ์ ๋๋ค. ๋ ผ๋ฆฌ์ ์ถ๋ก , ์ฝ๋ ์์ฑ, ์ํ ์์ญ์์ ์ต์ฒจ๋จ(SOTA) ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ , AIME 2025 ๋ฒค์น๋งํฌ์์ 70.42%๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. ํ ๋ฌธ์ ๋น 4,000๊ฐ ์ด์์ ์ถ๋ ฅ ํ ํฐ์ ์์ฑํ ์ ์์ ์ ๋๋ก ๊ธด ์ถ๋ก ์ ์ง์ํฉ๋๋ค. Ling ํจ๋ฐ๋ฆฌ๋ ๋น์ถ๋ก ํ MoE ๋ชจ๋ธ(Ling), ์ถ๋ก ์ค์ฌํ Ring ๋ชจ๋ธ, ๋ฉํฐ๋ชจ๋ฌ Ming ๋ชจ๋ธ, ๊ทธ๋ฆฌ๊ณ ์คํ์ ์ธ LLaDA-MoE ๋ชจ๋ธ๋ก ๊ตฌ์ฑ๋์ด ์๊ณ , ํฌ์ฉ์ ์ธ AGI ๊ฐ๋ฐ์ ์ํด์ ์คํ์์ค ์ํ๊ณ๋ก ๊ณต๊ฐ๋์์ต๋๋ค. โ> [๋ฐํ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply