- Turing Post Korea
- Posts
- ๐FOD#119: GPUแแ ก แแ ฎแฏแ แ ตแแ ณแซ แแ กแทแแ ฅแผ แแ ฅแแ ฅ, แแ ฃแผแแ กแแ ก แแ กแทแแ ฆแแ กแแ ณแซ แแ ฉแแ ญแผแแ กแซ แแ งแจแแ ตแซ
๐FOD#119: GPUแแ ก แแ ฎแฏแ แ ตแแ ณแซ แแ กแทแแ ฅแผ แแ ฅแแ ฅ, แแ ฃแผแแ กแแ ก แแ กแทแแ ฆแแ กแแ ณแซ แแ ฉแแ ญแผแแ กแซ แแ งแจแแ ตแซ
+ แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
GPU์ ํฌํจ ์ ์์ ์์ญ์
โํฑํก ๋ฏธ๊ตญ ๋ฒ์ธ์ ์ง๋ถ 15%๋ฅผ ๋ณด์ ํ๊ฒ ๋ ํ์ฌโ๋ก โ์ค๋ผํดโ์ด ์ต๊ทผ์ ๋ด์ค์ ์ข ์ข ๋ฑ์ฅํ์ฃ . ์ค๋ผํด ํ๋ฉด ์ฌ์ค ๋ฌด์กฐ๊ฑด โ๋๋ฆฌ ์จ๋ฆฌ์จโ์ด ๋ ์ค๋ฅผ ์ ๋์ด๊ธด ํ์ง๋ง, ์ต๊ทผ์ ๋ ๋ช ์ ์์์ด ์ค๋ผํด์ ๋ฏธ๋๋ฅผ ๋งก์ ๊ณต๋ CEO๋ก ์๋ช ๋์์ต๋๋ค (๋ฌผ๋ก ๋๋ฆฌ ์จ๋ฆฌ์จ์ ํ์ฅ์ด๊ณ , ์ง์ CEO๋ โ์ฌํ๋ผ ์บ์ธ โ๋ผ๋ ๋ถ์ด์์ต๋๋ค): ๋ฐ๋ก, ์ค๋ผํด์ ํด๋ผ์ฐ๋ ์ธํ๋ผ ๋ถ๋ฌธ ์ฌ์ฅ์ ์ง๋ธ ํด๋ ์ด ๋งค๊ฑฐํฌ, ๊ทธ๋ฆฌ๊ณ ์ค๋ผํด ์ธ๋์คํธ๋ฆฌ ์ฌ์ฅ์ผ๋ก ๋ฒํฐ์ปฌ ์ ํ๋ฆฌ์ผ์ด์ ๊ณผ ์์ฉ AI ๋ถ๋ฌธ์ ์ด๋์ด ์จ ๋ง์ดํฌ ์์ค๋ฆฌ์์ ๋๋ค.
โThe promotion of the two executives underscores the tech industry and Wall Streetโs focus on cloud computing strategy, as companies pour billions of dollars into expanding the infrastructure that powers AI.โ
โ๋ ์์์ ์น์ง์, ๊ธฐ์ ๋ค์ด AI๋ฅผ ๊ตฌ๋ํ๋ ์ธํ๋ผ๋ฅผ ํ์ฅํ๊ธฐ ์ํด์ ์์ญ์ต ๋ฌ๋ฌ ์ด์์ ์์๋ถ๊ณ ์๋ ํ๊ฒฝ์์, ํ ํฌ ์ธ๋์คํธ๋ฆฌ ๊ทธ๋ฆฌ๊ณ ์์คํธ๋ฆฌํธ๊ฐ ๊ณ์ํด์ ํด๋ผ์ฐ๋ ์ปดํจํ ์ ๋ต์ ์ง์คํ๊ณ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์ค๋๋ค.โ
๋ก์ดํฐ ํต์ ์์ ๋ด๋์ ์ ๊ธฐ์ฌ๋ฅผ ๋ณด๋ฉด์, (๋ด์ค์ ๋ฏธ๋์ด๋ฅผ ํตํด์) ์ฐ๋ฆฌ๊ฐ AI์ ๋ฏธ๋๋ฅผ ๋ฐ๋ผ๋ณด๋ ํ๋ ์์ ๋ํด์ ํ ๋ฒ ์๊ฐํด ๋ณด๊ฒ ๋์ต๋๋ค. ์์คํธ๋ฆฌํธ์ ๊ด์ ์์๋, ์ด์ผ๊ธฐ๋ ๊ฐ๋จํฉ๋๋ค: AI์ ์์๊ฐ ๋๋ฉด GPU๊ฐ ๋ ํ์ํ๊ณ , ๋ฐ์ดํฐ์ผํฐ๋ ๋ ์ปค์ง ํ ๊ณ , ํด๋ผ์ฐ๋ ์ปจํธ๋ํธ๋ ๋ ๋ง์์ง ๊ฑฐ๋ผ๋ ๊ฒ๋๋ค.
๋ฉฐ์น ์ ์ธ 22์ผ ์คํAI์ ์๋น๋์๊ฐ 10๊ธฐ๊ฐ์ํธ ๊ท๋ชจ์ GPU ์ธํ๋ผ๋ฅผ ๋ฐฐ์น(Deploy)ํ๊ฒ ๋ค๋ ํํธ๋์ญ์ ๋ฐํํ๋๋ฐ์, ์ด ๋ฐํ๋ก ์์์ ์ด์ผ๊ธฐํ ํ๋ ์์ ๋ ๋จ๋จํด์ก์ ๊ฒ๋๋ค. ์ด์จ๋ , ์์คํธ๋ฆฌํธ ์ฌ๋๋ค์ ๋จธ๋ฆฌ ์์์๋ โAIโ๋ผ๋ ๋ง์ ์ด๋์ ๋ฃ์๋ง์ โํด๋ผ์ฐ๋์ Capacityโ, ๊ทธ๋ฆฌ๊ณ โ์ค๋ฆฌ์ฝ ์นฉ ๊ณต๊ธโ์ด๋ผ๋ ๋จ์ด๋ก ๋ฒ์ญ์ด ๋ ์ ๋์ผ ๊ฒ๋๋ค.
๊ทธ๋์, ์คํ๋ ค ๋ โ์ฐ๊ตฌ๋ก๋ถํฐ ํ์ธํ ์ ์๋ ์กฐ์ฉํ ์๊ทธ๋โ์ ๋ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ด๋๊ฒ ์ค์ํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ด ์๊ทธ๋์ โ์ค์ผ์ผ๋ง(Scaling)โ์ด โ๋ ๋ง์ ํ๋์จ์ดโ์ ๋์์ด๋ผ๊ณ ์ธ์น๋๊ฒ ์๋๋ผ, โ๋ ์ค๋งํธํ ์ํ ๊ณต์๊ณผ ์ํคํ ์ฒโ๋ผ๊ณ ๋ถ๋ฅด์ง๋ ์๊ทธ๋๋ค์ด์ฃ . ๊ทธ๋ฆฌ๊ณ , โ์์(Quantum) ์ปดํจํ โ ์ด์ผ๊ธฐ๊ฐ ์ด ์๊ทธ๋๋ค์ ์๋น ๋ถ๋ถ์ ์ฐจ์งํฉ๋๋ค.
๊ฝค ์ค๋ ๋์, ์์ ์ปดํจํ ์ฐ๊ตฌ์๋ค๋ ์์ ์ปดํจํ ์ผ๋ก ๋ญ ํ ์ ์๋์ง ์ ๋๋ก ์๊ฐํ์ง ๋ชปํ์ ๊ฒ๋๋ค. AI๊ฐ ์ด ๋ถ์ผ์๋ ์๋ก์ด ์ถ์ง์ ๋๋ ฅ์ ์ ๊ณตํ๊ณ ์๊ณ , ์ง๊ธ์ โ์ด์ ์ถ๋ก (Inference) ์ค์ผ์ผ๋ง์ด๋ผ๋๊ฒ ๊ผญ ๋ฌด์์ ํ์ผ๋ก ๋ฐ์ด๋ถ์ด๋ ๋ฐฉ์์ผ ํ์๋ ์๋คโ๋ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ค๋ ๋์ค๊ณ ์์ต๋๋ค.
์ง๋ ์ฃผ์ ๋์จ ์ธ ํธ์ ๋ ผ๋ฌธ์ ๋ค์ฌ๋ค๋ณด๋ฉด, AI๊ฐ โ์ฌ์ด์ฆโ๊ฐ ์๋๋ผ โํจ์จ์ฑ(Efficiency)โ์ด๋ผ๋ ๋ ๋ฒ์งธ ์ถ์ ๋ฐ๋ผ์ ์ค์ผ์ผ๋งํ ์ ์๋ค๋ ๊ฑธ ์์ฌํ๊ณ ์๋ ๊ฒ ๊ฐ์๋ฐ์:
์์ถ(Compression): QKAN๊ณผ ์์ ํ์ฑํ ํจ์
์ฒซ ๋ฒ์งธ ๋ ผ๋ฌธ์, โQuantum Variational Activation Functions Empower Kolmogorov-Arnold Networksโ๋ผ๋ ์ ๋ชฉ์ ๋ ผ๋ฌธ์ ๋๋ค. โ์์ ๋ณ๋ถ ํ์ฑํ ํจ์๊ฐ KAN ๋คํธ์ํฌ๋ฅผ ๊ฐํํ๋คโ ์ ๋๋ก ๋ฒ์ญ๋๋ ค๋์?
์ ๋ชฉ์ ๊ธธ์ง๋ง ํต์ฌ์ ๊ฐ๋จํฉ๋๋ค: AI ์ ๊ฒฝ๋ง์ โ์ค์์นโ ์ญํ ์ ํ๋ ํ์ฑํ ํจ์(Activation Function)๋ฅผ ์์ ์ปดํจํ ์คํ์ผ๋ก ๋ฐ๊พธ๋ ๊ฒ๋๋ค. ํ๋ฒํ ์์ ๊ฑฐ๋ฅผ ์ ๊ธฐ ์์ ๊ฑฐ๋ก ์ ๊ทธ๋ ์ด๋ํ๋ฏ์ด, ๊ธฐ์กด์ ๋จ์ํ ์ค์์น - ๋จ์ํ ํ์ฑํ ํจ์ - ๋์ ๋จ์ผ ํ๋นํธ(์์ ๋นํธ) ๋ณ๋ถ ํ๋ก(Variational Circuit)๋ฅผ ๋ฃ์ต๋๋ค (์ด๊ฑธ DARUAN์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค). ์ด ์์, ์๋ก์ด ์ค์์น๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๋ฒ โ์ฌ์ ๋ก๋โํ๋ฉด์, ๋ง์น ์กฐ๊ทธ๋ง ์์์ ์๋ง์ ์๊น์ ๋ด๋ ๋ฏํ ๋๋์ผ๋ก, โ์ง์์ ์ผ๋กโ ํ๋ถํ ํจํด(์ฃผํ์ ์คํํธ๋ผ)์ ๋ง๋ค์ด๋ด์. ๊ทธ๋์, ๋ชจ๋ธ์ด ํจ์ฌ ์ ์ ๋งค๊ฐ๋ณ์๋ก๋ ๋๊ฐ์ด ๊ฐ๋ ฅํ ํ์ ๋ฐํํ ์ ์๋ ๊ฑฐ์ฃ .
์ฐ๊ตฌ์๋ค์ด ์ด ์์ด๋์ด๋ฅผ ํ์ฉํด์ QKAN(์์ KAN)์ ๋ง๋ค์์๋๋ค. QKAN์ ์ซ์ ์์ธก(Regression), ์นดํ ๊ณ ๋ฆฌ ๋ถ๋ฅ(Classification), ์ฌ์ง์ด๋ ChatGPT ๊ฐ์ ํ ์คํธ ์์ฑ ์์ ์ ๋์์ผ๋ก ํ์ ๋ ๊ธฐ์กด์ MLP๋ ๊ณ ์ ์ ์ธ KAN๋ณด๋ค ๋งค๊ฐ๋ณ์๊ฐ 30% ์ด์ ์์๋ ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.

Image Credit: QKAN ๋ ผ๋ฌธ
โAI ์ถ๋ก (Inference) ์ค์ผ์ผ๋งโ์ ๋งฅ๋ฝ์์, QKAN์ด ๋ณด์ฌ์ฃผ๋ ์ด๋ฐ ํผํฌ๋จผ์ค๋, ๋ง์น ๊ฑฐ๋ํ ํธ๋ญ์ด ์๋๋ผ ์ค๋งํธํ ์คํฌ์ธ ์นด๋ก ์ง์ ๋๋ฅด๋ ๊ฒ ๊ฐ๋ค๊ณ ๋ ํ ๊น์? ๋น์ฉ ๊ณก์ ์ ์์ ํ ๊ตฌ๋ถ๋ ค๋ฒ๋ฆฌ๋ ๊ฒ๋๋ค. ํ์ดํผ์ค์ผ์ผ๋ฌ ๊ฐ์ ๋ํ์ AI ํ์ฌ๋ผ๋ฉด, ์๋ก์ด ๋ฐ์ ์๋ฅผ ์ง๋ ๊ฒ๋งํผ์ด๋ ํฐ ๊ฐ์น๊ฐ ์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
ํน์ KAN ๋คํธ์ํฌ์ ๋ํด์ ๊ถ๊ธํ์ ๋ถ์, ์๋์ ๊ธ์ ์ฐธ๊ณ ํ์๊ธฐ ๋ฐ๋๋๋ค:
์ ํ์ฑ(Exactness): ๊ฒฉ์ ์๊ณ ๋ฆฌ์ฆ์ ์ํ ์ฝ์ (Coset) ์ํ๋ง
์ผ๋จ ๊ฐ๋จํ ๋ฐฐ๊ฒฝ ์ง์์ ๋จผ์ ์์๋ณผ๊ป์:
๊ฒฉ์ ์๊ณ ๋ฆฌ์ฆ(Lattice Algorithm)์ ๋ค์ฐจ์ ๊ฒฉ์ ๊ตฌ์กฐ์ ์ํ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์๊ณ ๋ฆฌ์ฆ์ธ๋ฐ, ์์ ์ปดํจํ ์์ ์ต๋จ ๋ฒกํฐ ๋ฌธ์ ๋ ํ์ต ์ค๋ฅ ๋ฌธ์ (LWE)๊ฐ์ ์ํธํ ๊ด๋ จ๋ ๋์ ๋ฅผ ํจ์จ์ ์ผ๋ก ํธ๋๋ฐ ํ์ฉ๋๋ค๊ณ ํฉ๋๋ค. ์ด์ ๊ด๋ จ๋ ์ฝ์ ์ํ๋ง(Coset Sampling)์ ๊ฒฉ์์ ์ฝ์ (๋ถ๋ถ ์งํฉ)์ ์ ํํ๊ฒ ์ถ์ถํ๋ ๊ธฐ์ ์ธ๋ฐ, ์๋ ค์ง์ง ์์ ์คํ์ ์ ์ ๊ฑฐํด์ ํ์ ํธ๋ฆฌ์ ์ํ๋ง ๋จ๊ณ๊ฐ ์ฆ๋ช ๊ฐ๋ฅํ๊ฒ ์ ํํด ์ง๋๋ก ํด์, ์์ ๊ฒฉ์ ์๊ณ ๋ฆฌ์ฆ์ ์ ๋ขฐ์ฑ์ ๋์ด๋๋ฐ ๋์์ ์ค๋ค๊ณ ํฉ๋๋ค.
์ฝ์ (Coset)์ ๊ทธ ๊ฒฉ์๋ฅผ ์กฐ๊ธ '์ด๋'(Offset)์ํจ ๋ถ๋ถ ์งํฉ์ ๋๋ค. ์ฝ์ ์ํ๋ง์ ์ด ์ฝ์ ์ ์ ํํ๊ฒ ๋ฝ์๋ด๋ ๋ฐฉ๋ฒ์ธ๋ฐ, ๋ฌธ์ ๋ ๊ทธ ์ด๋(์คํ์ )์ด ๋ฏธ๋ฆฌ ์๋ ค์ง์ง ์์๋ค๋ ๊ฒ๋๋ค. ์ด ๊ธฐ์ ์ 'Pair-shift Difference'๋ผ๋ ํธ๋ฆญ์ ์จ์ ์คํ์ ์ ์๋ฒฝํ ์ง์๋ฒ๋ฆฌ๊ณ , ๊ท ์ผํ ์ฝ์ ์ ๋ง๋ค์ด์ ๋ค์ ๋จ๊ณ์ธ ํธ๋ฆฌ์ ์ํ๋ง(์ฃผํ์ ๋ถ์์ฒ๋ผ ๋ฐ์ดํฐ์ ํจํด์ ์ถ์ถํ๋ ๊ณผ์ )์ด ์ํ์ ์ผ๋ก ์ฆ๋ช ๋ ๋งํผ ์ ํํด์ง๊ฒ ํด ์ค๋ค๊ณ ํฉ๋๋ค. ๋ง์น GPS๊ฐ ์์น ์ค์ฐจ๋ฅผ ์์ ์ ํํ ๊ฒฝ๋ก๋ฅผ ์๋ดํ๋ ๊ฒ์ฒ๋ผ ์์ ๊ฒฉ์ ์๊ณ ๋ฆฌ์ฆ(์: ์ํธ ํด๋ ์ด๋ AI ์ต์ ํ ๋ฌธ์ ํด๊ฒฐ)์ ์ ์ฒด ์ ๋ขฐ์ฑ์ ๋์ฌ์ค๋๋ค.
๊ทธ๋์, ๋ ๋ฒ์งธ ๋ ผ๋ฌธ์ด ๋ฐ๋ก โExact Coset Sampling for Quantum Lattice Algorithmsโ๋ผ๋ ๋ ผ๋ฌธ์ ๋๋ค. ์ ๋ชฉ ์์ฒด๋ ์์ ์ํ์ ์ธ ๋ด์ฉ์ฒ๋ผ ๋๊ปด์ง๊ณ AI์๋ ๊ฑฐ๋ฆฌ๊ฐ ๋ฉ์ด๋ณด์ด๊ธฐ๋ ํ์ฃ .
์ด๊ฒ ์ AI ์ถ๋ก (Inference)์ ์์ด์ ์ค์ํ ๊น์?
์์ฆ AI ๋ชจ๋ธ๋ค์ โ๋๋คํ ๊ธธโ์ ๋ฐ๋ผ๊ฐ๋ ๊ฒ์ฒ๋ผ ์๊ฐ์ ํ์ฃ - ๋ฏธ๋ก์์ ๋์ ๊ฐ๋ฆฌ๊ณ ํค๋งค๋ฏ์ด, CoT๋ฅผ ๋ฐฉํฉํ๊ฑฐ๋ ๊ฒ์์ ๋์ถฉ(?) ํ๊ฑฐ๋, ๊ฒฝํ์น - ํด๋ฆฌ์คํฑ - ์ผ๋ก ๋๊ตฌ๋ฅผ ํธ์ถํฉ๋๋ค. ์ค์ฐจ์์ด ์ ํํ ๊ณผ์ ์ ๊ฑฐ์น๋ ๊ฐ๋ ์ด ์๋๊ณ , โ์ ํํโ ๋ต์ด ๋๋ฌผ์ฃ . ํ์ง๋ง ์์์ ์ค๋ช ํ ๊ธฐ์ ์ฒ๋ผ ์ํ์ ์ผ๋ก โ๋ณด์ฅ๋โ ๋จ๊ณ๋ฅผ AI ์ํฌํ๋ก์ฐ์ ๋ผ์๋ฃ๊ฒ ๋๋ฉด, AI์ ์ ๋ขฐ์ฑ์ด ์ฌ๋ผ๊ฐ๊ฒ ์ฃ .
QKAN์ด ๋ชจ๋ธ์ โ์์ถโํด์ ์๊ณ ๊ฐํ๊ฒ ๋ง๋๋ ๊ฑฐ๋ผ๋ฉด, ์ด ๋ ๋ฒ์งธ ๋ ผ๋ฌธ์ โ์ ํ์ฑโ์ ๊ฐ์กฐํฉ๋๋ค: ์ธ๋ฐ์๋ ํ ํฐ์ ์ค์ด๊ณ , ๋ง๋ค๋ฅธ ๊ณจ๋ชฉ์ ํผํ๊ฒ ํด ์ฃผ๊ณ , ํ ๋ฒ ์ฟผ๋ฆฌํ ๋ ๋น์ฉ์ด ๋ ๋ค์ญ๋ ์ญํ๊ฒ๋, ๋น์ฉ์ ๋ณ๋์ฑ์ ๋ฎ์ถ๋ ๊ฒ๋๋ค.
ํ์ด๋ธ๋ฆฌ๋ํ(Hybridization): ์ค์ ์์์ ์์-๊ณ ์ ๋ชจ๋ธ
์ธ ๋ฒ์งธ ์ธ๊ธํ ๋ ผ๋ฌธ์ ์ข ๋ ์ค์ฉ์ ์ด๋ผ๊ณ ํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค: โHybrid Quantum-Classical Model for Image Classificationโ์ด๋ผ๋ ์ด๋ฆ์ ์ด ๋ ผ๋ฌธ์, ๊ณ ์ ์ ์ธ CNN(Convolutional Neural Network)์ ๊ณ์ธต๋ค ์ค ์ผ๋ถ๋ฅผ โ์์ ์ปดํจํ ๊ธฐ๋ฐ์ ์์ ๋ชจ๋ - ์์ ํ๋กโ๋ก ๊ต์ฒดํ๊ฑฐ๋ ์ถ๊ฐํ ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ์ ๋ง๋ค์ด์, ์ ์ธก์ ๊ฐ์ ์ ํฉ์น๊ฒ ๋ค๋ ์์ด๋์ด์ ๋๋ค. ๊ตณ์ด ๋น๊ตํ์๋ฉด, ๊ฐ์๋ฆฐ ์์ง์ ์ฐ๋ ์๋์ฐจ์ ์ ๊ธฐ ์์ง์ ์ด์ง ๋ํด์ ํ์ด๋ธ๋ฆฌ๋ ์ฐจ๋ฅผ ๋ง๋๋ ๊ฒ ๊ฐ๋ค๊ณ ๋ ํ ๊น์?
CIFAR100, STL10 ๋ฐ์ดํฐ์ ์ผ๋ก ํ ์คํธํด ๋ณธ ๊ฒฐ๊ณผ, ์์ํ ํด๋์ ๋ชจ๋ธ๋ณด๋ค ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๊ณ , ํ๋ จ๋ ๋ ๋น ๋ฅด๊ฒ ์งํ๋๊ณ ๋งค๊ฐ๋ณ์๋ ๋ ์ ์๋ค๊ณ ํฉ๋๋ค. ์ด์ฉ๋ฉด, ํ์ค์ ์ธ AI ์์ ์์๋ ์์ ๊ตฌ์ฑ์์๊ฐ AI ๋ชจ๋ธ์ ํจ์จ์ฑ์ ๊ฐ์ ํ ์ ์๋ค๋ ์ฆ๊ฑฐ ์๋๊น์?

Image Credit: โHybrid quantum-classical convolutional neural network architectureโ
์ด์ฉ๋ฉด, ์ค๋ฅ ๋ด์ฑ ์์ ์ปดํจํฐ(Fault-Tolerant Quantum Computer)๋ผ๋ ๋ชฉํ๊ฐ ๋ฌ์ฑ๋์ง ์์๋ ์๋ง์ ์์ ์ ์์ ์ปดํจํ ์ ์ด์ฉํ ์์ฒญ๋ ํจ์จ์ฑ ๊ฐ์ ์ ์ด๋ฃฐ ์ ์์์ง๋ ๋ชจ๋ฆ ๋๋ค. AI์ ์ถ๋ก ๋งฅ๋ฝ์์๋, ์๋ฎฌ๋ ์ด์ ๋ ๊ฒ์ด๋ ์๋๋ฉด ๋ฌผ๋ฆฌ์ ์ผ๋ก ์๋ํ๋ ๊ฒ์ด๋ , ๋ช ๊ฐ์ ํ๋นํธ๋ง ๊ฐ์ง๊ณ ๋ ๊ณ ์ ์ ์ธ AI ํ์ดํ๋ผ์ธ์ ์ ๊ฒฐํฉํ๋ฉด ์ง๊ธ๋ณด๋ค ํจ์ฌ ๋ ํจ์จ์ ์ธ ์ถ๋ก ์ ํ ์ ์๋ ๊ฑฐ๊ตฌ์. ์ด๊ฑด, ๋ชจ๋ ํ์ดํผ์ค์ผ์ผ๋ฌ๊ฐ ๊ฟ๊พธ๋, ๋น ๋ฅธ ํ๋ จ, ๋ ์ ์ ๋ฉ๋ชจ๋ฆฌ ์๋น๋ผ๋ ์งํ์ ๋ค๊ฐ๊ฐ๊ฒ ํด ์ฃผ๋ ํ๋์ ๊ฐ๋ฅ์ฑ์ ๋๋ค.
โ์ถ๋ก (Inference) ์ค์ผ์ผ๋งโ์ ์์ด์์ ์๋ฏธ
์์์ ๊ฐ๋จํ ๋ง์๋๋ฆฐ ๋ ผ๋ฌธ๋ค์ ์ข ํฉํด ๋ณด๋ฉด, ๊ฒฐ๊ตญ โ์ค์ผ์ผ๋ง(Scaling)โ์ด ๋ ํฐ ํด๋ฌ์คํฐ, ๋ ํฐ ๋ชจ๋ธ์ ํฅํ ๋๋ฐ์ง๋ง์ ์๋ฏธํ๋ ๊ฒ ์๋๋ผ๋ ๊ฑธ ์์ฌํฉ๋๋ค. ๊ฐ๊ฐ์ ๋งค๊ฐ๋ณ์์์ ๋ ๋ง์ ์ ๋ณด์ ์๋ฏธ๋ฅผ ์ถ์ถํด ๋ด๊ณ , ์ค๋ฅ๋ฅผ ๊ทธ ์์ฒ(Source)์์ ์ฐจ๋จํ๊ณ ์ค์ฌ๋๊ฐ๊ณ , ์์(Quantum) ์ปดํจํ ๊ณผ ๊ณ ์ (Classical) ์ปดํจํ ์ ๊ฐ์ ์ ์๋ ๊ฒ๋๋ค.
์์คํธ๋ฆฌํธ์ ๊ด์ ์์์ผ โํด๋ผ์ฐ๋ ์๋ณธ ์ง์ถโ์ด ๋ฌด์๋ณด๋ค ํฌ๊ฒ ๋ณด์ด๋, ๊ทธ๋ฆฌ๊ณ ์ค์ํ ์งํ๊ฒ ์ง๋ง, ์ง๊ธ ์ด๋ค์ง๊ณ ์๋ ๋ค์ํ ์ฐ๊ตฌ๋ค์, โ๊ทธ ๊ณ์ฐ๋ฒ์ ๋ค์ ๊ตฌ์ฑํ ์ ์๋, ์๋กญ๊ฒ, ๊ทน์ ์ผ๋ก ํจ์จ์ฑ์ ๊ฐ์ ํ ๊ธฐ๋ณธ์ ์์๋ค์ ํ๊ตฌโํ๊ณ ์๋ค๋ ๊ฒ์๋ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ฌ์ผ ํฉ๋๋ค.
๋น์ฐํ, ์๋น๋์ ๊ฐ์ ํ์ฌ๋ค์ด ์ด๊ฑธ ๋์น ๋ฆฌ ์์ฃ . ์๋น๋์์ ์์ ์ปดํจํ ์ ๋ํ ํฌ์๋ ๊ณ์ํด์ ๋น ๋ฅด๊ฒ ์ฆ๊ฐํ๊ณ ์์ต๋๋ค; ํ์ด๋ธ๋ฆฌ๋ ์์-๊ณ ์ ํ๋ก๊ทธ๋๋ฐ์ ์ํ ์คํ ์ํํธ์จ์ด ํ๋ซํผ์ธ CUDA-Q๋ฅผ ๋ง๋ค์๊ณ , DGX Quantum์ด๋ผ๋ ๋ ํผ๋ฐ์ค ์ํคํ ์ฒ๋ฅผ ์ถ์, ์์ ์ ์ด ์์คํ ์ AI ์ํผ์ปดํจํฐ์ ์ง์ ์ฐ๊ฒฐํ๊ธฐ๋ ํ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฌ ํ๋์จ์ด ํํธ๋๋ค๊ณผ ํจ๊ป ์ ์ฉ ์์ ์ฐ๊ตฌ์ผํฐ๋ฅผ ์ด๊ณ ์๊ธฐ๋ ํ์ฃ .
์ ์จ ํฉ์ NVentures๋ฅผ ํตํด์ PsiQuantum, Quantinuum, QuEra ๊ฐ์ ์์ ์คํํธ์ ์ ์ ๊ทน์ ์ผ๋ก ํฌ์ํ๊ณ ์๊ธฐ๋ ํฉ๋๋ค. PsiQuantum์ ์ต๊ทผ์ 10์ต ๋ฌ๋ฌ ํฌ์๋ฅผ ๋ฐ๊ธฐ๋ ํ๊ณ , ์์ผ๋ก 2๋ ์์ ์๋ํ๋ ์์ ์ปดํจํฐ๋ฅผ ์ถ์ํ๊ฒ ๋ค๊ณ ํ๋ค์.
์ด์จ๋ , ์๋น๋์์ ์ด๋ฐ ์์ง์์ 2025๋ ์ ๋ค์ด์ ๋๋๋ฌ์ง ์ค์ํ ์ ๋ต์ ์์ง์์ด๊ณ , ์์ ์ปดํจํ ์ โ์์ ์ ์คํโ์ ๋ํ ํ์๋ผ์ธ์ ์ด๋ ์ ๋ ๊ฐ์ํํ๋ ๊ฒ ์๋๊น ํฉ๋๋ค.
์์ผ๋ก ์ฐ๋ฆฌ๊ฐ ๋ณด๊ฒ ๋ ๊ฒ
์ง๊ธ๊น์ง์ฒ๋ผ, ๋๊ท๋ชจ์ โํด๋ผ์ฐ๋ ๊ตฌ์ถ(Build-out)โ์ ๊ณ์๋ ๊ฒ๋๋ค. GPU๋ ์ด ์ฑ์ฅ์ ์ฃผ์ญ์ผ๋ก, ์ฌ์ ํ ์ค์ฌ์ ์์ ๊ฑฐ๊ตฌ์.
ํ์ง๋ง, ๋ฏธ๋๋ฅผ ํฅํ ์ฐ๊ตฌ ํ์ดํ๋ผ์ธ์ ์ฃผ์๋ฅผ ๋์น์ง ์๋๋ค๋ฉด, ์์ ์ปดํจํ ๊ณผ ๊ด๋ จ๋ ์์ด๋์ด๊ฐ ์ ์ฐจ โ์ถ๋ก ์ค์ผ์ผ๋งโ ๋ด๋ฌํฐ๋ธ์ ์ฐ๊ฒฐ๋๊ณ ํฉ์ณ์ง๋ ๋ชจ์ต์ ํ์ธํ ์ ์์ ๊ฒ๋๋ค.
์์ง์ ์ด๊ธฐ์ผ์ง ๋ชจ๋ฅด์ง๋ง, ํจ์จ์ฑ(Efficiency), ๊ทธ๋ฆฌ๊ณ ๊ตฌ์กฐ(Structure; Architecture)๊ฐ ์์์ ์ธ ์ค์ผ์ผ๋ง๋งํผ ์ค์ํด์ง๋ ์๊ธฐ๊ฐ ์ฌ ๊ฒ๋๋ค.
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
LoRA(Low-Rank Adaptation)๋, ์ ์ฒด ๋ชจ๋ธ์ ๋ค์ ํ์ต์ํค๋ ๋์ ์ ์์ ์ ๋ญํฌ ํ๋ ฌ์ ์ถ๊ฐํ๋ ๋ฐฉ์์ผ๋ก ํจ์จ์ ์ผ๋ก ๋ชจ๋ธ์ ํ์ธํ๋ํ ์ ์๊ฒ ํด ์ฃผ๋ ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค.
๋ค๋ฅธ AI ๋ถ์ผ์ ๋ง์ฐฌ๊ฐ์ง๋ก, ์ด ๋ถ์ผ๋ ๊ณ์ํด์ ๋ฐ์ ํ๊ณ ์์ฃ . ์๋ก์ด LoRA ๊ธฐ๋ฒ๋ค์ด ๋์ค๋ฉด์ ํจ์จ์ฑ, ์ผ๋ฐํ ๋ฅ๋ ฅ, ๊ฐ์ธํ๋ผ๋ ์์ญ์์ ๋ชจ๋ธ์ ๋ฅ๋ ฅ์ ํ๊ณ๊น์ง ๋์ด์ฌ๋ฆฌ๊ณ ์์ต๋๋ค.
๊ผญ ์์๋ ๋งํ ์ต์ ์ LoRA ๊ธฐ๋ฒ 10๊ฐ์ง๋ฅผ ์๊ฐํฉ๋๋ค:
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
์๋ฆฌ๋ฐ๋ฐ์ ์์ด์ ํธ, ์กฐ๊ธ โ๋ถํธํ ์ ๋โ๋ก ๋๋ํด์ง๋?
์ฑ๋ด์ ๋ญ๊ฐ ์์ฒญ์ ํ์ ๋, ๋๊ตฌ(Tool)๋ฅผ ๋ง ๊ทธ๋๋ก ์ฐ๋ค๊ฐ ๋ง๊ณ โ๋ฉ์ถฐ๋ฒ๋ฆฌ๋โ ๋ฌธ์ ๋ค์ด ์ข ์ข ์ผ์ด๋์ฃ . ๋ง์ ์ฐ๊ตฌ์์ ํ์ฌ์์ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๊ณ ๊ณ ๊ตฐ๋ถํฌํ๊ณ ์๋ ๊ฐ์ด๋ฐ, ์๋ฆฌ๋ฐ๋ฐ์ Tongyi ์ฐ๊ตฌ์๋ ์ด๋ฏธ ํ ๋ฐ ์์๊ฐ๊ณ ์๋ ๊ฒ์ฒ๋ผ ๋ณด์ด๋ค์.
๊ณํํ๊ณ , ์ ์ํ๊ณ , ์ถ๋ก ํ๊ณ , ์ฌ์ง์ด ์ธ์ ๋ง์ ๋ฉ์ถฐ์ผ ํ ์ง๋ ์๋, โ์๊ฐํ๋ ์์คํ โ์ ๋ง๋ค๊ณ ์์ต๋๋ค. ์๋ Tongyi ์ฐ๊ตฌ์๊ฐ ๋ฐํํ ์ฌ์ฏ ํธ์ ๋ฐ์ด๋ ๋ ผ๋ฌธ, ๋ฐ๋ก ์์ด์ ํฑ AI (Agentic AI)์ ๊ฐ๋ฅ์ฑ์ ์๋กญ๊ฒ ์ ์ํ๋ ๋ ผ๋ฌธ๋ค์ ๋๋ค. ๊ฒ๋ค๊ฐ ๋ชจ๋ ์คํ์์ค ์ฝ๋, ๋ฐ์ดํฐ์ ์ ํจ๊ป ๊ณต๊ฐํ๊ณ ์๋ค์.
WebWeaver: โ์ฌ๋์ฒ๋ผโ ์ฐ๊ตฌํ๋ ์์ด์ ํธ์ ๋๋ค. ์๋ก์ด ์ ๋ณด๋ฅผ ์ฐพ์ ๋๋ง๋ค ๊ณํ์ ์ ๋ฐ์ดํธํ๊ณ , ํ์ํ ์ ๋ณด๋ง ๊ณจ๋ผ ์น์ ๋ณ๋ก ์์ฑํ์ฃ . ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์ฐ๊ฒจ๋ฃ๋ ๋์ ๋๋ํ๊ฒ ์ผํ๋ ๋ฐฉ์์ผ๋ก, ๋ชจ๋ ๋ฅ ๋ฆฌ์์น ๋ฒค์น๋งํฌ์์ 1๋ฑ์ ์ฐจ์งํ์ต๋๋ค.
AgentFounder: ๋ชจ๋ธ์ ์ฒ์๋ถํฐ ์์ด์ ํธ์ฒ๋ผ ํ๋ จ์ํค๋ฉด, ๋์ค์ ๋๊ตฌ ์ฌ์ฉ ๋ฅ๋ ฅ์ ์ต์ง๋ก ๋ถ์ด๋ ๊ฒ๋ณด๋ค ํจ์ฌ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์คฌ์ต๋๋ค. ์ฌ๊ธฐ์๋ ์์ด์ ํธ ์ง์ ์ฌ์ ํ๋ จ(Agentic Continual Pre-training, Agentic CPT)์ด๋ผ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋๋ฐ, 300์ต ๋งค๊ฐ๋ณ์์ ์คํ์์ค ๋ชจ๋ธ์ด ํจ์ฌ ๋ ํฐ ๋น๊ณต๊ฐ ๋ชจ๋ธ์ ๋๊ตฌ ํ์ฉ ์์ ์์ ์ด๊ธฐ๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ๊ธฐ๋ ํ์ต๋๋ค.
WebSailor-V2: ์คํ์์ค ์์ด์ ํธ๊ฐ ๊ฑฐ๋ ๋ชจ๋ธ๋ค๊ณผ ๊ฒฝ์ํ ์ ์๊ฒ ํด ์ค๋๋ค. ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ํ๋ จ์ ์๊ณ , ์ผ๋ถ๋ฌ ํท๊ฐ๋ฆฌ๊ฒ ๋ง๋ ๋ฐ์ดํฐ์ ์ผ๋ก ํ๋ จํด์, ์์ ๋ณด๋ค 20๋ฐฐ ํฐ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ค๋๋ค.
AgentScaler: ๋๋ํ ๋ชจ๋ธ์ ๋ง๋๋ ๋์ , ๋ค์ํ ํ๊ฒฝ์์ ์์ด์ ํธ๋ก์์ ํ๋(Agentic Behavior)์ ๋ฐฐ์ฐ๊ฒ ํ์ต๋๋ค. ์๋ฅผ ๋ค์ด์, ์ด์ํ API ํธ์ถ ์๋๋ฆฌ์ค์์๋ ์ ์๋ํ๋๋ก์. ๋ฏธ์ธ ์กฐ์ ์ ์ข ๋ ํ๊ณ , ์ง์ง ์ง๋ฅ์ ํค์ฐ๋ ๋ฐ ์ด์ ์ ๋ง์ท๋ค๊ณ ๋ณด๋ฉด ๋ ๋ฏ ํฉ๋๋ค.
WebResearcher: ์ฐ๊ตฌ๋ฅผ ํ ๋ฒ์ ๋๋ด๋ ๊ฒ ์๋๋ผ ๊ณ์ ๋ฐ์ ์ํค๋ ์์ด์ ํธ์ ๋๋ค. ๋ฐฐ์ด ๊ฑธ ๊ธฐ์ตํ๊ณ , ๋ณด๊ณ ์๋ฅผ ์ ์ ๋ ์ ๊ตํ๊ฒ ๋ค๋ฌ๊ณ , ์น์ ๋ณต์กํ ๋ฐ์ดํฐ์์ ํต์ฐฐ์ ๋ฝ์๋ ๋๋ค. ์ฌ์ง์ด ์ค์ค๋ก ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค์ด๋ผ ์๋ ์๋ค๊ณ ํ๋ค์.
ReSum: ๊ธด ๋ํ์์๋ ์์ง ์๋๋ก ์์ด์ ํธ๊ฐ ์ค์ค๋ก ์์ฝํ๋ ๋ฒ์ ๋ฐฐ์ฐ๊ฒ ํฉ๋๋ค. ์๋ฐฑ ๋ฒ์ ์ํธ์์ฉ์์๋ ํ๋ฆ์ ์์ง ์๊ณ ๊ณ์ ์ถ๋ก ํ ์ ์์ต๋๋ค; ๊ธฐ์ต๋ ฅ๊ณผ ์ฌ๊ณ ๋ฅผ ํฉ์น ์ ์ ๋๋ค.
ํ์ด ์ฐ๊ตฌ์์ ๋ ผ๋ฌธ๋ค์ ๋ณด๋ฉด, ํ์คํ ๋จ์ํ ๋ฐ์์ ์ธ ์์คํ ์ด ์๋๋ผ ๊ตฌ์กฐ์ ๊ธฐ์ต, ์๋๋ฅผ ๊ฐ์ง๊ณ โ์๊ฐโํ๋ ์์คํ ์ ๋ง๋ค๋ ค๊ณ ํ๋ ๊ฒ ๊ฐ๋ค์. ๋ค์ ํ ๋ฒ ๋ง์๋๋ฆฌ์ง๋ง, ์ด ๋ชจ๋ ๊ฒ ์คํ์์ค๋ผ๋ ๊ฒ๋ ๋๋์ต๋๋ค.
์ธํ + ์๋น๋์ ์ฐํฉ: โ๊ฒฌ์์ง๊ฐโ์ด๋ผ๋ ๋ง๋ ์๋ง์ธ๊ฐ์?
๋๋ผ์ด ์์์ ๋๋ค. ์ธํ ๊ณผ ์๋น๋์๊ฐ ์์ก๊ณ x86 ์นฉ์ ๊ณต๋ ๊ฐ๋ฐํ๊ณ ์์ด์. ์ด ์นฉ์ ์ธํ CPU์ ์๋น๋์ RTX GPU ์นฉ๋ ์ ๊ฒฐํฉํ ๊ฒ์ผ๋ก, ๊ฒ์ด๋ฐ PC์ ์ต์ ํ๋ ์ ํ์ด๋ผ๊ณ ํฉ๋๋ค โ AMD์ APU์ ๋น์ทํ์ง๋ง, ํจ์ฌ ๋ ๊ฐ๋ ฅํ '์์ค'๋ฅผ ๊ณ๋ค์ธ ๋๋์ด์ฃ .
๊ฒ๋ค๊ฐ ์๋น๋์๋ ์์ฌ ๋ฐ์ดํฐ์ผํฐ์ฉ์ผ๋ก ์ธํ ์๊ฒ ๋ง์ถคํ x86 CPU๋ฅผ ์ฃผ๋ฌธํ๊ธฐ๋ ํ์ต๋๋ค. ์ด ํํธ๋์ญ์๋ 50์ต ๋ฌ๋ฌ๋ผ๋ ์ด๋ง์ด๋งํ ํฌ์๋ ํฌํจ๋ผ ์์ต๋๋ค. ๋ฐ๋์ฒด ์ธ์์ ํ๋๊ฐ ํฅ๋ฏธ๋กญ๊ฒ ๋ณํ๊ณ ์๋ค์.
์ด๋ฒ ์ฃผ์ ์ฃผ์ ํฌ์ ์์
Grok
์๋น๋์์ AI ์์ฅ ๋ ์ ์ ๊นจ๊ฒ ๋ค๋ฉฐ 7์ต5000๋ง ๋ฌ๋ฌ๋ฅผ ํฌ์๋ฐ์๊ณ , ๊ธฐ์ ๊ฐ์น๋ 69์ต ๋ฌ๋ฌ์ ๋ฌํฉ๋๋ค. Grok์ LPU ๊ธฐ๋ฐ ์ถ๋ก ๋จธ์ ์ ์์ฅ๊ณผ ํฌ์์๋ค์ ์ฃผ๋ชฉ์ ๋ฐ๊ณ ์์ต๋๋ค.Replit
2์ต5000๋ง ๋ฌ๋ฌ๋ฅผ ํฌ์๋ฐ์ผ๋ฉด์ 30์ต ๋ฌ๋ฌ์ ๊ธฐ์ ๊ฐ์น์ ๋๋ฌํ์ต๋๋ค. AI๋ฅผ ํ์คํ ํ์์ผ๋ก ๋ง๋ค์ด์ฃผ๋ 'Agent 3'๋ฅผ ์ถ์ํ์ต๋๋ค.Figure AI
10์ต ๋ฌ๋ฌ ์ด์์ ์๊ธ์ ํ๋ณดํ๋ฉด์ 390์ต ๋ฌ๋ฌ์ ๊ธฐ์ ๊ฐ์น๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. 4๋ ์์ 10๋ง ๋์ ํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ์ ๋ณด์ด๊ฒ ๋ค๊ณ ์ฝ์ํ์ต๋๋ค.
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
Thinking, Searching, and Acting โ A reflection on reasoning models by Nathan Lambert
์ง๊ธ์ AI ์ถ๋ก ๋ชจ๋ธ์ด ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ํ๋ฅ ์ ์ผ๋ก ์์ธกํ๋ ๋ฐฉ์์ด๊ธฐ ๋๋ฌธ์, ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ์ ์ด๋ ค์์ ๊ฒช๋๋ค๋ ์ง์ ์ด ์์ฃ . Nathan Lambert๋ AI์ ๋ฐ์ ๋ฐฉํฅ์ด ๋จ์ํ ๋ชจ๋ธ์ ๊ท๋ชจ๋ฅผ ํค์ฐ๋ ๋ฐ์ ๋ฒ์ด๋, ํจ์จ์ฑ๊ณผ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ถฐ์ผ ํ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค. ๋ฏธ๋์ AI๋ ์ฌ๋์ฒ๋ผ ๊ณํ์ ์ธ์ฐ๊ณ , ๊ฒ์ํ๊ณ , ํ๋ํ๋ '์์ด์ ํธ' ํํ๋ก ์งํํด์ผ ํฉ๋๋ค. ์ด๋ ๊ฒ ๋๊ธฐ ์ํด์, ๋ชจ๋ธ์ด ์ค์ค๋ก ๊ธด ์ถ๋ก ๊ณผ์ ์ ์์ฝํ๊ฑฐ๋, ์ฒ์๋ถํฐ ์์ด์ ํธ์ฒ๋ผ ํ๋ํ๋๋ก ํ์ตํ๋ ์๋ก์ด ๊ธฐ์ ๋ค์ด ํต์ฌ์ผ๋ก ๋ ์ค๋ฅด๊ณ ์๋ค์.
์ง์ง๋ถ์งํ โApple Intelligenceโ ๋๋ฌธ์ ์ ํ์ด AI ํ์์ ์ฌ๋ฌ ๊ฐ์ง๋ก ๋นํ์ ๋ฐ๊ธฐ๋ ํ๋๋ฐ์. ํ๋ง ํฌ์คํธ์์๋ โ๊ณผ์ฐ ์ ํ๋ค์ด AI๋ผ๋๊ฒ ๋ญ๊น?โ๋ผ๋ ์๊ฐ์ ํด ๋ณธ ์ ๋ ์๊ตฌ์. ๊ทธ๋ฐ๋ฐ, iOS 26์์ ์ ํ์ด ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ํ๋ ์์ํฌ๋ฅผ ๊ณต๊ฐํ๋ฉด์ ๊ฐ๋ฐ์๋ค์๊ฒ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์์ต๋๋ค. ์ด ํ๋ ์์ํฌ๋ฅผ ํตํด์ ๊ฐ๋ฐ์๋ค์ ์๋ฒ๋ฅผ ๊ฑฐ์น์ง ์๊ณ ์์ดํฐ ๊ธฐ๊ธฐ ์์ฒด์์ ๊ตฌ๋๋๋ ๋ก์ปฌ AI๋ฅผ ์ฑ์ ํตํฉํ ์ ์์ต๋๋ค. ์ด๋ฐ ๋ฐฉ์์ ๋น์ฐํ ๊ฐ์ธ ์ ๋ณด ๋ณดํธ์์ ์ ๋ฆฌํ ์ ์ด ์๊ณ , ์๋ต ์๋๋ ๋น ๋ฅด๊ณ ๊ฐ๋ฐ์์๊ฒ ์ถ๋ก ๋น์ฉ์ด ๋ฐ์ํ์ง ์๋๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค. ํ์ฌ ์ด ๊ธฐ์ ์ 'Day One'์ ์ผ๊ธฐ ์์ฝ์ด๋ ์ง์ถ ์ฑ์ ์ค๋งํธํ ์์ดํ ๋ถ๋ฅ ๋ฑ, ์ฑ์ ์ผ์์ ์ธ ํธ์์ฑ์ ํฅ์์ํค๋ ๋ฐ ํจ๊ณผ์ ์ผ๋ก ํ์ฉ๋๋ฉด์ ์๋ก์ด ์ฌ์ฉ์ ๊ฒฝํ์ ์ ๊ณตํ๊ณ ์์ต๋๋ค.
A postmortem of three recent issues by Anthropic
์ต๊ทผ Claude์ ์ฌ์ฉ์๋ค๋ก๋ถํฐ ์๋ต ํ์ง์ด ์ ํ๋์๋ค๋ ๋ณด๊ณ ๊ฐ ์๋ฐ๋์ฃ . ์ ๋ ํ๋์ ์๋ต ํ์ง ์ ํ ๋ฑ์ ์ด์ ๋๋ฌธ์ Claude๋ฅผ ์ง๊ธ ์ฌ์ฉ ์ ํ๊ณ ์๋๋ฐ์. ์ค์ฐ๋กํฝ์์ ๊ทธ ์์ธ์ ๋ถ์ํ ๊ธฐ์ ์ ์ธ ์ฌํ ๋ถ์ ๋ณด๊ณ ์๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ํ์ง ์ ํ์ ์์ธ์ ์๋ฒ ๋ถํ๊ฐ ์๋, ์ธ ๊ฐ์ง ์ธํ๋ผ ๋ฒ๊ทธ๊ฐ ๊ฒน์ณ ๋ฐ์ํ ๊ฒ์ผ๋ก ํ์ธ๋์์ต๋๋ค. ์์ฒญ ๋ผ์ฐํ ์ค๋ฅ, ์ถ๋ ฅ ์์, ์ปดํ์ผ๋ฌ ๋ฒ๊ทธ ๋ฑ์ด ๋ณต์กํ๊ฒ ์์ฉํ์ต๋๋ค. ์ค์ฐ๋กํฝ์ ์ด ์ฌ๊ณ ๋ฅผ ํตํด์ ๋ชจ๋ธ ํ์ง ํ๋ณด์ ์ค์์ฑ์ ๋ค์ ํ๋ฒ ๊นจ๋ฌ์๋ค๊ณ ๊ฐ์กฐํ๋ฉด์, ์ฑ๋ฅ์ ์ฝ๊ฐ์ ์ง์ฐ์ด ๋ฐ์ํ๋๋ผ๋ ๊ทผ์ฌ์น ์ฐ์ฐ ๋์ ์ ํํ ์ฐ์ฐ ๋ฐฉ์์ ์ฑํํ๊ณ ์๋ก์ด ๋๋ฒ๊น ๋๊ตฌ๋ฅผ ๊ฐ๋ฐํ๋ ๋ฑ ์์คํ ์์ ํ๋ฅผ ์ํ ์กฐ์น์ ์ง์คํ๊ณ ์๋ค๊ณ ๋ฐํ์ต๋๋ค.
์คํAI์ Apollo Research์์, AI๊ฐ ์ธ๊ฐ์ ์๋์ ๋ง๊ฒ ํ๋ํ๋ '์ฒ' ํ๋ฉด์ ์จ๊ฒจ์ง ๋ชฉ์ ์ ์ถ๊ตฌํ๋ '์ฑ ๋ต(Scheming)' ํ์์ ๋ํ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ์ต๋๋ค. ์ด ์ฐ๊ตฌ์์, AI๊ฐ ์ํ์์ ์ผ๋ถ๋ฌ ๋ฅ๋ ฅ์ ์จ๊ธฐ๋ '์๋๋ฐฐ๊น (Sandbagging)' ๊ฐ์ ๊ธฐ๋ง์ ํ๋์ ํ๋ค๋ ๊ฑธ ํ์ธํ๊ธฐ๋ ํ๊ณ , ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ชจ๋ธ์๊ฒ ์์ ์์น์ ๋ช ์์ ์ผ๋ก ์๋ ค์ฃผ๊ณ ์ด๋ฅผ ์ถ๋ก ํ๋๋ก ํ๋ จํ๋ '์๊ณ ์ ์ ๋ ฌ' ๋ฐฉ์์ ๋์ , ์ฑ ๋ต ํ์๋ฅผ ํฌ๊ฒ ์ค์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ชจ๋ธ์ด ์์ ์ด ํ๊ฐ๋ฐ๋๋ค๋ '์ํฉ ์ธ์' ๋ฅ๋ ฅ์ ๊ฐ์ถ๊ฒ ๋๋ฉด์, ํ ์คํธ ๊ฒฐ๊ณผ๊ฐ ์ค์ ์ ๋ ฌ์ ์์ค์ ์๋ฒฝํ๊ฒ ๋ฐ์ํ์ง ๋ชปํ ์ ์๋ค๋ ์๋ก์ด ์์ ๋ฌธ์ ๊ฐ ๋๋๋๊ณ ์๊ธฐ๋ ํฉ๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
This is Ray3. The worldโs first reasoning video model, and the first to generate studio-grade HDR. Now with an all-new Draft Mode for rapid iteration in creative workflows, and state of the art physics and consistency. Available now for free in Dream Machine.
โ Luma AI (@LumaLabsAI)
2:31 PM โข Sep 18, 2025
World Labs Marble: ํ ์คํธ๋ ์ด๋ฏธ์ง๋ง ์์ผ๋ฉด ์๊ตฌ์ ์ด๊ณ ํ์ ๊ฐ๋ฅํ 3D ์ธ๊ณ๋ฅผ ๋ง๋ค ์ ์์ต๋๋ค. ์ด ๋๊ตฌ๋ ๊ฐ์ฐ์์ ์คํ๋ซ(Gaussian Splats)์ผ๋ก ๋ด๋ณด๋ด๊ฑฐ๋ ์น์์ ๋ฐ๋ก ์ฌ์ฉํ ์ ์๋ ํ์ดํ๋ผ์ธ์ผ๋ก ๋ณํํด ์ค๋๋ค. ๋ง์น ์์ ์ ์ธ๊ณ๋ฅผ ๋จ์จ์ ํ์ค๋ก ๋ง๋๋ ๋ง๋ฒ๊ณผ ๊ฐ๋ค์. โ> [ํธ์ ๋ณด๊ธฐ]
DeepSeek-V3.1-Terminus: DeepSeek์ด ์์ ๋ค์ด ๋ง๋ค์๋ ์ต์ฒจ๋จ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ์ธต ์ ๊ทธ๋ ์ด๋ํ์ต๋๋ค. ์ธ์ด ์ผ๊ด์ฑ์ด ํฅ์๋์๊ณ , ์ฝ๋ ์์ฑ๊ณผ ๊ฒ์ ์์ด์ ํธ ๊ธฐ๋ฅ์ด ๊ฐ์ ๋์๊ณ , ์ถ๋ก ๋๊ตฌ๋ ์๋กญ๊ฒ ์ ๋ฐ์ดํธ ๋์๋ค๊ณ ํฉ๋๋ค. ์๋์ ๊ฐ๋ ฅํ ๋ฅ๋ ฅ์ ๊ทธ๋๋ก ์ ์งํ๋ฉด์ ๋ ์ ๊ตํด์ก๋ค์. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Grok 4 Fast: ๋์ ์ ํ๋์ ๋น์ฉ ํจ์จ์ฑ์ ์๋ํ๋ ์ถ๋ก ๋ชจ๋ธ์ ๋๋ค. ๋๊ตฌ๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ์ฌ์ฉํ๊ณ , 200๋ง ํ ํฐ์ ๊ธด ๋ฌธ๋งฅ์ ์ฒ๋ฆฌํ๊ณ , ์ถ๋ก ๊ณผ ๋น์ถ๋ก ๋ชจ๋๋ฅผ ํ๋๋ก ํตํฉํ์ต๋๋ค. ํจ์จ์ ์ด๋ฉด์๋ ๋๋ํ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์๊ฒ ๋ค์. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]

Image Credit: Grok ์น์ฌ์ดํธ
Magistral-Small-2509: 24B ๋งค๊ฐ๋ณ์์ ์ถ๋ก ์ค์ฌ ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ์ ๋๋ค. [THINK] ์ถ์ ํ ํฐ์ ํตํด์ ์๊ฐ์ ๊ณผ์ ์ ๋ช ํํ ํ๊ณ , 128k ๋ฌธ๋งฅ ๊ธธ์ด๋ฅผ ์ง์ํ๊ณ , ํ์๊ณผ ํ๋ฅด์๋๋ฅผ ๊ฐ์ ํด์ ์ค์ ๋ฐฐํฌํด์ผ ํ๋ ํ๊ฒฝ์ ์ ํฉํ ๋ชจ๋ธ์ ๋๋ค. ์ด๋ฏธ์ง ์ ๋ ฅ๊ณผ ๋๊ตฌ ํธ์ถ์ ์ง์ํ๋ ํจ์จ์ ์ธ ๋ชจ๋ธ๋ก, ๋จ์ผ RTX 4090์ด๋ 32GB RAM MacBook์์ ๋ก์ปฌ ์คํ์ ํ ์ ์์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Apertus: ๋ฐ์ดํฐ ์ค์์ ๋ค๊ตญ์ด ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ๊ฐ์กฐํ ๋ชจ๋ธ๋ก, ํ์ฉ๋ ์์ค๋ง ์ฌ์ฉํด์ ์ฌ์ ํ๋ จํ์ต๋๋ค. Goldfish ๋ชฉํ ํจ์๋ก โ์๊ธฐโ๋ฅผ ์ต์ ํ๊ณ , 8B/70B ๊ท๋ชจ์ ์์ ์ฌํ ๊ฐ๋ฅํ ์ํฐํฉํธ๋ฅผ ๊ณต๊ฐํ๋ ์คํ์์ค ๋ชจ๋ธ์ ๋๋ค. 1811๊ฐ ์ธ์ด๋ฅผ ์ง์ํ๊ณ , ๋ฐ์ดํฐ ์์ ์์ opt-out ๋์๋ฅผ ์กด์คํด์ ํฌ๋ช ์ฑ์ ๊ฐ์กฐํ๋ ๋ชจ๋ธ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
SAIL-VL2 Technical Report: ํ๋ ์ด์ ๋ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ํตํด์ ๋น์ -์ธ์ด ์ค์ํธ๋ฅผ ํ์ฅํด ์ค๋๋ค. ์ ์ง์ ์ฌ์ ํ๋ จ๊ณผ MoE/Thinking-Fusion Post-Training์ผ๋ก ์ด๋ฏธ์ง/๋น๋์ค ์ถ๋ก ์์ ์์ SOTA๋ฅผ ๋ฌ์ฑํฉ๋๋ค. 2B์ 8B ๊ท๋ชจ์์๋ ๋ค์ํ ๋ฒค์น๋งํฌ์์ ์ต๊ณ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ , 106๊ฐ ๋ฐ์ดํฐ์ ์์ ๊ฒฝ์๋ ฅ์๋ ๋ฅ๋ ฅ์ ์ ์ฆํ๊ณ ์์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Towards a Physics Foundation Model (GPhyT): ๋ค์ํ ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ผ๋ฐ ๋ฌผ๋ฆฌ ๋์ญํ์ ํ์ตํ๋ ๋ชจ๋ธ์ ๋๋ค. ๋๋ฉ์ธ ๊ฐ ์ ๋ก์ท์ผ๋ก ์์ ์ ์ธ ์ฅ๊ธฐ ๋กค์์์ ์ง์ํฉ๋๋ค. 1.8TB ๋ฐ์ดํฐ๋ก ํ๋ จ๋ GPhyT๋ ๋ฌผ๋ฆฌํ์ด๋ผ๋ ๊ด์ ์์์ ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ํจ๋ฌ๋ค์์ ์ ์ํ๋ ๋ชจ๋ธ๋ก์, ์ ๋ฌธ์ ์ธ ์๋ฒ๋ฅผ ๊ฐ๋ฐํ์ง ์๊ณ ์๋ ๊ณ ์ถฉ์ค๋์ ์๋ฎฌ๋ ์ด์ ์ ๊ฐ๋ฅํ๊ฒ ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ฉํฐ๋ชจ๋ฌ ํ์ด๋ฐ์ด์ ๋ฐ ํํ(Representation)
Lost in Embeddings: Information Loss in Vision-Language Models: ๋น์ -์ธ์ด ๋ชจ๋ธ(VLM)์์ ์๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ธ์ด ์๋ฒ ๋ฉ์ผ๋ก ๋ฐ๊พธ๋ ๊ณผ์ ์ด ์ ๋ณด๋ฅผ ์๊ณกํ๋ ํ์์ ๋ถ์ํฉ๋๋ค. ํจ์น ์์ค์ ์์ค์ ์ธก์ ํ๊ณ ์ด๋ฅผ VQA(์๊ฐ ์ง๋ฌธ ๋ต๋ณ) ์ฑ๋ฅ ์ ํ์ ์ฐ๊ฒฐํด์, ๋ชจ๋ธ์ ์จ์ ์ฝ์ ์ ํํค์นฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
AToken: A Unified Tokenizer for Vision: ์ด๋ฏธ์ง, ๋น๋์ค, 3D ๋ฐ์ดํฐ๋ฅผ ์ํ ํตํฉ 4D ์ ์ฌ ๊ณต๊ฐ์ ๋ง๋ญ๋๋ค. ์ฌ๊ตฌ์ฑ๊ณผ ์๋ฏธ ์ดํด๋ฅผ ํ๋๋ก ๋ฌถ์ด์ ๊ณ ํ์ง ๊ฒฐ๊ณผ์ ํจ์จ์ฑ์ ๋์์ ์ก๋ ๋ฉํฐ๋ชจ๋ฌ AI์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ MARS2 2025 Challenge on Multimodal Reasoning: ์ค์ธ๊ณ์ ์ ๋ฌธ ์์ ์์ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํฉ๋๋ค. ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์ ๊ณต๊ฐํ๊ณ ์์ญ ๊ฐ ๋ชจ๋ธ์ ํ ์คํธํ๋ฉด์, MLLM(๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ)์ ํ๊ณ์ ์ ์ฌ๋ ฅ์ ํ๊ตฌํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding: MLLM์ ์ ๋ก์ท ์๊ณต๊ฐ ๋น๋์ค ๊ทธ๋ผ์ด๋ฉ ๋ฅ๋ ฅ์ ๋์ด์ฌ๋ฆฝ๋๋ค. ํ ์คํธ ์ฟผ๋ฆฌ๋ฅผ ์์ฑ๊ณผ ํ๋ ๋จ์๋ก ๋๋ ์ ๋ ์ ํํ ๋น๋์ค ์์น ํ์ ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ก๋ณดํฑ์ค, ์ก์ ๋ฐ ์๋ ๋ชจ๋ธ
RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation: ์ธ๊ฐ์ ์กฐ์ ์์๊ณผ ๊ถค์ ์ ํ์ฉํด์ ๋ก๋ด์ ๋์์ ๊ฐ์ ํฉ๋๋ค. 1200๋ง ๊ฐ์ ์๊ณ ์ผํธ๋ฆญ ๋น๋์ค๋ก ์ฌ์ ํ๋ จํ ๋ค ์ก์ VAE๋ก ํ๋์ ์์ถํด์ VLA ๋ชจ๋ธ์ ๋ ๋๋ํ๊ฒ ๋ง๋ญ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ World Modeling with Probabilistic Structure Integration (by Stanford Neurolab): ๋ฐ์ดํฐ์์ ํ๋ฅ ์ ๊ตฌ์กฐ๋ฅผ ์ถ์ถํด์ ์ ์ด ๊ฐ๋ฅํ ์๋ ๋ชจ๋ธ์ ํ์ตํฉ๋๋ค. ์์ธก, ๊ตฌ์กฐ ์ถ์ถ, ํตํฉ์ 3๋จ๊ณ๋ก ๋น๋์ค ์์ธก๊ณผ ์ดํด๋ฅผ ๊ฐํํ๋ ์คํ ํฌ๋ NeuroAI Lab์ ์ฐฝ์์ ์ธ ์ ๊ทผ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data (Shanghai AI lab): ์๋์ฐ, macOS ๋ฑ 6๊ฐ OS์ 3๊ฐ ์์ ๋๋ฉ์ธ์ ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก ์คํ์์ค ์ปดํจํฐ ์ฌ์ฉ ์์ด์ ํธ๋ฅผ ๋ง๋ญ๋๋ค. GUI ์๋ํ ์ฑ๋ฅ์ ์ต๊ณ ์์ค์ผ๋ก ๋์ด์ฌ๋ฆฐ ์ํ์ด AI ๋ฉ์ ์ ๋ต์ ์ฐ๊ตฌ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning (by Zhejiang, Tongyi, Alibaba): ์ธ๋ฏธ-์จ๋ผ์ธ ๊ฐํํ์ต์ผ๋ก GUI ์๋ํ๋ฅผ ๋ฐ์ ์ํต๋๋ค. ์คํ๋ผ์ธ ๊ถค์ ๊ณผ ์จ๋ผ์ธ RL์ ๊ฒฐํฉํด์ ๋ค๋จ๊ณ ์์ ์ ์์ ์ฑ๊ณผ ํจ์จ์ฑ์ ๋์ด๋ ์ ์ฅ ๋ํ, ํ์ด ๋ฉ, ์๋ฆฌ๋ฐ๋ฐ์ ํ์ ์ ์ธ ์ฐ๊ตฌ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ถ๋ก , ์ํ ๋ฐ ๋๊ตฌ ํตํฉ
THOR: Tool-Integrated Hierarchical Optimization via RL for Mathematical Reasoning: ์ํ๊ณผ ์ฝ๋ ์์ ์์ ๋จ๊ณ๋ณ ๋๊ตฌ ํผ๋๋ฐฑ์ ์ ์ฒด ์ถ๋ก ๊ฒฝ๋ก์ ๋ง์ถ๋ ๊ฐํํ์ต(RL) ๊ธฐ๋ฐ ์ ๊ทผ์ ๋๋ค. ๋จ๊ณ๋ณ๋ก ๋๊ตฌ(์: ๊ณ์ฐ๊ธฐ)๋ฅผ ์ฌ์ฉํ๊ณ ์ต์ ํํด์, ๋ ์ ํํ ์ํ์ ์ถ๋ก ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ๋ง์น ํผ์ฆ์ ํ ๋ ๊ฐ ์กฐ๊ฐ์ ์ ์คํ ๋ง์ถฐ๊ฐ๋ฉด์ ํฐ ๊ทธ๋ฆผ์ ์์ฑํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Improving Context Fidelity via Native Retrieval-Augmented Reasoning (by DIRO, MetaGPT, Mila, McGill, Yale, CIFAR): ๊ฒ์๋ ์ฆ๊ฑฐ๋ฅผ ์ถ๋ก ๊ณผ์ ์ ์ง์ ํตํฉํ๋๋ก ๋ชจ๋ธ์ ํ๋ จ์ํต๋๋ค. ๊ฒ์๋ ์ ๋ณด๋ฅผ ๋ฌธ๋งฅ์ ์ถฉ์คํ ๋ฐ์ํด ๋ต๋ณ์ ์ ๋ขฐ์ฑ์ ๋์ด๋ ๋ฐฉ์์ผ๋ก, ๋ง์น ์๋ฃ๋ฅผ ๊ผผ๊ผผํ ์ฝ๊ณ ์ ๋ฆฌํด ์ ํํ ๋ต์ ๋ด๋๋ ์ฐ๊ตฌ์์ฒ๋ผ ์๋ํฉ๋๋ค.
โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]๐ ToolRM: Outcome Reward Models for Tool-Calling Large Language Models (by IBM Research): ๋๊ตฌ๋ฅผ ํ์ฉํ๋ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ํ ๊ฒฐ๊ณผ ์ค์ฌ ๋ณด์ ๋ชจ๋ธ์ ์๊ฐํฉ๋๋ค. ๋๊ตฌ ํธ์ถ์ ํนํ๋ ๋ฒค์น๋งํฌ๋ฅผ ๋ง๋ค๊ณ , ๋ณด์ ๋ชจ๋ธ์ ํ๋ จํด์ ์ถ๋ก ์ ํ๋๋ฅผ ๋์ ๋๋ค. IBM ์ฐ๊ตฌ์๊ฐ ๋๊ตฌ์ AI์ ํ์ ์ ํ์ธต ๊ฐํํ ์ ์ด๋ค์. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๊ฐํํ์ต ๋ฐ ์ ๋ ฌ(Alignment)
๐ Learning to Optimize Multi-Objective Alignment Through Dynamic Reward Weighting (by University of Notre Dame, Amazon): ์ฌ๋ฌ ๋ชฉํ๋ฅผ ๋์์ ๋ฌ์ฑํ๊ธฐ ์ํด ๋ณด์ ๊ฐ์ค์น๋ฅผ ์ค์๊ฐ์ผ๋ก ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ถ๋ก ๊ณผ ์ ๋ ฌ์์ ํ๋ ํ ์ต์ Frontier๋ฅผ ํ์ํด์, ๋ง์น ์ฌ๋ฌ ๋ชฉํ๋ฅผ ์ ๊ธ๋งํ๋ฏ ๊ท ํ ์กํ ์ต์ ํ๋ฅผ ์ด๋ฃจ์ด๋ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Single-stream Policy Optimization: ๊ธฐ์กด์ ๊ทธ๋ฃน ๊ธฐ๋ฐ ๊ธฐ์ค ๋์ ์ง์์ ์ผ๋ก ์ ์ญ ์ถ์ ์ ์คํํด์ ๊ฐํํ์ต(RL) ์ต์ ํ๋ฅผ ๋ ๋ถ๋๋ฝ๊ณ ํ์ฅ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์ด ์ค๋๋ค. ์ ์ฑ ํ์ต์ ๊ฐ์ํํด์, ๋ง์น ๋ณต์กํ ๊ธธ์ ๋จ์ํ ํ ์ค ํธ๋์ผ๋ก ๋ฐ๊พธ๋ ๊ฒ๊ณผ ๊ฐ์ ํจ๊ณผ๋ฅผ ์ค๋๋ค.
โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Deliberation: ํ ์คํธ ํ์์ ์ฑ์ฐฐ๊ณผ ์์ ์์ ์ ํตํด์ ์์ ์ฑ์ด๋ ํ๋ ๊ท๋ฒ์ ๋ค์ด๋๋ฏนํ๊ฒ ๋ง์ถ๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํฉ๋๋ค. AI๊ฐ ์ํฉ์ ๋ง์ถฐ ์ค์ค๋ก ์กฐ์ ํ๋ฉด์ ๋ ๋์ ๊ฒฐ์ ์ ๋ด๋ฆฌ๊ฒ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
FlowRL: Matching Reward Distributions for LLM Reasoning: ๋จ์ผ ๋ณด์ ๊ฐ ๋์ ์ ์ฒด ๋ณด์ ๋ถํฌ๋ฅผ ๋ง์ถ๋ ๋ฐฉ์์ผ๋ก, ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์ฅ๋ คํฉ๋๋ค. ๋ง์น ํ ๊ฐ์ง ๋ต๋ณ๋ง ๊ณ ์งํ์ง ์๊ณ ์ฌ๋ฌ ๊ฐ๋ฅ์ฑ์ ์ด์ด๋๋ ์ ๊ทผ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์์ถ, ํจ์จ์ฑ ๋ฐ ํน์ ํ๋ จ
๐ Optimal Brain Restoration for Joint Quantization and Sparsification of LLMs (by ETH Zurich): ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ง์น๊ธฐ(Pruning)์ ์์ํ(Quantization)๋ฅผ ์ค๋ฅ ๋ณด์ ์ ํตํด ์กฐํ์์ผ์, ์ฌํ๋ จ ์์ด๋ ํจ์จ์ฑ์ ๊ทน๋ํํฉ๋๋ค. ๋ชจ๋ธ์ ๋ค์ด์ดํธ ์ํค๋ฉด์๋ ํ์ ์์ง ์๊ฒ ํ๋ ๊ธฐ์ ์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
GAPrune: Gradient-Alignment Pruning for Domain-Aware Embeddings: ๋๋ฉ์ธ๋ณ ์ค์๋๋ฅผ ๊ณ ๋ คํ ๊ฐ์ง์น๊ธฐ๋ก, ํน์ ๋ถ์ผ์ ๋ฅ๋ ฅ์ ์ ์งํ๋ฉด์ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค์ ๋๋ค. ํ์ํ ๋ถ๋ถ๋ง ๋จ๊ธฐ๊ณ ๋ถํ์ํ ๋ถ๋ถ์ ๊น๋ํ ์ ๋ฆฌํ๋ ๋ฐฉ์์ด์์. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
zELO: ELO-inspired Training Method for Rerankers and Embedding Models: ์์ ๋งค๊ธฐ๊ธฐ๋ฅผ ELO ์ ์ ์์คํ ์ฒ๋ผ ์ฌ๊ตฌ์ฑํด์, ๊ฐ๋ ์ด ์์ด๋ ๊ฐ๋ ฅํ ๋ฆฌ๋ญ์ปค์ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ํ๋ จํฉ๋๋ค. ๋ง์น ๊ฒ์์์ ์ค๋ ฅ์ ๋ฐ๋ผ ์์๋ฅผ ๋งค๊ธฐ๋ฏ ํจ์จ์ ์ธ ํ์ต์ ๊ตฌํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply