- Turing Post Korea
- Posts
- ๐FOD#83: GAN แแ ตแแ ณ แแ ขแจ!
๐FOD#83: GAN แแ ตแแ ณ แแ ขแจ!
แแ กแแ ต แแ ฎแทแแ ตแจแแ ตแแ ณแซ แแ ฆแแ กแผแแ ฆ แแ ฅแผแแ ตแซแแ ฅแนแแ ณแฏ แแ ข, แแ กแทแแ กแซ แแ กแซ แแ ขแผแแ กแจแแ ฉ แแ ซแซแแ กแญแแ ญ.
๋ค์ด๊ฐ๋ฉฐ
์ง๋ ์ฃผ์ ํค๋๋ผ์ธ์ ์๋ฌด๋๋ CES ๊ด๋ จ ์์๋ค์ด ์ ๋ นํ์ง ์์๋ - AI ๊ด์ ์์๋์ - ์ถ์ต๋๋ค. ์์ง๊น์ง๋ CES ํ์ ๊ธฐ์ฌ๋ผ๋ ๊ฐ CES์ ์๋ฏธ, ์์ผ๋ก์ (๊ธ์ ์ , ๋ถ์ ์ ์ธ) ์ ๋ง ๋ฑ์ด ๊ณ์ ์ด์ด์ง๊ณ ์์ผ๋๊น์.
์ค๋ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์์๋, ์ ์ ๋ฐ์๊ฒ ๋์๊ฐ๋ ์ธ์์์ ์์ ์ ๋๋ ค์, ๋ค์ ๊ณ ์ ์ ์ธ ์ฃผ์ ๋ฅผ ํ ๋ฒ ์ดํด๋ณผ๊น ํฉ๋๋ค - ๋ฐ๋ก โGAN (Generative Adversarial Network; ์์ฑํ ์ ๋์ ์ ๊ฒฝ๋ง)โ ์ด์ผ๊ธฐ์ธ๋ฐ์, ์ง๋ 1์ 9์ผ ๋ฐํ๋ โThe GAN Is Dead; Long Live the GAN! A Modern GAN Baselineโ์ด๋ผ๋ ๋ ผ๋ฌธ์ ๋ณด๊ณ ํ ๋ฒ ์ด์ผ๊ธฐํด๋ณด๊ณ ์ถ๋ค๋ ์๊ฐ์ด ๋ค์์ต๋๋ค. โํ๋์ AIโ๋ผ๋ ๊ด์ ์์ ํ ํ์ ๊ทธ์ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ ์ค ํ๋์์ ๋ถ๋ช ํ์ง๋ง, ์ค์ ์ ์ฉ์ ๋์ ๋ค ๋๋ฌธ์ ์ง๊ธ์ ๋ํจ์ (Diffusion) ๋ชจ๋ธ ๊ณ์ด์๊ฒ ๊ทธ ์๋ฆฌ๋ฅผ ๋ด์ฃผ์๋ค๊ณ ํ ์๋ ์๋ GAN. GAN์ ๊ณผ์ฐ ML์์ ๊ฐ์ฅ ๋งค๋ ฅ์ ์ธ ์์ด๋์ด ์ค ํ๋๋ผ๋ ํ์ดํ์ ์์ผ๋ก๋ ์ ์งํ ์ ์์๊น์?
GAN์ ํ์: ๋ ๋คํธ์ํฌ์ ๊ฒ์
โGAN (Generative Adversarial Networks; ์์ฑํ ์ ๋์ ์ ๊ฒจ๊ฒฝ๋ง)โ ๋ ผ๋ฌธ์ 2014๋ ์ด์ ๊ตฟํ ๋ก์ฐ (Ian Goodfellow)์ ๊ทธ๊ฐ ์ด๋ ํ์ด ์๊ฐํ์ฃ .
์ด์ ๊ตฟํ ๋ก์ฐ. Image Credit: ๋ด์ธ๋ฐฉ์ก
GAN์ ๊ฐ๋ ์ ๋จ์ํ๋ฉด์๋ ํ์ ์ ์ด์์ด์: ์์ฑ์ (Generator)์ ํ๋ณ์ (Discriminator), ๋ ๊ฐ์ ์ ๊ฒฝ๋ง์ด ์ ๋ก์ฌ ๊ฒ์ ์กฐ๊ฑด ์๋์ ๊ฒฝ์ํ๋ ๊ฒ๋๋ค.
(*ํธ์ง์ ์ฃผ: ๋ชฌํธ๋ฆฌ์ฌ ๋ํ๊ต์ ์๋ก ์ฟ ๋ฅด๋น ๊ต์์๊ฒ ๋ค์ ๋ฐ๋ก๋, ์ด์ ๊ตฟํ ๋ก์ฐ๊ฐ ๋๋ฃ๋ค๊ณผ ๋ชฌํธ๋ฆฌ์ฌ์ ํ ๋ฐ์์ ์ ์ ๋ง์๋ฉด์ ์ด์ผ๊ธฐ๋ฅผ ๋๋๋ค๊ฐ ๊ฐ์๊ธฐ ์์ด๋์ด๊ฐ ๋ ์ฌ๋ผ์, ์ ์ด ์ด์ง ์ทจํ ์ํ์์ ์ฐ๊ตฌ์ค๋ก ๋์๊ฐ์ ์ฝ๋ฉ์ ํ๋ฉด์ GAN์ ๋ง๋ค๊ฒ ๋์๋ค๊ณ ํด์ ^.^;)
GAN ์ปจ์
์์ฑ์ (Generator)
์ด ๋คํธ์ํฌ๋ ๋ฌด์์์ ๋ ธ์ด์ฆ๋ก๋ถํฐ ๊ฐ์ง ๋ฐ์ดํฐ (์: ์ด๋ฏธ์ง, ์ค๋์ค, ํ ์คํธ)๋ฅผ ๋ง๋ญ๋๋ค. ์ด ๋คํธ์ํฌ์ ๋ชฉํ๋ ๋ค๋ฅธ ๋คํธ์ํฌ (ํ๋ณ์)๊ฐ ๊ฐ์ง์ธ์ง ๊ตฌ๋ถํ ์ ์์ ์ ๋๋ก ์ค์ ์ ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฑฐ์ฃ .ํ๋ณ์(Discriminator)
์ด ๋คํธ์ํฌ๋ โ์ฌํโ ์ญํ ์ ํฉ๋๋ค. ๋ฐ์ดํฐ (์ค์ ์ ๊ฐ์ง ๋ชจ๋)๋ฅผ ๋ณด๊ณ ๊ทธ๊ฒ ์ง์ง์ธ์ง ์์ฑ์๊ฐ ๋ง๋ ๊ฒ์ธ์ง ํ๋จํ๋ ค๊ณ ํ์ฃ .
์ด๋ฐ ๊ตฌ์กฐ๋ก ์ ๋์ ํธ๋ ์ด๋ (Adversarial Training)์ ๋ฐ๋ณตํ๋ฉด์ ๋ ๋คํธ์ํฌ๊ฐ ๋ชจ๋ ๋ฐ์ ํ๊ฒ๋ ๋ง๋ค์ด์, ๊ฒฐ๊ตญ โ์ค์ ์ ๊ตฌ๋ถํ ์ ์๋โ ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค์ด๋ด๊ฒ ๋ฉ๋๋ค.
โGANโ์ ๊ฐ๋ ์ ํฅ๋ฏธ๋ก์ธ ๋ฟ ์๋๋ผ ๊ทธ ์ํฅ๋ ์ปค์, 2016๋ ์ ๋ฅด์ฟค์ โ(GAN์) ์ฐ๋ฆฌ๊ฐ ํ๋์ ์๊ฐํด ๋ธ ๊ฒ๋ค ์ค ์ต๊ณ ์ ์์ด๋์ดโ๋ผ๊ณ ๋งํ ์ ๋ ์์ ์ ๋์์ต๋๋ค.
Image Credit: ์ ๋ฅด์ฟค์ RI ์ธ๋ฏธ๋ โThe Next Frontier in AI: Unsupervised Learningโ
VAE (Variational Autoencoders)๋ผ๋ ๊ฐ RBM (Restricted Boltzmann Machines) ๊ฐ์ ์ด์ ์ ์์ฑํ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์ ๋, GAN์ ๋ ์ ๋ช ํ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๊ณ ๋ ๋ณต์กํ ํจํด์ ํ์ตํ ์ ์์๊ธฐ ๋๋ฌธ์, AI ๊ธฐ์ ์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์๋ค๊ณ ํ๊ฐ๋์์ต๋๋ค.
๋ฌผ๋ก , ๋ฌด์จ ๊ธฐ์ ์ด๋ ํ๊ณ๊ฐ ์์ฃ - GAN์ด ๋ง๋ฅ๋จ๋ฆฐ ํ์ค์ ์ธ ๋ฌธ์ ๋ ๋ฐ๋ก ๋ชจ๋ธ์ ๋ถ์์ ์ฑ, ๋ชจ๋ ๋ถ๊ดด (Mode Collapse) ๊ฐ์ ๊ฒ๋ค์ด์์ฃ .
๋ํจ์ ๋ชจ๋ธ๋ก์ ์ ํ
ํฐ ๊ด์ฌ์ ๋ฐ์ GAN์ด์์ง๋ง, ์๊ฐ์ด ํ๋ฌ๊ฐ๋ฉด์ ์ด๋ฐ ๋ถ์์ ์ฑ ๋ฌธ์ , ๊ทธ๋ฆฌ๊ณ ๋ชจ๋ ๋ถ๊ดด์ ๋ฌธ์ ๋ฑ ํ์ต ์์ ์ด๋ ค์์ด ๋ ์ด์ ๋ฌด์ํ ์ ์๋ ๋ฌธ์ ๊ฐ ๋์์ฃ . ๊ทธ๋ฌ๋ ์์ค์, 2022๋ ์ฆ์ํด์ ์๋ก์ด ๋์ ์์ธ ๋ํจ์ ๋ชจ๋ธ (ํ์ฐ ๋ชจ๋ธ; Diffusion Model)์ด ๋ฑ์ฅํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฑธ ์ ์ง์ ์ธ ๊ฐ์ ๊ณผ์ ์ด๋ผ๋ ๊ด์ ์์ ์ ๊ทผํ๊ณ , ๊ทธ ๋๋ฌธ์ ๋ ์์ ์ ์ด์๊ณ ํ์ตํ๊ธฐ๋ ์ฌ์ ์ต๋๋ค.
Deep Generative Model ๊ฐ ๋น๊ต. Image Credit: Towards AI
๋ํจ์ ๋ชจ๋ธ์ ๋ค์ํ ์ถ๋ ฅ๋ฌผ์ ๊ณ ํ์ง๋ก ๋ง๋ค์ด๋ผ ์ ์์ด์, ์ฐ๊ตฌ์๋ค ์ ์ฅ์์๋ ๊ณจ์นซ๊ฑฐ๋ฆฌ๋ ์ ์ผ๋ฉด์ ํจ๊ณผ๊ฐ ์ข์์ ๋น ๋ฅด๊ฒ ์ฃผ๋ชฉ์ ๋ฐ๊ฒ ๋์๊ตฌ์. ํ ๋ ์์ฑํ ๋ชจ๋ธ์ ์คํ์๋ GAN์ ๋ํจ์ ๋ชจ๋ธ์ ์ด์ง (?) ๋ฐ๋ฆฌ๋ ๋ฏํ ๋๋์ผ๋ก ๋ํ์์ ์ ์ฐจ ์ฌ๋ผ์ง๊ฒ ๋์์ต๋๋ค.
The GAN Is Dead; Long Live the GAN!
๊ทธ๋ ์ง๋ง, GAN์ ๊ฐ๋ฅ์ฑ์ ์ฌ์ ํ ๋ฏฟ๋ ์ฐ๊ตฌ์๋ค์ด ์์์ฃ ! ๋ฐ๋ก ๋ฉฐ์น ์ ์ธ 2025๋ 1์ 9์ผ, โThe GAN Is Dead; Long Live the GAN!โ์ด๋ผ๋, ๋๋ดํ๋ฉด์๋ ์์ด๋ฌ๋ํ ์ ๋ชฉ์ ๋ ผ๋ฌธ์ด ์ง๊ธ GAN์ ๋ํ ๊ด์ฌ์ ๋ค์ ๋ถ๋ฌ์ผ์ผํค๊ณ ์๋๋ฐ์ - โGAN์ ์ฃฝ์๋ค; GAN ๋ง์ธ!โ๋ผ๋, ์ด์ฐ๋ณด๋ฉด ์ด์ํ๊ฒ ๋ค๋ฆฌ๋ ์ ๋ชฉ์ด์ฃ ?
Yiwen Huang, Aaron Gokaslan, Volodymyr Kuleshov, ๊ทธ๋ฆฌ๊ณ James Tompkin์ด ์ด ์ด ๋ ผ๋ฌธ์, โGAN์ด ๋ง๋ฅ๋จ๋ฆฐ ๋ฌธ์ ์ ๋ค์ด ๋ณธ์ง์ ์ธ ๊ฒฐํจ์ด ์๋๋ผ ๊ตฌ์์ ์ํคํ ์ฒ์ ๊ธฐ์ ๋๋ฌธ์ด๋คโ๋ผ๊ณ ์ฃผ์ฅํ๊ณ ์์ต๋๋ค.
์ฐ๊ตฌ์ง์ ์์ด๋์ด์ ํต์ฌ์, โ๋ ์ข์ ์์ค ํจ์โ์์ - ์์ค ํจ์๊ฐ AI์์ ์ผ๋ง๋ ์ค์ํ์ง๋ ๋ค๋ค ์ ์์์์์? ๊ฒฐ๊ตญ ๋ณธ์ง๋ก ๋์์ค๋๊ฐ๋ด ๋๋ค - GAN์ด ์ผ๋ง๋ ํ์ต์ ์ ํ๊ณ ์๋์ง ์ธก์ ํ๋, ๋ ๋๋ํ ๋ฐฉ๋ฒ์ ์๋ก ๊ณ ์ํ ๊ฑด๋ฐ์. ์ด๊ฑธ โ์๋์ GAN ์์ค (Relativistic GAN Loss)โ๋ผ๊ณ ๋ถ๋ฅด๋๋ฐ, GAN์ ํ์ต ๊ณผ์ ์ ๋ ๋ถ๋๋ฝ๊ฒ ๋ง๋ค๊ณ , ๊ฒฐ๊ณผ์ ์ผ๋ก ์ด์ํ ์ถ๋ ฅ๋ฌผ์ด ๊ฐ์๊ธฐ ๋์จ๋ค๋ ๊ฐ, ํ์ ๋ ์ข ๋ฅ์ ์ด๋ฏธ์ง๋ง ๋ฐ๋ณตํด์ ๋์จ๋ค๋ ๊ฐ ํ๋ ์ผ๋ฐ์ ์ธ ๋ฌธ์ ๋ค์ด ๋ ๋ฐ์ํ๊ฒ ํฉ๋๋ค.
๋, ์ฐ๊ตฌ์ง์ GAN ์ํคํ ์ฒ๋ฅผ โํ๋ํโํ๊ธฐ๋ ํ๋๋ฐ์. ์์ฃผ ์ฌ์ค์ ์ธ ์ผ๊ตด์ ์์ฑํ๊ธฐ๋ก ์ ์๋ ค์ง ๋ชจ๋ธ, StyleGAN2์์๋ถํฐ ์์ํด์, ์ต์ ์ AI ์ค๊ณ ๊ธฐ๋ฒ๋ค์ ๋ฐ์ํด์ ๋ ์ด์ ํ์ํ์ง ์์ ๋ชจ๋ ์์๋ค์ ๋๋ ค๋ด ๋ฒ๋ ธ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ResNet์ด๋ผ๋ ๊ฐ โ๊ทธ๋ฃน ํฉ์ฑ๊ณฑ (Grouped Convolution)โ ๊ฐ์ ๋ ๋์ ๊ตฌ์ฑ ์์๋ค์ ์ถ๊ฐํด์ R3GAN์ด๋ผ๋ ๋ ๊ฐ๋จํ๋ฉด์๋ ๊ฐ๋ ฅํ GAN์ ๋ง๋ค์ด ๋์ต๋๋ค.
์ด R3GAN์ ๋ ์ ์๋ํ ๋ฟ ์๋๋ผ ๋ ๋จ์ํ๋ค๊ณ ๋ง์๋๋ ธ์ฃ . FFHQ (์ฌ๋ ์ผ๊ตด ๋ฐ์ดํฐ์ )๋ผ๋ ๊ฐ CIFAR-10 (์ผ์์ ์ผ๋ก ๋ณผ ์ ์๋ ๋ฌผ์ฒด๋ค์ ์์ ์ด๋ฏธ์ง) ๊ฐ์ ํ์ค ๋ฒค์น๋งํฌ์์, R3GAN์ ์ผ๋ถ ๋ํจ์ ๋ชจ๋ธ์ ํฌํจํ ๊ธฐ์กด์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ค๋๋ค. ๊ฒ๋ค๊ฐ, ํ์ต ์๋๋ ๋ ๋น ๋ฅด๊ณ ์ปดํจํ ํ์๋ ๋ ์ฌ์ฉํฉ๋๋ค.
FFHQ-256 ๋ฐ์ดํฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก R3GAN์ด ์์ฑํด๋ธ ์ผ๊ตด๋ค. Image Credit: ์ค๋ฆฌ์ง๋ ๋ ผ๋ฌธ
GAN์ด ๋๋ฌด ๊น๋ค๋กญ๊ฑฐ๋ ๊ตฌ์์ด๋ผ๊ณ ์๊ฐํด์ ํผํด์๋ค๋ฉด, ์ง๊ธ, ๊ทธ๋ฆฌ๊ณ ์์ผ๋ก GAN - ์๋ก์ด GAN์ด๊ฒ ์ฃ - ์ ๋ค์ ์๋ํด ๋ณผ๋งํ ์ข์ ์๊ธฐ๊ฐ ์ฌ์ง๋ ๋ชจ๋ฅด๊ฒ ์ต๋๋ค. ์ฐ๋ฆฌ๋, GAN์ ํ์ฉํด์ ๋ญ ํด ๋ณผ ์ ์์์ง ํ ๋ฒ ๋ค์ ์๊ฐํด ๋ณผ๋งํ ์๊ฐ์ด๊ตฌ์.
AI ํ์ , ๊ทธ โ๋ฐ๋ณต์ ์ธ (Iterative) ๊ณผ์ โ
์์์ ์ดํด๋ณธ โGAN์ ๋ถํโ. ์ฌ๊ธฐ์ ๋ฐ๋ก AI - ๋๋ ๋จธ์ ๋ฌ๋ - ํ์ ์ด ๊ฐ์ง๊ณ ์๋ โ๋ฐ๋ณต์ ์ธ (Iterative)โ ํน์ฑ์ ์ดํด๋ณผ ์ ์์ต๋๋ค. ๊ณผ๊ฑฐ์ ์ฐ๊ตฌ, ํ์ฌ์ ์ฐ๊ตฌ๋ค์ด ์๋ก์ ์ฅ๋จ์ ๋ค์ ๋ณต์กํ๊ฒ ์์ด๊ฐ๋ฉด์ ๋ ์๋ก์ด ์ฐ๊ตฌ ์ฃผ์ ๋ฅผ ๋ง๋ค์ด๋ด๊ณ , ๋ค์ ์ธ๋ AI ์ดํ๋ฆฌ์ผ์ด์ ์ ๊ธฐ์ด๋ฅผ ๋ง๋ค์ด ๋ ๋๋ค. ๋ฐ๋ก ์ด ๋๋ฌธ์, ๋์์์ด ๋ณํํ๋ AI ์ฐ๊ตฌ๋ฅผ ์ด๋ค ์์ค์์๋ ํ๋ก์ฐ์ ํ๋ ๊ฒ AI ์ดํ๋ฆฌ์ผ์ด์ ์ด๋ ์๋น์ค๋ฅผ ๋ง๋ค์ด๋ด๋ ์ ์ฅ์์๋ ์ค์ํ ๊ฒ์ด ์๋๊น ํฉ๋๋ค.
์๋ก ๋ฑ์ฅํ R3GAN์ ์์ํด์, ์๋ก์ด ์๋์ ์๋ก์ด GAN๋ค์ด ๋ ๊ณ์ ๋ฑ์ฅํ์ง ์์๊น ํ๋๋ฐ์. ๊ณ ํ์ง์ ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ GAN์ ๋ฅ๋ ฅ, ์์ฑํ AI ๋ฐ์ดํฐ์ ๋ํ ์์๊ฐ ํญ์ฆํ๋ ์ง๊ธ, ๊ทธ ์ด๋ ๋๋ณด๋ค ์ค์ํฉ๋๋ค. ์์ผ๋ก ํนํ ๊ฐ์ธ์ ๋ณด์ ๋ณดํธ๋ผ๋ ๊ฐ, IP ๋ณดํธ ๋ฑ์ ๋ฌธ์ ๋ก ์ค์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋๊ฒ ์ด๋ ค์ด ์ํฉ์์ ๊ทธ ์ค์์ฑ์ ๋์ฑ ์ปค์ ธ๊ฐ ๊ฒ์ผ๋ก ์๊ฐํฉ๋๋ค.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
LLM์ ํฌํจํด์, โ์ฐ๊ตฌโ๋ฅผ ์ง์ํ ๋ชฉ์ ์ผ๋ก ๋ง๋ค์ด์ง AI ์ด์์คํดํธ๋ฅผ ํ์ฉํ๋ค๋ฉด, ๊ณผํ ์ฐ๊ตฌ ์ํ์ด ํจ์ฌ ๋ ๊ฐ์ํ๋ ์ ์์ต๋๋ค.
์ค๋์ ๊ณผํ ์ฐ๊ตฌ๋ฅผ ์ํด์ ๊ณ ์๋ 10๊ฐ์ง AI ์์คํ ์ ์์๋ณด๊ฒ ์ต๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค ๐
The Focus AI์ Will Schenk๊ฐ ๊ตฌ๊ธ์ DeepResearch, ์คํAI์ GPT-4o์ o1, ๋ง์ดํฌ๋ก์ํํธ์ Phi-4, Claude, Perplexity, DeepSeek ๋ฑ ๋ค์ํ โAI ๋ฆฌ์์น ๋๊ตฌโ๋ค์ ๋น๊ตํด ๋ณด๊ณ ์๋๋ฐ์. โ๋ฐค์ด ์ด๋์ด ์ด์ ๋ ๋ญ๊น?โ๋ผ๋, ์ด์ฐ๋ณด๋ฉด ๋ค์ ์ฒ ํ์ ์ด๊ธฐ๋ ํ๊ณ ์๊ฐ๋ณด๋ค ๋ณต์กํ ์ง๋ฌธ์ ๋์ง๊ณ ๊ทธ ๊ฒฐ๊ณผ๊ฐ Will ์์ ์ ์ ์ฅ์์ ์ผ๋ง๋ ๋ง์กฑ์ค๋ฌ์ด์ง ์๊ฐํด ๋ณด๊ณ ์์ต๋๋ค. Will์ DeepResearch๊ฐ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๋ณด๋ค ๋ ๊น์ด์๊ณ , ์ ๋ขฐํ ์ ์๊ณ , ์ฐธ๊ณ ๋ฌธํ์ด ์ ๊ฐ์ถฐ์ง ํต์ฐฐ๋ ฅ์ ์ ๊ณตํ๋ค๊ณ ์๊ฐํ๋ค๊ณ ํฉ๋๋ค. ์ฌ๋ฌ๋ถ๋ ํ ๋ฒ ์ด๋ฐ ๋น๊ต ํด ๋ณด์๋ฉด ์ด๋จ๊น์?
๊ตฌ๊ธ, ์ ํ์ ๊ฑฐ์น ์ํํธ์จ์ด ์์ง๋์ด์ด์ UX ๋์์ด๋์ธ Ben Hylak์ด o1๊ณผ ๊ด๋ จ๋ ์์ ์ ๊ฒฝํ์ ํ์ด๋์ต๋๋ค. o1์ด ์ฑํ ์ ์ํ ๋ชจ๋ธ์ด ์๋๋ผ ๋ฌธ์ ํด๊ฒฐ - ์ฌ๊ธฐ์๋ โ๋ณด๊ณ ์ ์์ฑโ์ด๋ผ๋ ํํ์ ์ผ๋๋ฐ์ - ์ ์ํ ๋ชจ๋ธ๋ก, o1์ ์ ์ฌ๋ ฅ์ ์ ํ์ฉํ๋ ค๋ฉด ์ฌ์ฉ์ ์ ์ฅ์์ ์ด๋ค ์ฃผ์ํ ์ ์ด๋ ์คํฌ์ ๊ฐ์ถฐ์ผํ๋์ง์ ๋ํด์ ๊ธฐ์ ํ๊ณ ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ธ์ ๋ง๋ฏธ์๋, โ์์ฑํ AI ๊ธฐ์ ๋ก ๋ณด๊ณ ์ ์์ฑ ์๋น์ค๋ฅผ ๋ง๋ค ๋ ์๊ฐํด ๋ณผ ๋งํ UI ๊ด์ ์ด ํ(?)์ด๋ผ๊ณ ํ ๊น, ๊ทธ๋ฐ ๋ด์ฉ๋ค๋ ํฌํจํ๊ณ ์์ผ๋ ํ ๋ฒ ๊ด์ฌ์๋ ๋ถ๋ค ๋ณด์๋ฉด ์ข๊ฒ ์ต๋๋ค.
์นฉ ํ์ด์์ด ๋ณธ์ธ์ ์ ์ โAI Engineeringโ์ ์์ด์ ํธ ๊ด๋ จ ์น์ ์ ๋ค์ ํธ์งํ๊ณ ์ ๋ฐ์ดํธํด์ ๋จ๋ ํฌ์คํธ โAgentsโ๋ฅผ ๋ง๋ค์๋ค์. ์นฉ ํ์ด์ ๋ฒ์ ์ โAgent์ ๋ชจ๋ ๊ฒโ ์ ๋๋ก ์๊ฐํ๊ณ ์ผ๋ ํด ๋ณผ๋งํ ๊ฒ ๊ฐ์ต๋๋ค.
์จ๋ฐAI ์ฐ๊ตฌ์์ Nathan Lambert๊ฐ NeurIPS์์ ํ๋ LLM ๊ด๋ จ ํํ ๋ฆฌ์ผ์ ๋ค์ ๋ นํํ ๋น๋์ค, ๊ทธ๋ฆฌ๊ณ ์ ๋ฆฌํ ๊ธ์ธ๋ฐ์. ์๋ ํ๋ฐ๋ถํฐ ํฐ ์ด์๊ฐ ๋๊ณ ์๋ Post-Training ๊ด๋ จํด์ ๋ง์ ๋ด์ฉ์ด ๋ด๊ฒจ ์์ต๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
๊ธ์ฃผ์ Top Pick!
Top Pick์ ํด๋นํ๋ ๋ ผ๋ฌธ๋ค์ด ์๋นํ ๋ง๋ค์ ^.^;
Sky-T1: Train Your Own O1 Preview Model Within $450
์ด ๋ ผ๋ฌธ์ ์ถ๋ก ๊ณผ ์ฝ๋ฉ ์์ ์ ๋ชฉ์ ์ผ๋ก 32B ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ณผ์ ์ ํตํด์ โ๊ณ ์ฑ๋ฅ ์ถ๋ก ๋ชจ๋ธ์ ๊ฒฝ์ ์ฑโ์ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ๋ณด๊ธฐ]RStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking
๋ชฌํ ์นด๋ฅผ๋ก ํธ๋ฆฌ ์์น์ ๋ฐ๋ณต์ ์ธ ์๊ธฐ ๊ฐ์ (Self-Improvement) ๊ธฐ๋ฒ์ ํตํด์ ์ํ ๋ชจ๋ธ๋ค์ด ์ํ์ ์ถ๋ก ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค ์ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์ค๋๋ค. โ> [๋ ๋ณด๊ธฐ]
Test-time Computing: From System-1 Thinking to System-2 Thinking
๊ฒฌ๊ณ ํ๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์, ์ง๊ด์ ์ธ ์ ๋ต, ๊ทธ๋ฆฌ๊ณ ์ฌ์ฌ์๊ณ ํ๋ ์ ๋ต์ ๊ฒฐํฉํด์ AI์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ ํ๊ตฌํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
Towards System 2 Reasoning in LLMs: Learning How to Think with Meta Chain-of-Thoughts
๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ ์์ ์์์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํด์, ๋ฐ๋ณต์ ํ์๊ณผ ๊ฒ์ฆ์ ํ ์ ์๋ Meta-CoT ๊ธฐ๋ฒ์ ์ ์ํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models
PPO์์ ์๊ฐ์ ๋ฐ์ ๊ธฐ์ ๋ค์ โREINFORCEโ ํ๋ ์์์ ํตํฉ, RLHF๋ฅผ ๊ฐ์ ํ๊ณ , ์ด๋ฐ ๋ฐฉ๋ฒ์ ํตํด์ ๋นํ๊ฐ ๋คํธ์ํฌ(Critic Network) ์์ด๋ ๋ ๋น ๋ฅด๊ณ , ์์ ์ ์ด๋ฉฐ, ํจ์จ์ ์ธ Alignment๋ฅผ ํ ์ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์คฌ์ต๋๋ค. โ> [๋ ๋ณด๊ธฐ]Cosmos World Foundation Model Platform for Physical AI
๋ค์ํ ์์ฉ ๋ถ์ผ๋ฅผ ๋์์ผ๋ก, ๋ฌผ๋ฆฌ ๋ฒ์น์ ๊ณ ๋ คํ ๋๊ท๋ชจ ์๋ฎฌ๋ ์ด์ ์ ํตํด์ ๋ก๋ณดํฑ์ค ์์คํ ์ ํ์ต์ํค๋ ๋ชจ๋ธ์ ์๊ฐํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
์ถ๋ก ๋ฐ ์ํ์ ์ญ๋
Search-o1: Agentic Search-Enhanced Large Reasoning Models
์ถ๋ก ๋ชจ๋ธ์ ์ํ RAG์ ๋์ , ์ธ๋ถ ์ง์์ ํตํฉํด์ ๋ณต์กํ ๋๋ฉ์ธ์์ ๋ต๋ณ์ ์ ํ๋๋ฅผ ํฅ์์ํต๋๋ค. โ> [๋ ๋ณด๊ธฐ]BoostStep: Boosting Mathematical Capability of Large Language Models via Improved Single-Step Reasoning
์ํ์ ๊ณผ์ ๋ฅผ ์ํ ๋จ๊ณ๋ณ ์ถ๋ก ์ ๊ฐ์ ํด์, ์ ์ฌ์ฑ์ด ๋ฎ๊ณ ์ด๋ ค์ด ๋ฒค์น๋งํฌ์์ ์ ํ๋๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค. โ> [๋ ๋ณด๊ธฐ]URSA: Understanding and Verifying Chain-of-thought Reasoning in Multimodal Mathematics
๋ฉํฐ๋ชจ๋ฌ ์์ ์ ์ํ CoT ์ถ๋ก ์ ์ค์ ์ ๋๊ณ , ์ํ์ ์ธ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๊ฒฌ๊ณ ํ ํ๋ ์์์ ์ ๊ณตํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]DOLPHIN: Closed-Loop Open-Ended Auto-Research through Thinking, Practice, and Feedback
์์ด๋์ด ์์ฑ, ๊ฒ์ฆ, ๊ฐ์ ์ ํตํฉํ๋ ๋ฐ๋ณต์ ํผ๋๋ฐฑ ๋ฃจํ๋ฅผ ํตํด์ ์๋์ ์ธ ์ฐ๊ตฌ ์ํ ๊ณผ์ ์ ํ์ ํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
Robotics and Physical AI
OmniManip: Towards General Robotic Manipulation via Object-Centric Interaction Primitives
๋ก๋ด ์กฐ์์ ์ํ ๋น์ -์ธ์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ฉด์, ๋ค์ํ ์์ ์์ โZero-shot ์ผ๋ฐํ (Generalization)โ๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. โ> [๋ ๋ณด๊ธฐ]
RAG (Retrieval-Augmented Generation)
VideoRAG: Retrieval-Augmented Generation over Video Corpus
๋น๋์ค ๊ธฐ๋ฐ์ ์ง๋ฌธ์ ๋ํ ์๋ต ์ ํ๋๋ฅผ ํฅ์์ํค๊ธฐ ์ํด์ ์๊ฐ์ ๊ฒ์๊ณผ ํ ์คํธ ๊ฒ์์ ๊ฒฐํฉํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]Personalized Graph-Based Retrieval for Large Language Models enriches
๊ฐ์ธํ๋ ํ ์คํธ ์์ฑ์ ์ํด์, ์ฌ์ฉ์ ์ค์ฌ์ ์ง์ ๊ทธ๋ํ๋ฅผ ํตํฉ, ๊ฒ์์ ์ํํฉ๋๋ค.
โ> [๋ ๋ณด๊ธฐ]GeAR: Generation Augmented Retrieval
์ธ๋ฐํ ํ ์คํธ ๋จ์๋ฅผ ์ฐพ๊ณ ๊ฒ์ํ๊ธฐ ์ํด์ ์ด์ค ์ธ์ฝ๋(Bi-Encoder) ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํด์ ๊ฒ์๊ณผ ์์ฑ์ ์ฐ๊ฒฐํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply