- Turing Post Korea
- Posts
- ๐FOD#81: 2025แแ งแซ, แแ ฎแแ ฉแจแแ ขแแ ฃ แแ กแฏ แแ ขแจแแ ตแท AI แแ ขแแ งแท
๐FOD#81: 2025แแ งแซ, แแ ฎแแ ฉแจแแ ขแแ ฃ แแ กแฏ แแ ขแจแแ ตแท AI แแ ขแแ งแท
แแ ฎแแ ฉแจแแ ก แแ งแ แ ฅแแ ฎแซ แแ กแทแแ กแแ กแธแแ ตแแ ก! แแ ฅแซแแ กแผแแ กแซ แแ งแซแแ กแฏ, แแ ขแผแแ ฉแจแแ กแแ ฉ แแ ตแซแแ กแแ ณแซ แแ ขแแ ข แแ กแฝแแ ตแแ กแแ ฆแแ ญ!
ํ๋ง ํฌ์คํธ ๊ตฌ๋ ์ ์ฌ๋ฌ๋ถ, ํ๋ณตํ ์ฐ๋ง ์ฐ์ ๋์ธ์!
๊ตฌ๋ ์ ์ฌ๋ฌ๋ถ, 2024๋ ์ ์๋ฏธ์๊ฒ ๋ง๋ฌด๋ฆฌํ๋ ์ฐ๋ง, 2025๋ ์ ํ์ฐจ๊ฒ ์์ํ๋ ์ํด ๋ง์ดํ์๊ธฐ ๋ฐ๋๋๋ค!
2024๋ 6์ ๋ง ํ ์คํธ ํฌ์คํ ์ ์์ํ๊ณ , ๊ณต์์ ์ผ๋ก๋ 8์ ์ด ์์ํ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์๊ฐ ๋ฒ์จ ์ด๋ฒ FOD#81๋ก โ100๋ฒ์งธโ ํฌ์คํ ์ ํ๊ฒ ๋์์ต๋๋ค. 2024๋ ์ ๋ง์ง๋ง ํฌ์คํ ์ด 100๋ฒ์งธ ํฌ์คํ ์ด ๋์๋ค์.
4๊ฐ์์ด ์กฐ๊ธ ๋๋ ๊ธฐ๊ฐ๋์ 500๋ถ์ด ๋๊ฒ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์ จ๋๋ฐ์, ๋๋ฌด๋ ๊ฐ์ฌ๋๋ฆฝ๋๋ค. ๊พธ์คํ ๊ธ ๋ด ์ฃผ์๊ณ ํผ๋๋ฐฑ๋ ์ฃผ์ ๊ตฌ๋ ์๋ถ๋ค๋ ๋ง์ด ๊ณ์ ๋ฐ, ์์ผ๋ก๋ ๊ณ์ํด์ ๋ค์ํ ๊ด์ ์ AI ์ฐ๊ตฌ, ์ฐ์ , ์ฌํ์ ๋ํ ๊ธ๋ค๊ณผ ์๊ฐ๋ค์ ๋ชจ์์ ๊ณต์ ํด ๋๋ฆฌ๋๋ก ํ๊ฒ ์ต๋๋ค.
2025๋ ์๋ ๊ตฌ๋ ์ ๋ถ๋ค๋ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ๊ธ์ ๋ค๋ฅธ ๋ถ๋ค๊ณผ ํธํ๊ฒ ๋๋๊ณ ์์ฌ์ํต๋ ํ์๊ณ , ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ๊ตฌ๋ ์ ๋ถ๋ค๊ณผ๋ ์๋ฏธ์๋ ์ปค๋ฎค๋ํฐ๋ก์ ํจ๊ป AI ํ์ ๋ํด์ ๋ฐฐ์ฐ๊ธฐ๋ ํ๊ณ ์๊ฒฌ์ ๋๋ ๋ณผ ์ ์๋ ์ฅ์น๋ผ๋ ๊ฐ ๊ธฐํ๋ฅผ ๋ง๋ค์ด๋ณด๊ณ ์ ๊ณ ๋ฏผํ ์๊ฐ์ด๋, ๋ง์ ๊ธฐ๋๋ ๋ถํ๋๋ฆฌ๊ฒ ์ต๋๋ค.
์, ๊ทธ๋ผ 2024๋ ์ ๋ง์ง๋ง ํฌ์คํธ์ด์ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ 100๋ฒ์งธ ๊ธ, FOD#81 ์์ํ๊ฒ ์ต๋๋ค!
์ํด๋ง์ด ์ค๋น์ด๋: ๊ด์ฌ์ ๊ฐ์ ธ์ผ ํ ํต์ฌ์ ์ธ AI ๊ฐ๋ ๋ค
์ฑGPT๊ฐ 2022๋ 11์ ๊ณต๊ฐ๋ ์ดํ ์ ์ธ๊ณ์ ์ผ๋ก LLM ๊ฐ๋ฐ ๊ฒฝ์์ด ์ง๊ธ๊น์ง๋ ๊ฐ์ํ๋๊ณ ์์ฃ . ์ง๋ ์ฃผ ์์๋ ์คํAI์ o3 ๋ฐํ ์ญ์ AI ์ปค๋ฎค๋ํฐ์ ํฐ ์ถฉ๊ฒฉ์ ์คฌ๋๋ฐ์. ARC-AGI ์ฑ๋ฆฐ์ง์ FrontierMath ๋ฒค์น๋งํฌ์์ ๋ณด์ฌ์ค ๋๋ผ์ด ๊ฒฐ๊ณผ๋ ์ถ๋ก , ๊ฒ์, ํ๊ฐ, ๊ทธ๋ฆฌ๊ณ AGI๋ผ๋ ๋ํดํ ๋ชฉํ๋ฅผ ๋๋ฌ์ผ ๋ ผ์์ ๋ค์ ๋ถ๋ฌ์ผ์ผํค๊ณ ์์ต๋๋ค.
2025๋ ์๋ ๋ ์ด๋ค ์ด์๋ค์ด ๋ง์ ๋ถ๋ค์ ๊ด์ฌ์ ๋ฐ๊ฒ ๋ ๊น์? ์ฃผ๋ชฉํ๊ณ ๊ด์ฌ์ ๊ฐ์ ธ์ผ ํ ๋งํ ๋ช ๊ฐ์ง ํต์ฌ์ ์ธ ์ฃผ์ ์ ๋ํด์ ์ด์ผ๊ธฐํด ๋ณผ๊น ํฉ๋๋ค:
๊ฐํ ํ์ต (Reinforcement Learning), ์คํ์ค์ ๋ฒ์ด๋ ํ์ค๋ก
๊ฒ์, ์๋ฎฌ๋ ์ด์ ์ ์ํ ๋ถ์ผ๋ก ์์ํ๋ ๊ฐํ ํ์ต์ด, ์ด์ ๋ ๋ ธ์ด์ฆ๊ฐ ๋ง๊ณ ๋ณต์กํ๊ณ ์์ธกํ๊ธฐ ์ด๋ ค์ด โ์ค์ ํ๊ฒฝโ์์์ ์์จ์ฑ์ ๋ด๋ณดํ๊ธฐ ์ํ ํต์ฌ ๊ธฐ๋ฒ์ด ๋ ๊ฒ์ธ๊ฐ ํ๋, ์๋ฏธ์๋ ์ ํ ๋จ๊ณ์ ๋ค์ด์๊ณ ์์ต๋๋ค.
์ด ์ ํ์ ๋ถ๋๋ฝ๊ฒ ์ ์ด๋ค๋ผ ๊ฒ์ด๋ ํ๋ ๋ฌธ์ ๋ ์๊ฐ๋งํผ ๊ฐ๋จํ์ง๋ ์์ ์ ์๋๋ฐ์. ๊ฐํ ํ์ต์ ์ค์ ๋ฌธ์ ์ค ํ๋์ธ โReward Function Misspecification (๋ณด์ ํจ์์ ์๋ชป๋ ์ค๊ณ)โ ๋๋ฌธ์ ์ฐ๋ฆฌ๊ฐ ์ ํ ์๋ํ์ง ์์, ๋๋ก๋ ์๋์ ์ ๋ฐ๋์ ํ๋์ ์ ๋ํ์ง ์๋๋ก ํ๋ฉด์, ์ด๋ป๊ฒ ์ฌ๋ฌ ์์ด์ ํธ๋ค์ ํ๋์ ๋ชฉํ๋ก ์ด๋์ด๊ฐ ์ ์์๊น์?
Reward Engineering (๋ณด์ ์์ง๋์ด๋ง) ๊ทธ ์์ฒด๊ฐ ์ด์ ๋ ๋จ์ํ โ๊ฒฐ๊ณผโ ๋ฟ์ด ์๋๋ผ ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์ด๋ป๊ฒ ๋ฌ์ฑ๋๋์ง์๊น์ง ์ด์ ์ ๋ง์ถ๋, ์ฌ์ธํ๊ณ ์ธ๋ จ๋ ๊ธฐ์ ์ด ๋์ด๊ฐ๊ณ ์์ต๋๋ค. ๊ณ์ํด์ ๋ณํํ๋ ๋ชฉํ์ ๋ง์ถฐ์ ์ง์์ ์ผ๋ก ์ฌ์กฐ์ ํ๋ Dynamic Reward System (๋์ ์ธ ๋ณด์ ์์คํ )์ด ๋ฐ๋ก ๋ ์ค๋งํธํ๊ณ ๋ฐ์์ฑ๋ ๋์ ์์ด์ ํธ๋ฅผ ๋ง๋๋ ๊ธธ์ ์ด์ด์ฃผ๊ณ ์๋ ๊ฒ๋๋ค.
๋, ํ๋ ์ฒด์ค๋ ๋ฐ๋ ๊ฐ์ ๊ฒ์์ ์์ญ์ผ๋ก๋ง ์ฌ๊ฒจ์ก๋ โํธ๋ฆฌ ํ์ (Tree Search)โ ๊ธฐ๋ฒ๋ ๋๋ฆ์ ์๋ก์ด ๋ฅด๋ค์์ค๋ฅผ ๊ฒฝํํ๊ณ ์๋ ๊ฒ ๊ฐ์ต๋๋ค. ํธ๋ฆฌ ํ์ ๊ธฐ๋ฒ์ด ๋ค์ํ ๊ณํ ์๋ฆฝ, ์์ฌ ๊ฒฐ์ ๊ณผ์ ์์ ์ ์ฉํ๊ฒ ์ ์ฉ๋ ์ ์๋ค๋ ๊ฒ์ด ํ์ธ๋๋ฉด์, ๊ฐํ ํ์ต, ์ฌ์ง์ด๋ AutoML๊ณผ๋ ๊ต์งํฉ์ ๋ง๋ค์ด๋ด๊ณ ์์ต๋๋ค.
โ์ถ๋ก (Inference)โ์ ์๋ก์ด ์งํ: ์งํํ๋ ์ ์ํ ์ง๋ฅ์ผ๋ก์ ๊ธธ
โ์ถ๋ก (Inference)โ. ๋จธ์ ๋ฌ๋ ์์ ์ ์ ์ฒด ๋ผ์ดํ์ฌ์ดํด ๊ด์ ์์, ์ ํต์ ์ผ๋ก โ์ถ๋ก โ์ ๋ชจ๋ธ์ด ์์ธก๊ฐ์ ์ถ๋ ฅํ๊ฑฐ๋ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋, โ์ ์ ์ธ (Static)โ, ์ต์ข ์ ์ง์ ์ด์์ฃ . ์ด์ ๋ ๊ทธ โ์ถ๋ก โ ์์ฒด๊ฐ ์์ฃผ ๋์ ์ธ (Dynamic) ๊ณผ์ ์ผ๋ก ๋ณํ์ต๋๋ค.
AI๊ฐ ๋งฅ๋ฝ์ ์ดํดํ๊ณ ์ํฉ์ ๋ง์ถฐ ์ ์ํ๋ฉด์ ์ถ๋ก ์ ํ๋ ์ด๋ฐ ๋ณํ๋ AI์ ์๋ก์ด ์ฅ์ ์ด์์ง๋ง, ๋์์ ์๋ก์ด ๋์ ๋ ํจ๊ป ๊ฐ์ ธ์์ฃ .
๊ฐ์ฅ ํฐ ๊ณผ์ ๋ ๋ฐ๋ก ์ปดํจํ ์์์ ์ด๋ป๊ฒ ํจ์จ์ ์ผ๋ก ํ์ฉํ ๊ฑฐ๋์ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋์ด ์์ต๋๋ค. ๋ช๋ช ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ๋ค์, ์ฌ์ง์ด ์์ ๋์ ํ๋๊ฐ ์ฐ๋ ๋งํผ์ ์ ๋ ฅ์ ์ฌ์ฉํ๋ค๋ ์ ์ ์๊ฐํด ๋ณด๋ฉด, ์ค์ ์ฌ์ฉ ํ๊ฒฝ์์ ์ปดํจํ ์ฐ์ฐ์ ํจ์จ์ ์ผ๋ก ํ๋ ๊ฑด ๊ฝค ์ค์ํ ๋ฌธ์ ๋ผ๊ณ ํ๊ฒ ์ต๋๋ค. ๋คํํ, ๊ฒฝ๋ํ๋ ํธ๋ ์ด๋ ๋ฐฉ๋ฒ, ๋ฐ์ดํฐ ์ฆ๊ฐ (Data Augmentation) ๊ธฐ์ ๋ฑ์ด ๊ณ์ ๋ฐ์ ํ๋ฉด์, ๊ณผ๋ํ๊ฒ ์์์ ์ฌ์ฉํ์ง ์๊ณ ๋ AI์ ์ฑ๋ฅ๊ณผ ์ ์๋ ฅ์ ์ ์งํ ์ ์๋ ๊ธธ์ด ์ด๋ฆฌ๊ณ ์์ต๋๋ค.
๋ฌผ๋ก , Inference Compute๊ฐ ๋ฐ์ ํ๋ค๊ณ ํด์ Training Compute๊ฐ ์ค์ํ์ง ์์ ๊ฑด ์๋๋๋ค. Image Credit: Lennart Heim
๊ฒฐ๊ตญ์, ๊ณ ์ฑ๋ฅ ์๋ฒ์์๋ฟ ์๋๋ผ ์ฐ๋ฆฌ๊ฐ ์ผ์์ ์ผ๋ก ์ฌ์ฉํ๋ ์ค๋งํธํฐ, ์จ์ด๋ฌ๋ธ ๊ธฐ๊ธฐ, IoT ์ฅ์น ๋ฑ์์๋ AI๋ฅผ ํ์ฉํ ์ ์๊ฒ ๋ ๊ฒ๋๋ค. ๊ทธ๋ฆฌ๊ณ , ์ด๋ฐ ํ๋ฆ์, ์์ฐ์ค๋ฝ๊ฒ AI ๋ฐ์ ์ ์๋ก์ด ์ ํ์ ์ด ๋ โ์ฐํฉ ํ์ต (Federated Learning)โ์ ํ์ ์ผ๋ก ์ด์ด์ง๋๋ค.
์ฐํฉ ํ์ต: โ๋ถ์ฐํ๋ ์ง๋ฅโ์ผ๋ก ๊ฐ๋ ํจ๋ฌ๋ค์
โ์ฐํฉ ํ์ต (Federated Learning)โ์ด AI ๋ถ์ผ์์ ํ์ ์ ๊ฐ๋ ์ ์์ ํ ์๋กญ๊ฒ ์ ์ํ๊ฒ ๋ ๊ฒ๋๋ค. ๋ฏผ๊ฐํ ๋ฐ์ดํฐ๋ ๋ก์ปฌ ์ ์ฅ์์ ์์ ํ๊ฒ ๋ณด๊ดํ๋ฉด์๋ ๋ถ์ฐ๋ ํ๊ฒฝ์์ ๋ชจ๋ธ ํ์ต์ ํ ์ ์๋ค๋ ํน์ง ๋๋ถ์, ์ฐํฉ ํ์ต์ ์๋ฃ๋ ๊ธ์ต๊ณผ ๊ฐ์ด ํ๋ผ์ด๋ฒ์๊ฐ ์ค์ํ ๋ถ์ผ์์ ํ์์ ์ธ ๊ธฐ์ ๋ก ์๋ฆฌ์ก๊ณ ์์ต๋๋ค.
๊ทธ๋ ์ง๋ง, ๊ทธ ์ ์ฌ๋ ฅ์ ์ด ์์ญ๋ค์ ํจ์ฌ ๋ฐ์ด๋์ต๋๋ค. ๋ฉํฐ ์์ด์ ํธ ์์คํ ์์์ ์ฐํฉ ํ์ต์ ๋ถ์ฐ๋ ํ์ ์ ํ ์ ์๋๋ก ํด ์ฃผ๊ณ ์. ๊ฐํ ํ์ต ๋ถ์ผ์์๋ ๋ง์ฐฌ๊ฐ์ง์ ๋๋ค. ์ฐํฉ ํ์ต ๊ธฐ์ ์ ํตํด์ ์ฃ์ง ๋๋ฐ์ด์ค๋ ๋ ๋ฆฝ๋ ์์คํ ๋ฑ ๋ค์ํ ํ๊ฒฝ์์ ์๋ํ๋ ์์ด์ ํธ๋ค์ด ๊ฐ์ ๊ณ์ํด์ ๊ฒฝํ์ ์์ผ๋ฉด์๋, ๋์์ ์ ์ฒด ๋ชจ๋ธ์ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ ์ ์์ต๋๋ค.
Localized Adaptability (๋ก์ปฌ์ ์ ์์ฑ), ๊ทธ๋ฆฌ๊ณ Global Optimization (์ ์ฒด ์ต์ ํ)์ ๊ฒฐํฉํ ์ฐํฉ ํ์ต์ด ์ฐจ์ธ๋ AI์ ํต์ฌ ๊ธฐ์ ๋ก ํ์คํ ์๋ฆฌ์ก์ ๊ฒ๋๋ค. ๋จ์ํ ๊ฐ์ธ์ ๋ณด ๋ณดํธ ๋๊ตฌ๋ฅผ ๋์ด์, ๋ค์ํ, ๊ทธ๋ฆฌ๊ณ ์์์ด ์ ํ๋ ํ๊ฒฝ์์๋ AI์ ๊ฐ์น๋ฅผ ๋ฐํํ ์ ์๊ฒ ํด์ฃผ๋ ํฌ๊ด์ ์ธ ํ๋ ์์์ผ๋ก ์๋ฆฌ์ก๊ณ ์์ต๋๋ค. ํนํ ์ฐํฉ ํ์ต์ ์์ผ๋ก๋ ๊ณ์ ์ค์ ํค์๋์ ํ๋๊ฐ ๋ โAI์ ๋ธ๋ก์ฒด์ธ์ ๊ฒฐํฉโ ๊ด์ ์์๋ ํ๋์ ์ค์ ๊ธฐ์ ๋ก ๊ฐ๊ด๋ฐ์ผ๋ฆฌ๋ผ ์๊ฐํฉ๋๋ค.
๋ณต์ก์ฑ์ ์๋, AI ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ฅ
์์ด๋ก โInferenceโ์ โReasoningโ์ด ๋ชจ๋ ํ๊ธ๋ก๋ โ์ถ๋ก โ ์ธ์๋ ์ ํฉํ ๋จ์ด๊ฐ ์๋ ๊ฒ ๊ฐ์๋ฐ์. ์ด ๊ธ์ ๋งฅ๋ฝ ์์์๋, ๊ฐ๋จํ๊ฒ Reasoning์ ์ถ๋ก ๊ทธ ์์ฒด๋ฅผ, Inference๋ ์ถ๋ก ์ ๊ณผ์ ์ด๋ ํ์ ์ ์ฒด๋ฅผ ์ด์ผ๊ธฐํ ๋ ์ฌ์ฉํ๋ ๋จ์ด๋ผ๊ณ ์๊ฐํด ์ฃผ์๋ฉด ์ข๊ฒ ์ต๋๋ค.
AI ์์คํ ์ด ์ ์ ๋ โ์ฌ๋๊ณผ ๋น์ทํ๊ฒ ๋ณด์ด๋โ ์ถ๋ก ์์ ์ ์ํํ ์ ์๊ฒ ๋๋ฉด์, โ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ํ์ตโ๊ณผ โ๋ ผ๋ฆฌ์ ์ธ ๊ท์น ๊ธฐ๋ฐ ์ถ๋ก โ์ ๊ฒฐํฉํ '๋ด๋ก-์ฌ๋ณผ๋ฆญ (Neuro-Symbolic)' ์ ๊ทผ ๋ฐฉ๋ฒ์ด ์ ๋งํ ์ฐ๊ตฌ ๋ถ์ผ๋ก ๋ ์ฌ๋์ต๋๋ค. ์ด๋ฐ ํ์ด๋ธ๋ฆฌ๋ํ ๊ธฐ๋ฒ์, ์ง๊ด๊ณผ ๊ตฌ์กฐํ๋ ๋ ผ๋ฆฌ๋ฅผ ํจ๊ป ์ฌ์ฉํ๋ ์ฌ๋์ ์ฌ๊ณ ๋ฐฉ์๊ณผ ๋ง๋ฟ์ ์๊ณ , ๋ ๋ณดํธ์ ์ธ ํํ์ AI๋ฅผ ๋ง๋ค์ด๋ผ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋ค๊ณ ์๊ฐํฉ๋๋ค.
๋์์, ARC-AGI ์ฑ๋ฆฐ์ง ๊ฐ์ ์๋ก์ด ๋ฒค์น๋งํฌ๋ค์ด AI์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฒ์ฆํ๋ ์ํ๋๋ก ๋ฑ์ฅํ๊ณ ์์ต๋๋ค. ๋จ์ํ AI๊ฐ ๋ญ ํ ์ ์๋๋๋ฅผ ๋์ด์, ์ถ์ํ๋ ์ผ๋ฐํ๋ฅผ ์ผ๋ง๋ ์ ํ๊ณ , ์๋ก ๋ค๋ฅธ ๋ค์ํ ์์ญ์ ๋๋๋ค๋ฉด์ ์ถ๋ก ์ ํ ์ ์๋๋ฅผ ์ธก์ ํฉ๋๋ค. ์ด๋ฐ ๋ฒค์น๋งํฌ๋ค์, โAI์ ๋ฐ์ ์ด๋ผ๋ ๊ฒ ๋จ์ํ๊ฒ ๊ฐ๋ณ ์์ ์ ๋ฐ์ด๋๊ฒ ์ ํ๋ ๊ฑธ ๋์ด์ ์ง๋ฅ ๊ทธ ์์ฒด์ ๋ํด ๋ ๊น์ ์ดํด๋ฅผ ํ๊ฒ ํด ์ฃผ๋ ๊ฒ์ด๋คโ๋ผ๋ ์ ์ ์๊ฐํด ๋ณด๊ฒ ํด ์ฃผ๋ ๊ฒ ๊ฐ์ต๋๋ค. ARC-AGI๋ฅผ ๋ง๋ Francois Chollet์ 2025๋ ์ ARC-AGI 2๋ฅผ ๊ณต๊ฐํ๊ฒ ๋ค๊ณ ์๊ณ ํ๊ณ ์์ต๋๋ค.
ARC-AGI, ๊ทธ๋ฆฌ๊ณ ์ง๋ฅ์ ์ด๋ป๊ฒ ์ธก์ ํ ๊ฒ์ธ๊ฐ์ ๋ํ ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ํฌ์คํธ๊ฐ ๊ถ๊ธํ์๋ฉด ์๋ ๋งํฌ๋ฅผ ํ ๋ฒ ์ฐธ๊ณ ํด ๋ณด์๊ธฐ ๋ฐ๋๋๋ค:
๊ณต๊ฐ ์ง๋ฅ (Spatial Intelligence): AI๊ฐ ๋ฌผ๋ฆฌ์ ์ธ๊ณ๋ฅผ ์ดํดํ๋ค
โ๊ณต๊ฐ ์ง๋ฅโ. ์ฐจ์ธ๋ AI๊ฐ ๊ฐ์ ธ์ผ ํ ํต์ฌ ๋ฅ๋ ฅ์ ๋๋ค. ์ด๊ฑด AI ์์คํ ์ด ๋ฌผ๋ฆฌ์ ์ธ ๊ณต๊ฐ, ๊ธฐํํ, ๊ทธ๋ฆฌ๊ณ 3์ฐจ์์์ ๊ณต๊ฐ๊ณผ ์ฌ๋ฌผ์ ๊ด๊ณ๋ฅผ ์ดํดํ๊ณ ์ถ๋ก ํ ์ ์๊ฒ ํด์ฃผ๋ ๋ฅ๋ ฅ์ธ๋ฐ์. ๋ก๋ด ์กฐ์, ์ฆ๊ฐ ํ์ค ๋ฑ ์ค์ ์ธ๊ณ์์ ์ํธ ์์ฉํด์ผ ํ๋ AI ์์คํ ์ด๋ผ๋ฉด ์ด๋ฐ ๋ฅ๋ ฅ์ด ํ์์ ์ ๋๋ค.
์ต์ ์ AI ์ํคํ ์ฒ๋ค์ ๊ณต๊ฐ๊ณผ ๊ด๋ จ๋ ์ถ๋ก ์ ๋ ์ ์ฒ๋ฆฌํ๋ ๋ฐฉํฅ์ผ๋ก ์งํํ๊ณ ์์ฃ . ํธ๋์คํฌ๋จธ๊ฐ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํตํด์ โ๊ด๊ณ์ฑโ์ ๋ชจ๋ธ๋งํ๋๋ฐ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์๊ณ , ๋ด๋ด ํ๋ (Neural Fields)๋ผ๋ ๊ฐ ๊ทธ๋ํ ์ ๊ฒฝ๋ง (Graph Neural Networks) ๋ฑ ํนํ๋ ์ํคํ ์ฒ๋ค์ ๊ณต๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋๋ฐ ๊ฐ์ ์ ๋ณด์ฌ์ค๋๋ค.
์ต๊ทผ์ ๋ง๋ฐ (Mamba) ๊ฐ์ ์ํ ๊ณต๊ฐ ๋ชจ๋ธ (SSM; State-Space Model)๋ค์ด ๋ฑ์ฅํด์ ๊ณต๊ฐ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ๋ณด์ํด ์ฃผ๊ณ ์๋๋ฐ์. ์ด๋ฐ ๋ชจ๋ธ์ ์์ฐจ์ ๋ฐ์ดํฐ๊ฐ ์ฆ๊ฐํ๋๋ผ๋ ์ ํ์ ์ผ๋ก ํ์ฅํ ์ ์์ด์ - ์ฆ, ์ฐ์ฐ ๋ถ๋ด์ด ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํ์ง ์์์ - ํจ์จ์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค. ๊ณต๊ฐ์ ์ดํด ๋ฅ๋ ฅ๊ณผ ๊ฒฐํฉ๋๋ค๋ฉด, ์ด๋ฐ ๋ชจ๋ธ์ด ๋์์ ๊ณํํ๋ค๊ฑฐ๋, ํ๊ฒฝ์ ๋งคํํ๊ณ , ์ค์๊ฐ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์ถ์ ํ๋ค๊ฑฐ๋ ํ๋ ์์ ์ ํ์ํ โ์๊ณต๊ฐ ์ถ๋ก โ์ ํ ์ ์์ต๋๋ค.
๋ง๋ฐ ์ํคํ ์ฒ์ ๋ํด์ ์ข ๋ ๊ถ๊ธํ์ ๋ถ์, ์๋ ํฌ์คํธ๋ฅผ ์ฐธ๊ณ ํด ๋ณด์ ๋ ์ข๊ฒ ์ต๋๋ค:
ํํ ์ปดํจํ ์ด ์ด์ด๊ฐ ๋ฏธ๋
์, ํํธ ํํ ์ปดํจํ ์ ์ต์ ํ๋ผ๋ ๊ฐ ์๋ฎฌ๋ ์ด์ ๋ถ์ผ์์ ๋ค์ํ ํ์ ์ ๋๊ตฌ๊ฐ ๋ ๊ฑฐ๋ผ๋ ๊ธฐ๋๋ฅผ ์ผ์ผํค๋ฉด์ ๋ฐ์ ํ๊ณ ์์ฃ . Variational Quantum Algorithm, ๊ทธ๋ฆฌ๊ณ Quantum-Aware Neural Architecture๋ AI์ ํํ ์์คํ ์ด ํจ๊ป ์งํํ๋ฉด์, ์ง๊ธ ๋ถ๊ฐ๋ฅํด ๋ณด์ด๋ ๋ฌธ์ ๋ค์ด ํด๊ฒฐ๋๋ ๋ฏธ๋๊ฐ ๋ค๊ฐ์ฌ ๊ฑฐ๋ผ๋ ๋ป์ด์ฃ .
Quantum-Enhanced Reinforcement Learning ๊ฐ์ ์๋ก์ด ๋ถ์ผ๋, ๋ค์ด๋๋ฏน ์์คํ ๊ธฐ๋ฐ์ ์์ฌ๊ฒฐ์ ๋ฐฉ์์ ํ์ ํ ์ ์๊ณ , ์ ์ฝ ๊ฐ๋ฐ, ๊ธฐํ ๋ชจ๋ธ๋ง, ์ํธํ ๊ฐ์ ๋๊ท๋ชจ์ ์กฐํฉ์ ๋ค๋ฃจ๋ ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ๋ ํจ์จ์ ์ผ๋ก ํด๊ฒฐํ ์ ์์์ง ํ๊ตฌํ๋ ์ฐ๊ตฌ์๋ค๋ ๋ง์ด ์๊ฒจ๋๊ณ ์์ต๋๋ค.
ํํ ํ๋์จ์ด๊ฐ ๋ฐ์ ํ๊ณ ์ฑ์ํด ๊ฐ๋ฉด์, ์๋ง๋ ์ฐ๊ตฌ์ ์ด์ ์์ฒด๊ฐ โ์ ํต์ AIโ์ โํํ ์๊ณ ๋ฆฌ์ฆโ์ด ์ํธ ๋ณด์ํ๋ โํ์ด๋ธ๋ฆฌ๋ ์ํฌํ๋ก์ฐโ ๊ตฌ์ถ์ด๋ผ๋ ๋ฐฉํฅ์ผ๋ก ์ด๋ํ๊ฒ ๋ ๊ฒ๋๋ค. ์ด๋ฐ ๋ฐฉ์์ ๊ฒฐํฉ์ด ์์ฑ๋๋ค๋ฉด, AI๊ฐ ๋ฐํํ ์ ์๋ ๋ฅ๋ ฅ์ ์๋ก์ด ์งํ์ ๋ ์๋กญ๊ฒ ์ด๊ฒ ๋๊ฒ ์ฃ .
์ ์ธ๊ณ์ ์ผ๋ก๋, ๊ทธ๋ฆฌ๊ณ ๋ฌด์๋ณด๋ค ์ฐ๋ฆฌ๋๋ผ๋ ์ฌ๋ฌ ๊ฐ์ง ํผ๋์ค๋ฌ์ด ์ํฉ์ด ๋ ์์ ๋์ฌ ์์ง๋ง, AI ์์ญ์ ๊ฑฐ์นจ์์ด ๋ฐ์ ๊ณผ ํ์ฐ์ ๊ธธ์ ๊ฑท๊ณ ์๋ ๊ฒ๋ง ๊ฐ์ต๋๋ค. ์ฐ๋ฆฌ ์ธ๋ฅ์๊ฒ โ์๋ฏธ์๋โ, โ๊ธ์ ์ ์ธโ ์ฌ๊ฑด์ด ๊ฐ๋ํ 2025๋ ์ด ๋๊ธฐ๋ฅผ ๋ฐ๋ ๋ด ๋๋ค!
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
2024๋ , ๋ณธ๊ฒฉ์ ์ผ๋ก ๊ด์ฌ์ ๋ฐ๊ธฐ ์์ํ AI ์์ด์ ํธ. 2025๋ ์๋ AI ์์ด์ ํธ๋ฅผ ์ค์ ๋ก ๊ตฌ์ถํ๊ธฐ ์ํ ์๋๊ฐ ๋ง์ด ์ด์ด์ง ๊ฒ์ผ๋ก ์์ํด ๋ด ๋๋ค.
์ฌํด ๋ฑ์ฅํ ์์ด์ ํฑ ์์คํ ๊ณผ ํ๋ ์์ 15๊ฐ์ง๋ฅผ ์ดํด๋ด ๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
์คํAI, ํ๋ คํ๊ฒ ์ฐ๋ง์ ์ฅ์ํ๋ค
์คํAI๊ฐ ์ ๋ก์๋ ์๋ฎฌ๋ ์ด์ ์ถ๋ก (Simulated Reasoning) ๋ฅ๋ ฅ์ ์๋ํ๋ o3์ o3-mini๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. o3๋ ARC-AGI ๋ฒค์น๋งํฌ์์ ์ฌ๋๊ณผ ๋น์ทํ ์์ค์ ์ ์๋ฅผ ๊ธฐ๋กํ๊ณ , ์ํ๊ณผ ๊ณผํ ๋ถ์ผ์ ๋ฒค์น๋งํฌ๋ค์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์ ๋ ์๋์ ์ธ ์ฐจ์ด๋ก ๋ฐ์ด๋์์ต๋๋ค. ์ด ๋ชจ๋ธ๋ค์ โPrivate CoTโ ์ถ๋ก , ๊ทธ๋ฆฌ๊ณ ์ํฉ์ ๋ฐ๋ผ ์ฒ๋ฆฌ ์๋๋ฅผ ์กฐ์ ํ ์ ์๋ ์ ์ํ ํ๋ก์ธ์ฑ์ ํน์ง์ผ๋ก ํฉ๋๋ค. o3-mini๋ 1์์ ๋จผ์ ์ถ์๋๊ณ , o3๋ ๊ทธ์ ๋ค์ด์ด ๊ณต๊ฐํ ์์ ์ด๋ผ๊ณ ํฉ๋๋ค.
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3
โ OpenAI (@OpenAI)
7:16 PM โข Dec 20, 2024
์คํAI๋ o-์๋ฆฌ์ฆ ๋ชจ๋ธ๋ค์ด ๋ ์์ ํ๊ณ ์ ํํ ๋ต๋ณ์ ํ๊ฒ ํ๊ธฐ ์ํด์ โ์์ ์ ์ฑ โ์ ๋ช ์์ ์ผ๋ก ๊ฒํ ํ๊ฒ๋ ํ๋ ์๋ก์ด Alignment ์ ๋ต์ ๋ฐํํ๊ธฐ๋ ํ์ต๋๋ค. CoT ์ถ๋ก ์ ํ์ฉํด์ GPT-4 ๋ฑ ์ด์ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ๋ฐ์ด๋์ ๋ฟ ์๋๋ผ, ์ ์์ ์ธ ํ๋กฌํํธ ๋ฑ์๋ ๋ ์ ๊ตํ๊ฒ ๋์ํ ์ ์๊ฒ ๋์์ต๋๋ค.
o3 ๋ฐํ์ ๊ทธ๋์ ์ข ๊ฐ๋ฆฌ๊ธฐ๋ ํ์ง๋ง, ๊ฐ๋ฐ์ ๊ธฐ๋ฅ์ ํฅ์์ํจ ๊ฐ์ ๋ ๋ฒ์ ์ o1๋ ์ถ์๋์์ต๋๋ค. ๊ฐ๋ฐ์๋ค์ด o1์ ๋ ์ฝ๊ฒ ์ฌ์ฉํ ์ ์๊ฒ๋ ํ๋ Toolbox๋ฅผ ์ ๊ณตํ๋ค๊ณ ํฉ๋๋ค.
๊ตฌ๊ธ, ์คํฌํธ๋ผ์ดํธ์ ์ค์ฌ์ผ๋ก ์์ํ, ๋ฌด๊ฒ๊ฐ์๊ฒ ๋ณต๊ทํ๋ค
๊ตฌ๊ธ. ์ฌํด ๋ค์ ๋ถ์ง(? - ๊ธฐ๋์ ์ ์ฌ๋ ฅ๋ณด๋ค๋์)ํ๋ ๊ตฌ๊ธ, ๋ด๋ ์๋ ํ์คํ AI ์์ญ์ ์ ๋์ ๋ฆฌ๋ ์๋ฆฌ๋ก ๋ค์ด์ฌ ๊ฑฐ๋ผ๋ ๊ฐ์ธ์ ์ธ ์๊ฐ์ ํด ๋ด ๋๋ค. ์คํAI๊ฐ o3๋ฅผ ๋ฐํํ๊ธฐ ํ๋ฃจ ์ , ์ญ์ ์ถ๋ก ๋ชจ๋ธ์ธ Gemini 2.0 Flash Thinking์ ๊ณต๊ฐํ์ต๋๋ค.
Weโve been *thinking* about how to improve model reasoning and explainability
Introducing Gemini 2.0 Flash Thinking, an experimental model trained to think out loud, leading to stronger reasoning performance.
Excited to get this first model into the hands of developers to tryโฆ x.com/i/web/status/1โฆ
โ Noam Shazeer (@NoamShazeer)
5:00 PM โข Dec 19, 2024
Claude์ ๋น๋ฐ: ๋ชจ๋ธ์ด Alignment๋ฅผ ์์ฅํ ์ ์๋ค?
์ค์ฐ๋กํฝ์์ ํฅ๋ฏธ๋ก์ด ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ์์ ๊ท์น์ด๋ ์ฌ์ฉ์์ ์ง์์, AI ๋ชจ๋ธ์ด ์ ๋ต์ ์ผ๋ก ์์ํ๋ ์ฒ ํ๋ โAlignment Fake (์ ๋ ฌ ์์ฅ)โ ํ์์ ๋ฐ๊ฒฌํ๋ค๋ ๊ฑด๋ฐ์. ์ด ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด, Claude 3 Opus๋ ํน์ ํ ์กฐ๊ฑด ํ์์ ๊ฐ๋ Alignment ๊ธฐ์ค์ ๋ง์ถ ๊ฒ์ฒ๋ผ ํ๋์ ํ์ง๋ง ์ด์ ์ ํ์ต๋ ์ ํธ๋ (Preference)๋ ์ฌ์ ํ ์ ์งํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค๊ณ ํฉ๋๋ค. ์ด๋ฐ ๋ฐ๊ฒฌ์ด ์ฌ์ค์ด๋ผ๋ฉด, AI ์์ ๊ณผ ๊ด๋ จ๋ ํธ๋ ์ด๋์ด ๊ณผ์ฐ ํจ๊ณผ๋ฅผ ์ผ๋ง๋ ๋ฐํํ ๊ฒ์ธ์ง ์๋ฌธ์ ๊ฐ์ง๊ฒ ํ๊ฒ ์ฃ ? ์ด์ฉ๋ฉด ๋ ๊น์ ์์ค์ ๊ฒ์ฆ, ๊ทธ๋ฆฌ๊ณ ๋ ๋ค๋ฅธ ๊ด์ ์ ๋๋น์ฑ ์ด ํ์ํ๋ค๋ ๊ฑธ ์์ฌํ๋ค๊ณ ํ๊ฒ ์ต๋๋ค.
์ฝํ์ด (Cohere), ๊ตฐ์ฌ์ฉ AI ๊ฐ๋ฐ์ ์ํด ํ๋ํฐ์ด์ ์์ก๋ค
์บ๋๋ค์ ๋ํ AI ์คํํธ์ ์ฝํ์ด๊ฐ ๊ตญ๋ฐฉ ์์ญ๊ณผ ์ฌ์ด๋ฒ ์ธํ ๋ฆฌ์ ์ค ์์ญ์ ์ฒจ๋จ AI๋ฅผ ์ ์ฉํ๊ธฐ ์ํด์ ๋ฏธ๊ตญ ํ๋ํฐ์ด์ ํํธ๋์ญ์ ๋งบ์์ต๋๋ค. ๊ตญ๊ฐ ๋ณด์ ๊ด์ ์์ AI๋ฅผ ๋ ๋ง์ด, ๋ ํจ๊ณผ์ ์ผ๋ก, ๋ ๋ฐ์ ํ๊ฒ ํ์ฉํ๊ฒ ๋ ๊ณ๊ธฐ๊ฐ ๋๊ธฐ๋ ํ์ง๋ง, AI์ ๋ฌด๊ธฐํ๋ฅผ ์ฐ๋ คํ๋ ํ๊ณ์ ์์ ๋ ์๋ค์.
AI ์นํฐ, ๋๊ท๋ชจ์ ํฌ์ ๋ผ์ด๋๋ ๊ณ์๋๋ค
๋ฐ์ดํฐ๋ธ๋ฆญ์ค, $10B ๊ท๋ชจ ํฌ์ ์ ์น๋ฅผ ํ๋ฉด์ ๊ธฐ์ ๊ฐ์น๊ฐ $62B๊ฐ ๋์์ต๋๋ค. AI๋ฅผ ์ํ ๋ฐ์ดํฐ ๊ด๋ฆฌ ๊ธฐ์ ์ผ๋ก์์ ๋ ๋ณด์ ํฌ์ง์ ๋์ ๊ฐํํ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
Perplexity AI๊ฐ $500M ๊ท๋ชจ์ ํฌ์ ์ ์น๋ฅผ ๋ง๋ฌด๋ฆฌํ๋ฉด์ ๊ธฐ์ ๊ฐ์น๋ $9B๊ฐ ๋์์ต๋๋ค. โAI ๊ฒ์์์งโ ์์ญ์ ์ ๋ ๊ทธ๋ฃน์ ์๋ ์คํํธ์ ์ผ๋ก์, ์์ผ๋ก ๊ตฌ๊ธ๊ณผ์ ๊ฒฝ์์ ์ด๋ป๊ฒ ํค์ณ๋๊ฐ์ง ์ฃผ๋ชฉ๋ฉ๋๋ค. Perplexity AI์ ๋ํด ์ข ๋ ๊ถ๊ธํ์ ๋ถ์ ์๋ ๊ธ๋ ํ ๋ฒ ์ฐธ๊ณ ํด ๋ณด์ธ์:
AI ๊ธฐ๋ฐ์ ์ฝ๋ ํธ์ง๊ธฐ ์คํํธ์ , Anysphere. 4๊ฐ์๋ฐ์ ๋์ง ์์์ง๋ง, ์ด ์คํํธ์ ์ $100M์ ํฌ์๋ฅผ ์ ์นํ๋ฉด์ ๊ณ์ํด์ AI ๊ธฐ๋ฐ ๊ฐ๋ฐ์ ๋๊ตฌ๋ฅผ ๊ฐ์ , ํ๋ํด ๋๊ฐ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
๊ธ์ฃผ์ Top Pick!
Qwen2.5, Alibaba's latest LLM suite
๋ฌด๋ ค โ18์กฐ ๊ฐโ์ ํ ํฐ์ผ๋ก ํ์ต์ ํ ์๋ฆฌ๋ฐ๋ฐ์ ์ต์ ๋ชจ๋ธ๋ก, ์์ ์์ญ์ ์ ๋ฌธ๊ฐ ์์ค์ ์ถ๋ก ๋ฅ๋ ฅ์ ๊ฒฐํฉํ์ต๋๋ค. ์๋ก์ด ์ฌํ ํ์ต ๊ธฐ๋ฒ์ผ๋ก ํ์ธต ๊ฐํ๋ Qwen2.5๋ Llama-3์ ๊ฐ์ ๊ฑฐ๋ ๋ชจ๋ธ๋ค๊ณผ ์ด๊นจ๋ฅผ ๋๋ํ ํ๋ฉด์๋ ๋ ๋์ ๋น์ฉ ํจ์จ์ฑ์ ๋ณด์ฌ์ค๋ค๊ณ ํ๋ค์.
โ> [๋ ๋ณด๊ธฐ]ModernBERT: A Modern Encoder
๋ค์ํ ์์ญ์์ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ณ ์ถ๋ก ์ ํจ์จ์ ์ผ๋ก ํ๋๋ก ํ๊ธฐ ์ํด์ ์ต์ ํํ ์ธ์ฝ๋ ๋ชจ๋ธ์ ๋๋ค. โ> [๋ ๋ณด๊ธฐ]TII unveils Falcon3
๊ท๋ชจ vs. ์ต์ ์ ์ฑ๋ฅ ์ฌ์ด์ ๊ท ํ์ ๋ง์ถ, 100์ต ๊ฐ ์ดํ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง LLM ์๋ฆฌ์ฆ์ ๋๋ค. Depth Scaling, Knowledge Distillation ๋ฑ์ ํ์ ์ ์ธ ๊ธฐ์ ์ ํ์ฉํ ์ด ๋ชจ๋ธ๋ค์ ์ํ, ์ฝ๋ฉ, ์ถ๋ก ๋ฒค์น๋งํฌ์์ ๋ ํฐ ๋ชจ๋ธ๋ค๊ณผ ๊ฒฌ์ค ๋งํ ๋ฐ์ด๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
โ> [๋ ๋ณด๊ธฐ]
๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ ์ต์ ํ ๋ฐ ํจ์จํ
SPAR: Self-Play with Tree-Search Refinement
โํธ๋ฆฌ ๊ฒ์ ์์ฒด ๊ฐ์ (Tree-Search Self-Refinement)โ ๊ธฐ๋ฒ์ ์ฌ์ฉํด์ LLM์ ์ง์ ์ํ (Instruction Following) ๋ฅ๋ ฅ์ ํฅ์์์ผฐ๊ณ , ์ด๊ฑธ ๊ธฐ๋ฐ์ผ๋ก ํ์ต์ ๋ ์ ํ๋๋ก ํ๊ธฐ ์ํ, ๋น๊ต ๊ฐ๋ฅํ ์ ํธ๋ ์ (Preference Pair)์ ๋ง๋ค์ด ๋์ต๋๋ค. โ> [๋ ๋ณด๊ธฐ]SepLLM: Accelerate Large Language Models
๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ ๊ณ์ฐ์ ํจ์จ์ฑ์ ๋์ด๊ธฐ ์ํด Separator Token์ ์ฌ์ฉํ๋ โ์ธ๊ทธ๋จผํธ ์์ถ (Segment Compression)โ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]SGD-SaI: Learning Rate Scaling at Initialization
ํธ๋์คํฌ๋จธ๊ฐ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํจ์จ์ ์ผ๋ก ํ์ฉํ๋ฉด์ ํ์ตํ๋๋ก ํด ์ฃผ๋ ์ต์ ํ ๋๊ตฌ๋ฅผ ๋์ ํ๋๋ฐ, AdamW๋ณด๋ค ๋์ ๋๋ ์ฑ๋ฅ์น์ ํฅ์์ ๋ณด์ฌ ์ค๋๋ค. โ> [๋ ๋ณด๊ธฐ]
์ถ๋ก ๋ฐ ๋ฉํฐ์คํ ์ต์ ํ
Compressed Chain of Thought (CCoT): Efficient Reasoning
์ถ๋ก ์ ์ ํ๋๋ฅผ ๋ ๋์ด๊ธฐ ์ํด์ ์์ถ๋ ํํ (Compressed Representation)์ ์์ฑ, Dense Reasoning์ ๊ฐ๋ฅํ๊ฒ ํด ์ค๋๋ค. โ> [๋ ๋ณด๊ธฐ]Offline Reinforcement Learning (OREO): Multi-Step Reasoning
์คํ๋ผ์ธ ๊ฐํ ํ์ต ํ๋ ์์์ ํ์ฉํด์ LLM์ ๋ค๋จ๊ณ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๊ณ , ํฌ์ ๋ณด์ (Sparse Reward) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
๋ฉํฐ๋ชจ๋ฌ ๋ฐ RAG ์์คํ
RetroLLM: Unified Retrieval and Generation
LLM์ ํ๊ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ๊ฒ์, ๊ทธ๋ฆฌ๊ณ ์์ฑ ์์ ์ ํตํฉํ๋ฉด์ ์ฆ๊ฑฐ (Evidence) ๊ธฐ๋ฐ์ ์ถ๋ ฅ ์์ ์ ๊ฐ์ ํด ๋ด ๋๋ค. โ> [๋ ๋ณด๊ธฐ]Progressive Multimodal Reasoning via AR-MCTS: Enhancing Multimodal Tasks
๋ฉํฐ๋ชจ๋ฌ ์์คํ ์ ์ถ๋ก ์ฑ๋ฅ์ ๊ฐ์ ํ๊ธฐ ์ํด์, ๋ฅ๋์ ๊ฒ์ (Active Retrieval), ๋ชฌํ ์นด๋ฅผ๋ก ํธ๋ฆฌ ํ์ ํ๋ ์์์ ๋์ ํด ๋ด ๋๋ค. โ> [๋ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply