- Turing Post Korea
- Posts
- ๐FOD#99: 'แแ กแแ ฅแทแแ ฎแซ' AI, แแ ณแ แ ตแแ ฉ 'แ แ ตแแ ฅแแ ฉแแ ณ แ แ ขแผแแ ตแผ'แแ ด แแ ชแซแแ กแผ: แแ ฎแ แ ตแแ ก แแ ฅแฎแแ ณแฏ แแ ญแแ ฎแซ
๐FOD#99: 'แแ กแแ ฅแทแแ ฎแซ' AI, แแ ณแ แ ตแแ ฉ 'แ แ ตแแ ฅแแ ฉแแ ณ แ แ ขแผแแ ตแผ'แแ ด แแ ชแซแแ กแผ: แแ ฎแ แ ตแแ ก แแ ฅแฎแแ ณแฏ แแ ญแแ ฎแซ
'แแ ตแซแแ ฆแซแแ ตแแ ณแแ ก แแ ซแแ ฉแจ'แแ ฌแฏ แแ ข, AIแแ ด แแ งแซแแ ตแฏแแ ต แแ ฑแแ กแแ ฑแซแแ ก + แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
์ง๋ ์ฃผ๋ ์ญ์ ์ ๋ง ์จ๊ฐ์๊ฒ ๋ง์ ๋ด์ค๊ฐ ์์์ง ํ ์ฃผ์์ต๋๋ค - ํด๋ฆฌ์ ฐ์ฒ๋ผ ๋ค๋ฆฌ๊ธด ํ์ง๋ง, ์ ๋ง ๊ทธ๋ฌ์ด์. ์ค๋ ๋ด์ค๋ ํฐ์ ์ฒซ ๋ฒ์งธ ๋ถ๋ถ์ โํธ๋ ๋โ์ ๊ด๋ จ๋ ๋ถ๋ถ, ๋ ๋ฒ์งธ๋ ์กฐ๊ธ์ ๋ โ๊ธฐ์ ์ โ์ธ ๋ถ๋ถ์ด๋, ์ญ ํ ๋ฒ ๋ด ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
์๋ ๋งํ์์, ํฌ์๊ฐ ํ ํ๋ ์ดํธ ์๋์ ์์์ ์จ๊ฒจ๋์, ๊ณต์ด ๊ฐ์๊ธฐ ๋ฐฉํฅ์ ๋ฐ๊พธ๋ ์ฅ๋ฉด, ํน์ ๊ทธ๋ฐ ์ฅ๋ฉด ๋ณด์ ์ ์๋์?

์ผ๊ตฌํ๋ฉด ์๊ฐ๋๋ ๋งํ ์บ๋ฆญํฐ - ๋ ๊ณ ํ, ๊ทธ๋ฆฌ๊ณ ํ๋ก. ๊ทธ๋ฅ ์ฌ๋ ค๋ด ๋๋ค ^.^
2025๋ ์ AI ์์ฆ, โ์์์ ๊น์๋์ ๋์ ๋ณํํ๋ ๋ง๊ตฌโ ๊ฐ์ ๋ฉด์ด ์๋ ๊ฒ ๊ฐ์ต๋๋ค - AI์ ๊ฒฝ์ฐ์๋, ๊ทธ โ์์โ์ด ์ฐ๋ฆฌ๋ค์ โํผ๋๋ฐฑ ๋ฃจํโ์ ๋ด์ฅ๋์ด ์๋ค๋ ๊ฒ๋ง ๋ฌ๋ผ์.
์ด๋ฒ ์ฃผ์ ํฐ ์ฃผ๋ชฉ์ ๋ฐ์ ๋ ๊ฐ์ง ์์์ด ์๊ฑฐ๋ ์. ๊ทธ๋ฐ๋ฐ ๋ ๋ค โ๊ฐ์ ์ง์ โ์ ์ง๊ณ ์์ด์: ๋ญ๋ํ๋ฉด, ์ฐ๋ฆฌ๊ฐ AI๋ผ๋ ๊ฑธ ์๋ํ ๋ ์์กดํ๊ฒ ๋๋ ์งํ๋ค - โ์ข์์!โ, ๊ทธ๋ฆฌ๊ณ โ๋ฆฌ๋๋ณด๋โ - ์ด, AI ๋ถ์ผ ์ ์ฒด์ ๋ฐธ๋ฐ์ค๋ฅผ ๋ฌด๋๋จ๋ฆฌ๊ณ ์์ต๋๋ค.
๋ฌด์จ ์ด์ผ๊ธฐ๋๊ตฌ์? ์ด๋ฐ ๊ฒ๋๋ค.
AI, ์์ฒจํ๋ ๊ฒฝํฅ์ ๋ณด์ด๋ค: โ์ฃผ์ธ๋, ๋น์ ์ด ์ต๊ณ ์์!โ

Image Credit: The AI Daily Brief
์คํAI์ GPT-4o์ ์๊ท๋ชจ์ โ์ฌํ ํ์ต (Post-training)โ์ ์ ์ฉํ ํ์, ์ฌ์ฉ์๋ฅผ ์ ๋๋ก ๋๊ธฐ๋ณด๋ค ์ฌ์ฉ์์ ๋ง์ ๊ทธ๋๋ก ๋ฐ์ ๋ฐ๋ผํ๋ ๊ฒฝํฅ์ด ๊ฐํด์ก์ต๋๋ค. ๊ฐ์๊ธฐ ์ฑGPT๊ฐ ์ฌ๋ฌ๋ถ์ด ๋ฌด์จ ๋ง์ ํ๋ ๋์ํ๊ณ ์นญ์ฐฌํ๋ค๋ ๊ฒ๋๋ค. โ๋์โ๊ฐ โ์ข์ ๊ฒโ์ผ๋ก ์์น ์์ผ๋ก ๊ณ์ฐ์ด ๋๋ฉด์, ๋ชจ๋ธ์ด โ์์ฒจโ์ ์ต์ ํ๋์๋ค๊ณ ๋ ํ ๊น์?
๋ด๋ถ์ ์ผ๋ก ์งํํ ์ํ ์ฒดํฌ์์๋ ์ด ๋ณํ๊ฐ ๊ฐ์ง๋๊ธฐ๋ ํ์ง๋ง, ์๋ํ๋ ๋๊ท๋ชจ ํ ์คํธ๋ ํต๊ณผ๋ฅผ ํด ๋ฒ๋ ธ๊ณ , ๊ฒฐ๊ตญ ์ ๋ฐ์ดํธ๊ฐ ๊ทธ๋๋ก ์ค์ ์ด์ํ๊ฒฝ์ ๋ฐฐํฌ๋ ๊ฒ๋๋ค. ๋๋ถ์, AI ์ปค๋ฎค๋ํฐ์์๋ ์ด๋ ค์ด ์ ๋จ์ด, โSycophancy (์๋ถ)โ๋ผ๋ ๋จ์ด, ์ฒ ์๊น์ง ๋ฐฐ์ฐ๊ฒ ๋์๋ค์. ๋ฐ๋ก ๋กค๋ฐฑ (Rollback)์ ํ๊ธฐ๋ ํ์ง๋ง, ์ด ์ฌ๊ฑด์ผ๋ก โ๋ณด์ ํจ์โ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์ค๊ณ๊ฐ ๊ฝค๋ ์ทจ์ฝํ ์ ์๋ค๋ ๊ฑธ ์๊ฒ ๋์์ต๋๋ค.
โ๋ฆฌ๋๋ณด๋โ์ ๋ํ ํ์

Image Credit: imgflip.com
์ฝํ์ด์ ํจ๊ป ์ฌ๋ฌ ๋ํ์ ์ฐ๊ตฌ์ง์ด ํจ๊ป ์งํํ 5๊ฐ์ ๊ฐ์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ์๋ก์ด ๋ชจ๋ธ ๋ญํน์ ๊ธฐ์ค์ผ๋ก ์์ฃผ ํ์ฉ๋๋ Chatbot Arena๊ฐ ์ค์ ์ฐ๋ฆฌ๊ฐ ์๊ฐํ๋ ๋งํผ ์ค๋ฆฝ์ ์ด์ง๋ ์๋ค๋ ๊ฒ ๋ฐํ์ก์ต๋๋ค.
๋ํ ๊ธฐ์ ์ด๋ ์ฐ๊ตฌ์๋ค์, ์๋ง์ ๋น๊ณต๊ฐ์ ๋ณํ ๋ชจ๋ธ๋ค์ ์ถํํ๋ฉด์ โ์ต๊ณ ์ ์โ๋ฅผ ๋ฐ์ ๊ฒ๋ง ์ ์งํ์ต๋๋ค. ํ๊ฒฐ ๊ฒฐ๊ณผ๋ ์ฌ์ ํ ๋๊ฐ โ์ด๊ฒผ๋์งโ ๋ณด์ฌ์ฃผ๊ธด ํ์ง๋ง, ๊ฒฝ์ ์์ฒด๊ฐ ๋ถ๊ณตํํ๋ค๊ณ ๋ ํ ๊น์?

Image Credit: ์ค๋ฆฌ์ง๋ ๋ ผ๋ฌธ
ํจํด์ ํ๋
๋ ๊ฐ์ง์ ์ฌ๋ก ๋ชจ๋, ๊ฐ์ ํ๋์ ๋ฌธ์ ์์ ๋์ค๋ ์๋ก ๋ค๋ฅธ ์ฆ์์ด๋ผ๊ณ ์๊ฐํด์: โ์ฐ๋ฆฌ๊ฐ ์ต์ ํ์ ๋ชฉํ์ ํ๋ก์ (Proxy)๋ก ์ผ๋ ์ ํธ (Signal)๊ฐ, ์ค์ ๋ก ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๋ชฉํ ๊ทธ ์์ฒด์์ ๋ฉ์ด์ง๋โ ๊ฒ๋๋ค. ํ๋์ ๋ฃจํ์์๋ โ์ฌ์ฉ์์ ์นญ์ฐฌโ์ด๋ผ๋ ์ ํธ๊ฐ โ์ง์คโ์ด๋ผ๋ ๋ชฉํ๋ฅผ ๋์ฒดํ๊ณ , ๋ค๋ฅธ ๋ฃจํ์์๋ โ๊ณต๊ฐ๋ ์ ์โ๋ผ๋ ์ ํธ๊ฐ โ์ง์ง ๋ฅ๋ ฅโ์ด๋ผ๋ ์ง์ค์ ๋์ฒดํฉ๋๋ค. ๊ทธ ๊ฒฉ์ฐจ๊ฐ ์ปค์ง์๋ก, ์ฐ๋ฆฌ๋ ์ค์ ๋ณด๋ค ๋ ์ข์๋ณด์ด๋, ์ด์ฉ๋ฉด ์ค์ ๋ฅผ ์ ๋ฐ์ํ์ง ์๋ ๋ชจ๋ธ์ ์ ํธํ๊ณ ๋ฐ๋ผ๋ณด๊ฒ ๋๊ฒ ์ฃ . ๋๋ถ๋ถ, ๋ ๋ง์ ์์์ ๊ฐ์ง, ํฐ ๊ธฐ์ ๋ค์ ๋ชจ๋ธ์ ๋๋ค.
๊ธ์ ์ ์ธ ์
๊ทธ๋๋, (์ฑGPT์ ์์ฒจํ๋ ๊ฒฝํฅ๊ณผ ๊ด๋ จํ) ์คํAI์ ๋ฐ์์, ์ฆ๊ฐ์ ์ด๊ณ ์ฒ ์ ํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ๋ฌด์จ ์ผ์ด ์ผ์ด๋ ๊ฑด์ง ๊ฝค ํฌ๋ช ํ๊ฒ ์ค๋ช ํ, ํฅ๋ฏธ๋ก์ด ํฌ์คํ ์ ํ๊ตฌ์. ์ ๋ฐ์ ์ผ๋ก ๋ณด๋ฉด, ์ด ์ด๋ฒคํธ๊ฐ ์ฐ๋ฆฌ ๋ชจ๋์๊ฒ ๊ตํ์ ์ฃผ๋ ์ข์ ๊ฒฝํ์ด์๋ค๊ณ ์๊ฐํฉ๋๋ค. ๊ด๋ จํด์, Nathan Lambert์ ๊ธ๋ ํ ๋ฒ ๋ณด์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
Chatbot Arena ํ์ ์์์ ๋ฌธ์ ์ ์ ์ง์ ํ ์ฐ๊ตฌ์ ๋ํด์ ๊ทธ ๋ฌธ์ ์ ๋ค์ ์ง์ ํ๋ ์๋ต์ ํ์ต๋๋ค. ๋ฒค์น๋งํน ํ๋ซํผ์ผ๋ก ์ถ๋ฐํด์ ์ต๊ทผ์ ํ์ฌ ์ค๋ฆฝ์ ๋ฐํํ ๋ง๋น์, ๊ทธ๋ฆฌ ๊ธฐ๋ถ์ข์ ๋ด์ค๋ ์๋์์ ๊ฒ ๊ฐ๊ธฐ๋ ํฉ๋๋ค๋งโฆ ์ ๋ฐ์ ์ผ๋ก ์ด๋ฐ๋ ๋ ผ์๊ฐ ์ง์ง ์ข์ ๋ ผ์์๋ค๊ณ ์๊ฐํ๊ตฌ์. Chatbot Arena ์ด๋ฒคํธ๋ก๋ถํฐ ์ป์ด์ผ ํ๋ ๊ตํ์, ์ฐ๋ฆฌ๊ฐ ํ๋์ ๋ฆฌ๋๋ณด๋์๋ง ์์กดํ ์ ์๋ค๋ ๊ฒ, ๊ทธ๋ฆฌ๊ณ ๋์๊ฐ์, โEvaluationโ์ด๋ผ๋ ๊ฒ์ ๋ํด์ ์ด๋ป๊ฒ ์ ๊ทผํด์ผ ํ ๊ฒ์ด๋ ํ๋ ๊ทผ๋ณธ์ ์ธ ์ง๋ฌธ์ ์ค์ค๋ก ํด ๋ด์ผ ํ๋ค๋ ์ ์ผ ๊ฒ๋๋ค. Evaluation์ ๋ํด์๋ ๋ค์ ๊ธฐํ์ ํ ๋ฒ ์๊ฐ์ ์ ๋ฆฌํด ๋ณด๊ฒ ์ต๋๋ค. ๊ด๋ จํด์๋, ์๋๋ ์นดํ์์ ํฌ์คํธ, ๊ทธ๋ฆฌ๊ณ Arvind Narayanan์ ํฌ์คํธ๋ฅผ ์ฐธ๊ณ ํด ๋ณด์ธ์.
์ด๋ฐ โ์๊ณกโ์ด ๊ฐ์ ธ์ฌ ์ถ๊ฐ์ ์ธ ํ์ฅ
๊ทธ๋ฐ๋ฐ, ์๊ฐํด๋ณด๋ฉด ์ด๋ฐ โํผ๋๋ฐฑ ๋ฃจํโ๊ฐ ์๊ณกํ๊ฒ ๋๋ ๊ฑด ๋จ์ง โ๋ชจ๋ธ์ ์ถ๋ ฅ๊ฐโ ๋ง์ ์๋๋ผ๋๋ฐ ๋ ์ฃผ๋ชฉ์ ํด์ผ ํฉ๋๋ค. ๋ ๊ฐ์ง ํธ๋ ๋๋ฅผ ์ ๋ค์ฌ๋ค๋ด์ผ ํฉ๋๋ค:
๊ฑฐ๋ฒ๋์ค์ ์ฌ๊ฐ์ง๋
์ฝ 9,000์ฌ๊ฐ์ ์์ฑํ AI ๋ ผ๋ฌธ์ ๊ฒํ ํ ๊ฒฐ๊ณผ, โ์์ ์ฑโ๊ณผ ๊ด๋ จ๋ ์ฐ๊ตฌ์ 95% ์ด์์ด โ๋ฐฐํฌ ์ด์ ์ ์กฐ์ (Adjustment)โ์๋ง ์ง์ค์ ํ๊ณ ์๋ค๊ณ ํฉ๋๋ค. ์ด๋ ๊ฒ ๋๋ฉด, ์๋ฅผ ๋ค์ด์ โํ๊ฐ (Hallucination)โ ๊ฐ์, ์ถ์ ์ดํ์ ๋น๋ฒํ๊ฒ ์๊ธฐ๊ฒ ๋ ๋ฌธ์ ๋ ์ถฉ๋ถํ ์ฐ๊ตฌ๋์ง ์๊ณ ์๋ค๋ ๋ป์ ๋๋ค. ์ฌ์ ํ, โ์ค์ ์ธ๊ณ์ ์ ๋ขฐ์ฑโ๋ณด๋ค๋ โ์๋ ์ฒ๋ฆฌ๋ ์คํ์คโ ํ๊ฒฝ์์์ ๊ฒฐ๊ณผ์๋ง ์ต์ ํํ๊ณ ์๋ ์ ์ด๊ณ , โ๋ฐฐํฌ๋ ๋ชจ๋ธ๋ ๊ฐ์ ์ ๋์ ์ ๋ขฐ๋๋ฅผ ๊ฐ์ง ๊ฒ์ด๋คโ๋ผ๋ ์ฐฉ๊ฐ์ ํ๊ฒ ํ๋, ํผ๋๋ฐฑ์ ๊ฒฉ์ฐจ (Feedback Gap)๋ฅผ ๋ง๋ค์ด๋ด๊ณ ์์ต๋๋ค.โ์ด ์ค๋๋ ฅโ์ ๊ฐ์ง ํ๋ฅด์๋
MIT, ์ฝ๋ฌ ๋ํ ๋ฑ์ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด, GPT-4์์ ํ ๋ก ์ด โ์๋ชจ๋ก โ์ ๋ํ ๋ฏฟ์์ 80%๊น์ง๋ ์ค์ผ ์ ์๋ค๊ณ ํ๋๋ฐ์. ์ด๊ฑธ ์์์ ์ด์ผ๊ธฐํ AI์ โ์์ฒจ ๊ฒฝํฅโ๊ณผ ์ฐ๊ฒฐํด ๋ณธ๋ค๋ฉด, ๋ชจ๋ธ์ด โ์ง์คโ๋ณด๋ค โ์ค๋๋ ฅโ์ ์ต์ ํํ๋ ์ํ์ ๋ํด์ ์ด๋ป๊ฒ ๋์ํด์ผ ํ ์ง ๊ณ ๋ฏผํ๊ฒ ๋ฉ๋๋ค - ์ด๊ฒ๋, ์ ์ฉํ๊ธฐ ์ฌ์ด ๋ ํ๋์ ํผ๋๋ฐฑ ๋ฃจํ๊ฒ ์ฃ .
์ฐ๋ฆฌ๊ฐ ์ค์ ํ โ์งํโ๋ค์ด ์ด๋ฐ ํ๋ฆ์ ์ ๋๋ก ์ปจํธ๋กคํ์ง ๋ชปํ๋ฉด, AI๊ฐ ์ค์ ์ธ๊ณ์์ ์๋ํ ๋ ์ฌ๋ฌ ๊ฐ์ง ์ฌ๊ฐ์ง๋๋ฅผ ๋ง๋ค์ด๋ด๊ณ ํธํฅ์ฑ์ ์ฆํญ์ํค๊ฒ ๋๋ค๋ ์ , ์์ง ๋ง๊ณ ๋๋นํด์ผ ํ ๊ฒ๋๋ค.
๊ทธ๋ผ, ์ฐ๋ฆฌ๋ ๋ญ ํด์ผ ํ ๊น
๋ค์ํ ํ๊ฐ ๊ธฐ์ค์ ๊ณ ๋ฏผํ๊ณ ์ฌ์ฉํ์ธ์
์ผ๋จ, ์ด๋ค ํ๋์ โ๋ฆฌ๋๋ณด๋โ๋ผ๋ ๊ทธ ๋ถ์ผ ์ ์ฒด๋ฅผ ๋ํํ ์ ์์ ๋ฟ ์๋๋ผ ๋น์ ์ด ๋ง๋ค AI ์ ํ์ ์ ๋๋ก ํ๊ฐํ๋ ๊ธฐ์ค์ด ๋ ์๋ ์๋ค๊ณ ์๊ฐํด์ผ ํฉ๋๋ค. ์กฐ๊ธ ๊ณผ์ฅํ๋ค๋ฉด, AI ์๋์ ์ ํ/์๋น์ค ๊ฐ๋ฐ์ โ(๋๋ง์) ํ๊ฐ ๊ธฐ์ค๊ณผ ๋ฐฉ๋ฒโ์ ๋ง๋๋ ์์ ์ด ์ ๋ฐ, ์๋ ๊ทธ ์ด์์ด๋ผ๊ณ ํด๋ ๊ณผ์ธ์ด ์๋๋๋ค. ์ด ์์ญ์์ ๋ง์ ์ฐ๊ตฌ์ ์์ ์ด ์งํ ์ค์ด๊ธด ํ์ง๋ง, ์ด๋ ค์ด ๊ณผ์ ์์.์ ํ์ ๋ํ โ๋ฐ์ด๋ธ ์ฒดํฌโ๋ฅผ ํด์, ํฐ ์ด์์ด ์์ผ๋ฉด ์ถ์๋ฅผ ์ค๋จํ ์ ์์ด์ผ ํฉ๋๋ค
์๋ฅผ ๋ค์ด์, ๋ค์ฏ ๊ฐ์ง ์ข ๋ฅ์ ํ๋กฌํํธ๋ก ํ ์คํธ๋ฅผ ํ๋ค๊ฐ ์ด์ํ ๋ฐฉํฅ์ผ๋ก AI์ ํ๋ฅด์๋๊ฐ ๋ณํํ๋ค๋ ์๊ฐ์ด ๋ ๋ค๋ฉด, ์ถ์๋ฅผ ์ค๋จํ๊ณ ์กฐ์ฌ๋ฅผ ํด ๋ณผ ์ ์๋ ์ ๋์ ์์ง์ ๊ฒฐ๋จ์ด ํ์ํฉ๋๋ค.(๋ชจ๋ธ ๊ฐ๋ฐ์ฌ๋ผ๋ฉด) ๋ชจ๋ ๋ณํ ๋ชจ๋ธ (Variation)์ ๊ณต๊ฐํ์ธ์
์์งํ๊ฒ ํ ์คํธํ ๋ชจ๋ ๋ชจ๋ธ์ ๋ชฉ๋ก์ ์ฌ๋ ค์ผ ํฉ๋๋ค. ์ ์๊ฐ ๋ฎ๋ค๊ณ ์จ๊ธฐ๊ณ , ์ด๋์ ์จ๊ธฐ๊ณ ์ ๋์ ์จ๊ธด๋ค๋ฉด ์ด๋ป๊ฒ ๋ฆฌ๋๋ณด๋์ ๋ฏฟ์ ์ ์๋์? ๊ฒฐ๊ตญ, ์๊ธ๋ ฅ์ด ํ๋ถํ ์กฐ์ง์ ์ ๋ฆฌํ ๊ฒ์์ด ๋ ์ ๋ฐ์ ์์ต๋๋ค. ๋ฌผ๋ก , ํ์ค์ ์ผ๋ก ์ด๊ฒ ์ด๋ค์ง ๊ฐ๋ฅ์ฑ์ ๋ฎ๋ค๊ณ ์๊ฐํฉ๋๋ค.โ๋ฐฐํฌ (Deployment)โ ์ดํ์ ๋ชจ๋ธ ํ๋์ ๋ํ ์ฐ๊ตฌ, ๋ ์ค์ํฉ๋๋ค
๋น๊ตํ์๋ฉด, โํ์ธํ๋โ์ ๋ค์ด๋ ๋งํผ, ๊ทธ ์ด์์ ๋ ธ๋ ฅ๊ณผ ์ฃผ์๋ฅผ โ๋ฐฐํฌ ์ดํโ ๋ชจ๋ธ์ ํ๋์ ๋ํ ์ฐ๊ตฌ์ ๋ชจ๋ํฐ๋ง, ๋ณด์์ ๋ค์ฌ์ผ ํฉ๋๋ค. ๋ฌผ๋ก ํ๋ผ์ด๋ฒ์๋ ์กด์คํ๋, ์๊ฒฉ ์ธก์ ๋ฑ ์ฌ๋ฌ ๊ฐ์ง ๋ฐฉ์์ผ๋ก ๋ชจ๋ธ์ ์ค์ ํ์ฅ์์์ ํ๋์ ์ฐ๊ตฌํ๊ณ ๊ณต์ ํ์ธ์.โ์คํ ์์คโ๋ฅผ ๋น์ ์ด ๊ฐ๋ฅํ๋ค๊ณ ์๊ฐํ๋ ๊ฒ ์ด์์ผ๋ก ์ ๊ทน์ ์ผ๋ก ํ์ฉํ์ธ์
โ์คํโ ๋ฉํธ๋ฆญ์ค - ํ๊ฐ ์ฝ๋, ํ๋กฌํํธ, ์ค์ฝ์ด๋ง ์คํฌ๋ฆฝํธ๋ฅผ ๋ชจ๋ธ๊ณผ ํจ๊ป ๊ณต๊ฐํ์ธ์
โ์คํโ ์๊ฒฉ ์ธก์ - ์กฐ์ง ์ธ๋ถ์ ํํธ๋, ์ฌ์ง์ด๋ ๊ฐ๋ฐ ์ปค๋ฎค๋ํฐ์์ ์ด๊ธฐ๋ถํฐ ํธํฅ์ฑ ๋ฑ์ ์ด์๋ฅผ ์ถ์ ํ๊ณ ๋ชจ๋ํฐ๋งํ ์ ์๋๋ก, ์ต์ํ โํธ์ง๋ ๋ก๊ทธโ ์์ค์ด๋ผ๋ ์ ๊ณตํ๋ ๊ตฌ์กฐ๋ฅผ ๋ง๋์ธ์
โ์คํโ ์ปค๋ฎค๋์ผ์ด์ - ํฌ๋ช ์ฑ์ด ๋ถ์กฑํ ํ๋์ ๊ฑฐ๋ํ ๋ฆฌ๋๋ณด๋ ๋ง๊ณ , ์ฌ๋ฌ ๊ฐ์, ์ ๋ขฐํ ๋งํ ๋ฆฌ๋๋ณด๋๋ฅผ ์ฐพ์์ ๋ชจ๋ํฐ๋งํ๊ณ ํํธ๋์ญ์ ๋ง๋์ธ์
์คํAI๊ฐ ์ด๋ฒ ์ฌํ์ ์ผ๋ง๋ ๋นจ๋ฆฌ, ๊ทธ๋ฆฌ๊ณ ๋ฌด์๋ณด๋ค โ์ ์ ํ๊ฒโ ๋์ํ๋์ง ๋์๋ณด๋ฉด, ์ฐ๋ฆฌ ๋ชจ๋, ๋ง์น ์ต์ ์ AI ๋ชจ๋ธ์ฒ๋ผ, โ์ค์ค๋ก์ ๋ฐ์ ๊ฒฝ๋ก๋ฅผ ๊ณ ์ณ๊ฐ๋ฉด์ (Self-Correct)โ ๋ฏธ๋๋ฅผ ๋ง๋ค์ด๊ฐ ์ ์์ ๊ฑฐ๋ผ๊ณ ๋ฏฟ์ต๋๋ค.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
CoT(Chain of Thought), ๋งค๋ ฅ์ ์ธ ์์ด๋์ด์ ๊ทธ์ ์ด์ธ๋ฆฌ๋ ๋ฐ์ด๋ ํจ๊ณผ ๋๋ฌธ์ AI ๋ถ์ผ์์ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ๊ธฐ๋ฒ ์ค์ ํ๋๋ก ์๋ฆฌ์ก์์ฃ : ๋ชจ๋ธ์ด โ๋ช ์์ ์ธ ์ค๊ฐ ์ถ๋ก ๋จ๊ณ๋ฅผ ํ์ฉํด์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋๋ก ์ฅ๋ คโํ๋ ๋ฐฉ๋ฒ์ธ๋ฐ์. ๋ง์ ๊ฒฝ์ฐ์, ์๋ CoT ๊ธฐ๋ฒ์ ๊ทธ๋๋ก ์ฐ๊ธฐ๋ณด๋ค๋, ์ด ๊ธฐ๋ฒ์ ๋ค์ํ ๋ฐฉ์์ผ๋ก ์์ ํด์ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ์ธต ๋ ํฅ์์ํค๋ ํ๋ค์ ์ฐพ์๋ด๊ณค ํ์ฃ . ์ค๋์ ์ด๋ฐ ๊ด์ ์์ ์๋ก ๋ฑ์ฅํ ์๋ก์ด CoT ๊ธฐ๋ฒ 10๊ฐ์ง์ ๋ํด ์์๋ด ๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
๊ตฌ๊ธ ๋ฅ๋ง์ธ๋์ Nikolay Savinov์ ํจ๊ปํ๋ ์ ํ๋ธ, Deep Dive Into Long Context
์งํ์ Logan Kilpatrick๊ณผ Nikolay Savinov๊ฐ ํจ๊ป, ์๋ฐฑ๋ง ํ ํฐ ๋จ์๋ก ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ํ์ฅํ๋ ๊ธฐ๋ฒ, ์ต๊ทผ์ ํ์ง ๊ฐ์ ์ ๋ํ ์๊ฐ, RAG vs. Long-Context ๋น๊ต ๋ฐ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ์ด ๋ถ์ผ์ ๋ฏธ๋์ ๋ํด ๋ ผ์ํฉ๋๋ค.
Nathan Lambert์ ๊ธ์ธ๋ฐ์. ์ฃผ์ ํ๋ ์ด๋๋ค ๊ฐ์ ๊ธฐ์ ์ ๊ฒฝ์, ๊ทธ๋ฆฌ๊ณ ์ฐ์ ์ ์ธ ์๋ฐ ๋ฑ์ผ๋ก ์ธํด์ AI ์ฐ๊ตฌ๊ฐ ๊ฐ์ํ๋๊ณ ์์ง๋ง, ์ด ๊ฒฝ๋ก๋ฅผ ํตํด์ AGI๊น์ง ๋๋ฌํ๊ธฐ์๋, ์ฐ๊ตฌ์ ๋ณต์ก์ฑ, ์์์ ๋ถ๋ฐฐ, ์ค์ ์ ์ธ ์ ์ฉ์ ๋์ ๋ฑ ๋๋ฌธ์ ์์ ๋งํ๋ โ์ง๋ฅ์ ํญ๋ฐโ์ ๋จ๊ธฐ๊ฐ ๋ด์๋ ์ผ์ด๋์ง ์์ ๊ฑฐ๋ผ๊ณ ์์ธกํ๊ณ ์์ต๋๋ค.
When ChatGPT Broke an Entire Field: An Oral History by Quanta Magazine
์ด ๊ธฐ์ฌ์์๋, ์์ฐ์ด ์ฒ๋ฆฌ(NLP) ๋ถ์ผ์ ์ฐ๊ตฌ์๋ค์ด ChatGPT ๊ฐ์ ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ๋ฑ์ฅ ์ดํ์ ๊ฒช๊ฒ ๋ ๊ธ๊ฒฉํ ๋ณํ์ ์ถฉ๊ฒฉ์ ๋ํด ์ด์ผ๊ธฐํ๊ณ ์๋๋ฐ์. 19๋ช ์ ํ์ง ๋ฐ ์ ์ง NLP ์ฐ๊ตฌ์๋ค๊ณผ ์ธํฐ๋ทฐ๋ฅผ ํด์, ์ด ์ฌ๋๋ค์ด ๋ชจ๋ธ์ ๊ธ๊ฒฉํ ์ฑ๋ฅ ํฅ์, ์ฐ๊ตฌ ๋ฐฉํฅ์ ๋ณํ, ๊ทธ๋ฆฌ๊ณ ๊ทธ ๊ณผ์ ์์ ๊ธฐ์กด ์ฐ๊ตฌ๊ฐ ๋ฌด์ฉ์ง๋ฌผ์ด ๋๋ ๊ณผ์ ๋ฑ์ ํตํด์ ๋๋ ๊ฒ๋ค์ ๋ํด์ ์ด์ผ๊ธฐํฉ๋๋ค.
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
๊ธ์ฃผ ์ ๊ณ ๋ํฅ์ ๋ค์ ์คํํธ์ , ๋น ํ ํฌ ๋ฑ์ ํฌํจํ๋ ๋ค์ํ ์์ญ์ ๋ด์ค์ ๋๋ค:
๋ฉํ์ ์ ๋ฅด์ฟค, ๊ฒฐ๋ณ ์์?
์์ ํ ๋๋์ผ ๋ฟ์ด์์. ๊ทธ๋ฐ๋ฐ, ์ด์ฉ๋ฉด ๋ง์ด์ฃ , ๊ณง ์ ๋ฅด์ฟค์ด ๋ฉํ์์ โ์๋ก ์๋งํ๊ฒ ํฉ์ํ๊ณ ๋น ์ด๋น ์ดํ๊ธฐ๋ก ํ๋คโ๋ ์์์ ๋ค์ด๋ ๋๋ผ์ง๋ ์์ ๊ฒ ๊ฐ์ต๋๋ค. ๋งํฌ ์ ์ปค๋ฒ๊ทธ๊ฐ Llama 4 ์๋ ํฌ์ด๋ฅผ ํ๋ฉด์ ๋์ ๋ฒ์ฉ ์์ ๋ฒ์ฉํ๋ ๋์, ์ ๋ฅด์ฟค์ ์ ๋ํ ์กฐ์ฉํ ๊ฒ ๊ฐ๋ค์ - ์ด ์ค์ํ ์ ๋ฐ์ดํธ์ ๋ํด์๋ ๊ฑฐ์ ํฌ์คํ , ๋ฆฌํฌ์คํ ๋ ํ์ง ์๊ตฌ์ (๋ฌผ๋ก ๋ฉํ ์ฑ์ ๋ํ ๋งํฌ ์ ์ปค๋ฒ๊ทธ์ ๋ฆด์ค๋ ๋ฆฌํฌ์คํธํ์ต๋๋ค)
๋ฉํ์ FAIR - ๊ธฐ์ด AI ์ฐ๊ตฌ ๋ฉ์ด์ฃ - ๋ฅผ ์ด๋๋ Joelle Pineau๊ฐ 2025๋ 4์์ ํด์ฌํ์ต๋๋ค. ๊ฒ๋ค๊ฐ, ๋งํฌ ์ ์ปค๋ฒ๊ทธ์ ์ ๋ฅด์ฟค ๊ฐ์ ๋ฏธ๊ตญ ๋ํต๋ น์ธ ๋๋๋ ํธ๋ผํ๋ฅผ ๋ํ๊ณ ์ด์ผ๊ธฐํ๋ ๋ฐฉ์์ ์์ฒญ๋ ์ฐจ์ด๊ฐ ์๊ฒจ๋ฒ๋ ธ์ฃ .
ํ์คํ๊ฒ ๋๊ตฌํํ ์ด์ผ๊ธฐ๋ฅผ ๋ค์ ๊ฑด ์๋ ์ - ๊ทธ๋ฅ โWeak Signalโ๋ค์ด ์์ด๊ณ ์๋ ๊ฒ ๋ฟ์ด์ฃ . ํ์ง๋ง, ๋ฒ ํ ์ ํ๋ค๋ฉด, ์ ๊ณง ์ ๋ฅด์ฟค์ด ๋ฉํ๋ฅผ ๋ ๋๋ค์ ๊ฑธ๊ฒ ์ต๋๋ค.
์ฌ๋ฌ๊ฐ์ง ์ค์ฐ๋กํฝ ์์ + ์ ํ ์ด์ผ๊ธฐ ํ๋
์ค์ฐ๋กํฝ์ ๋๋ก๋๊ฐ ํฐ ์ ๊ทธ๋ ์ด๋๋ฅผ ํ์ต๋๋ค. ์๋ก์ด โIntegrationsโ ๊ธฐ๋ฅ์ ๊ธฐ๋ฐ์ผ๋ก, ๋๋ก๋๊ฐ ์ด์ Jira, Asana, Zapier, Intercom ๊ฐ์ ์ธ๋ถ ๋๊ตฌ์ โ์ง์ โ ์ฐ๊ฒฐํ ์ ์์ต๋๋ค. ๋๊ตฌ๋, ๋๋ก๋์ Advanced Research ๋ชจ๋๋ ์ด์ ์น, ๊ตฌ๊ธ ์ํฌ์คํ์ด์ค, ๊ทธ๋ฆฌ๊ณ ๋ค๋ฅธ ์ฐ๊ฒฐ๋ ์ฑ๋ค๋ก๋ถํฐ ์ ๋ณด๋ฅผ ๊ฐ์ ธ์์, ๊ทธ ๋ด์ฉ์ ์ธ์ฉํ ์ฌ์ธต ๋ณด๊ณ ์๋ฅผ 45๋ถ ์์ ์ ๊ณตํฉ๋๋ค.
์ค์ฐ๋กํฝ์ด AI for Science ํ๋ก๊ทธ๋จ์ ๋ฐ์นญํ์ต๋๋ค. ์ํฅ๋ ฅ์ด ํฐ ํ๋ก์ ํธ์ ์ฐธ์ฌํ๋ ์ฐ๊ตฌ์๋ค, ํนํ ์๋ฌผํ, ๊ทธ๋ฆฌ๊ณ ์๋ช ๊ณผํ ๋ถ์ผ์์ ์ผํ๋ ์ฐ๊ตฌ์๋ค์๊ฒ ๋ฌด๋ฃ๋ก API ํฌ๋ ๋ง์ ์ ๊ณตํ๋ค๊ณ ํ๋ค์.
๋๋ก๋๋ฅผ ๊ตญํ๋ก? ์ค์ฐ๋กํฝ์ ๋ฏธ๊ตญ ์ ๋ถ์ Diffusion Rule์ ์ง์งํ๋ฉด์ AI ์นฉ ์ฐ์ ์์ ๋ฏธ๊ตญ์ ๊ตญ๊ฐ์ ์ฐ์๋ฅผ ์ ์งํ๊ธฐ ์ํด์ ๋ ๊ฐ๋ ฅํ๊ฒ ์์ถ ํต์ ๋ฅผ ํด์ผ ํ๋ค๋ ์ ์ฅ์ ์นํธํ๊ณ ์์ต๋๋ค. ์ด ๋ฉ๋ชจ๋ฅผ ๋ณด๋ฉด, Loophole์ ๊ผญ๊ผญ ๋ง๊ณ , ๊ฐ๋ ฅํ๊ฒ ์ ์ฑ ์ ์งํํ๊ณ , ์ค๊ตญ์ DeepSeek ๊ฐ์ ๊ฒฝ์์๋ค์๊ฒ AI ์นฉ์ด ํ๋ฌ๋ค์ด๊ฐ์ง ์๋๋ก ๋ฐฉ์งํด์ผ ํ๋ค๊ณ ์๊ตฌํ๊ณ ์์ต๋๋ค. ์์์ ๋ฐ๋ฅด๋ฉด, ํ ๋ฐ์์ ์๋ GPU๋ฅผ ๋ฐ๋ท๊ฐ์ฌ์ ํจ๊ป ํฌ์ฅํ๋ค๊ณ ๋ ํ๋๋ฐ์. ์๋น๋์์ ์ ์จ ํฉ์ ๋ โ์ค์ฐ๋กํฝ์ด ์ข ๊ณผ์ฅ๋๊ฒ ์ด์ผ๊ธฐ๋ฅผ ํ๊ณ ์๋คโ๊ณ ํ๊ธฐ๋ ํฉ๋๋ค.
์ ํ์ด ์ค์ฐ๋กํฝ๊ณผ ํจ๊ป, Claude Sonnet ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก โ๋ฐ์ด๋ธ-์ฝ๋ฉโ ํ๋ซํผ์ ๊ตฌ์ถํ๊ณ ์๋ค๊ณ ํ๋๋ฐ์. ์ผ๋จ์ ๋ด๋ถ์ฉ์ผ๋ก ์์ํ์ง๋ง, ์จ๋ํํฐ ๊ฐ๋ฐ์๋ค์๊ฒ ์ ๊ณต๋ ์๋ ์๊ฒ ์ฃ . ๋ญ ํ์ค์ ์ผ๋ก ์ ํ์ AI ๋ชจ๋ธ๊ณผ ๊ด๋ จํด์ ์ธ๋ถ์ ๋์์ด ์ ์คํ๊ธฐ๋ ํ๊ฐ ๋ด ๋๋ค.
ํ๊น ํ์ด์ค์ LeRobot ํด์ปคํค
6์ ์ค์, ํ๊น ํ์ด์ค๊ฐ LeRobot ํ๋ซํผ ๊ธฐ๋ฐ์ผ๋ก ํด์ปคํค์ ํ๋ค์. ์์ด๋์ด๊ฐ ์์ผ์ ๋ถ์ ํ ๋ฒ ํจ๊ป ์ฆ๊ธด๋ค๋ ๋ง์์ผ๋ก ์ฐธ๊ฐํด ๋ณด์๋ฉด ์ด๋จ๊น์? ๋นจ๋๋ฅผ ํ๋ ๋ก๋ด์ด๋ , ์๊ธฐ์ธ์ฒ๊ธฐ์ ๊ทธ๋ฆ ๋ฃ์ด์ฃผ๋ ๋ก๋ด์ด๋ ๋ง์ด์ฃ .
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
๊ธ์ฃผ๋ ์ ๋ํ ์ฃผ๋ชฉํ ๋งํ ๋ ผ๋ฌธ๋ค์ด ๋ง๋ค์โฆ์ด๋ ๊ฒ๋ ๋ง์ ์ผ์ธ๊ฐ? ^.^;
2 Olmo 2 Furious from AI2 โ 4T ํ ํฐ์ผ๋ก ์ฌ์ ํ์ต์ ํ๊ณ , 50B ๊ท๋ชจ์ ํ๋ ์ด์ ์ ํตํ ํผํฉ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด์ ์ค๊ฐ ํ์ต์ ๊ฑฐ์น 1.48B ํ๋ผ๋ฏธํฐ ์ฌ์ด์ฆ์ ์์ด ์ธ์ด ๋ชจ๋ธ๋ก, GSM8K์ MMLU ๋ฑ์ ์ถ๋ก ๋ฒค์น๋งํฌ์์ Llama 3.1 1B์ Gemma 3 1B๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
Two Phi-4 models from Microsoft (reasoning and mini-reasoning) โ 140๋ง ๊ฐ์ ์์ธํ ์ถ๋ก ๊ณผ์ ๋ฐ ์ถ๋ก ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฐํํ์ต์ ํ์ฉํด์ ํ๋ จํ 14B ์ฌ์ด์ฆ์ LLM์ผ๋ก, ์ํ ๋ฐ ๊ณต๊ฐ ๊ณผ์ ์ ๋ํ ์ฑ๋ฅ์ ํฅ์์์ผฐ๊ณ , 40-50๋ฐฐ ๋ ์ฌ์ด์ฆ๊ฐ ํฐ ๋ชจ๋ธ๊ณผ ๊ฒฝ์ํ ๋งํ ๋ชจ๋ธ์ ๋๋ค.
Llama-Nemotron from Meta and NVIDIA โ FP8 ์ถ๋ก (Inference)๊ณผ ๋ค์ด๋๋ฏนํ ์ถ๋ก (Reasoning) ํ ๊ธ ๊ธฐ๋ฒ์ ์ฌ์ฉํด์, ์๋ ๋ฐ ์ ํ๋ ์ธก๋ฉด์์ DeepSeek-R1์ ๋ฅ๊ฐํ๋ โ์ถ๋ก ์ ์ต์ ํโ๋ ์คํ์์ค LLM ์ ํ๊ตฐ์ ๋๋ค. 8B๋ถํฐ 253B๊น์ง ๋ค์ํ ์ฌ์ด์ฆ๊ฐ ์์ต๋๋ค.
DeepSeek-Prover-V2๋ ํ์์ (Formal) Theorem Prover๋ฅผ ํ์ธต ๋ ๋ฐ์ ์ํจ ๋ชจ๋ธ๋ก, ์ฌ๊ท์ (Recursive)์ผ๋ก ํ์ ๋ชฉํ๋ฅผ ๋ถํดํ๊ณ ๊ฐํํ์ต์ผ๋ก ํ๋ จํ 671B ์ฌ์ด์ฆ์ ๋ชจ๋ธ์ ๋๋ค. MiniF2F์์ ์ต๊ณ ์์ค์ ์ ์๋ฅผ ๋ฌ์ฑํ๋ค๊ณ ํ๋ค์.
Amazon Nova Premier โ ํ ์คํธ, ์ด๋ฏธ์ง, ๋น๋์ค ๋ฑ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ์ ๊ฑธ์ณ์ 100๋ง ํ ํฐ ์ปจํ ์คํธ๋ฅผ ์ง์ํ๋ ๋ฉํฐ๋ชจ๋ฌ LLM์ผ๋ก, ๊ฐ๋ ฅํ ์ถ๋ก ์ฑ๋ฅ์ ๋ณด์ผ ๋ฟ ์๋๋ผ ์ฆ๋ฅ ๊ธฐ๋ฒ์ ์ฌ์ฉํ ๋์ โ๊ต์ฌ ๋ชจ๋ธโ๋ก ํ์ฉํ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค.
Granite 4.0 Tiny Preview from IBM โ Mamba-Transformer๋ฅผ ํผํฉํด์ ์ฌ์ฉํ๋ 7B ์ฌ์ด์ฆ์ ํ์ด๋ธ๋ฆฌ๋ MoE ๋ชจ๋ธ๋ก, ํน๋ณํ ์ ์ฝ์ด ์์ด 128K ์ฌ์ด์ฆ์ ์ปจํ ์คํธ๋ฅผ ์ง์ํ๊ณ , ๋จ 1B์ ํ์ฑ ํ๋ผ๋ฏธํฐ๋ก ์ถ๋ก ์ ํจ์จ์ ์ผ๋ก ํ ์ ์๋ค๊ณ ํฉ๋๋ค.
X-Fusion๋ ๊ธฐ์กด์ LLM์ ๋ค์ ํ๋ จ์ํค์ง ์๊ณ ์๋ ์๊ฐ์ ์ธ ์ดํด์ ์์ฑ ๊ธฐ๋ฅ์ ์ถ๊ฐํ๋๋ก ํด ์ฃผ๋ โํ๋ฌ๊ทธ ์ค ํ๋ ์ดโ ์ํคํ ์ฒ์ ๋๋ค.
Alignment ๋ฐ ํ๊ฐ (Evaluation)
๐ Beyond one-size-fits-all๋ ์ฌ๋์ด ํ๊ฐํ ํ๋์ ์ํ๋ก๋ถํฐ ๋ชจ๋ธ๋ณ๋ก ํ๊ฐ๋ฅผ ํ ์ ์๋ ํ๋กฌํํธ๋ฅผ ์์ฑํด์, ์ฌ๋์ ํ๋จ๊ณผ ๋ ์ Align์ ํ ์ ์๋๋ก ํด ์ฃผ๋ ๊ธฐ๋ฒ์ ๋๋ค.
๐ Beyond the last answer๋ ์ค๊ฐ์ ์ถ๋ก ๊ณผ์ ์ ์ฌ์ฉํด์ ์ต์ข ์ ์ธ ๋ต๋ณ์ ์ ํ์ฑ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ์ ๋์ด๋ ํ๊ฐ ์ ๋ต์ ๋๋ค.
๐ Real-world gaps in AI governance research๋ ๊ธฐ์ ์ AI ์ฐ๊ตฌ์๋ค์ด ์, ๊ทธ๋ฆฌ๊ณ ์ด๋ป๊ฒ AI ์์ ์ฑ๊ณผ ๊ด๋ จ๋ ์ฐ๊ตฌ์์ ์ค์ธ๊ณ ํ๊ฒฝ์ AI๊ฐ ๋ฐฐํฌ๋์์ ๋์ ์ํ์ ๊ณผ์ํ๊ฐํ๊ฒ ๋๋์ง ๋ณด์ฌ์ฃผ๋ ์ค์ฆ์ ์ฐ๊ตฌ์ ๋๋ค.
์ถ๋ก (Reasoning) ๋ฐ ํ๋กฌํํ ๊ธฐ๋ฒ
Chain-of-defensive-thought๋ โํด๋ฆฐํโ ์ ๋ ฅ์ ๋ฐ์์ ๋์ ์ฑ๋ฅ์ ์ ํ์ํค์ง ์์ผ๋ฉด์ LLM์ โReference Corruptionโ ๊ณต๊ฒฉ์ผ๋ก๋ถํฐ ๋ฐฉ์ดํ ์ ์๋๋ก ํด ์ฃผ๋ ํ๋กฌํํ ์ ๋ต์ ๋๋ค.
๐ Reinforcement learning for reasoning์ ๊ฒ์ฆํ ์ ์๋ ๋ณด์ ์ ํธ (Reward Signals)๋ฅผ ์ฌ์ฉํด์ LLM์ ์ํ ๋ฌธ์ ํ์ด ์ฑ๋ฅ์ ํฌ๊ฒ ํฅ์์์ผ์ฃผ๋ ์์ท ํ๋ จ ๋ฐฉ๋ฒ์ ๋๋ค.
Softpick์ ๋ถ์์ ํ ํ์ฑํ๋ฅผ ํผํ๋ฉด์๋ ์ฑ๋ฅ์ ํฅ์์์ผ์ฃผ๋, ์ํํธ๋งฅ์ค ํจ์๋ฅผ ๋์ฒดํ ๋งํ โํฌ์ ์ดํ ์ โ ๋ฉ์ปค๋์ฆ์ผ๋ก, ํนํ ์์ํ๋ ๋ชจ๋ธ์์ ํจ๊ณผ์ ์ด๋ผ๊ณ ํฉ๋๋ค.
๋ฉ๋ชจ๋ฆฌ, ์์ด์ ํธ, ์์ฌ๊ฒฐ์
๐ Mem0๋ LLM ์์ด์ ํธ๋ฅผ ์ํ ์ฅ๊ธฐ ๊ธฐ์ต ์์คํ ์ธ๋ฐ, ์ธ์ ๊ฐ์ ๋ํ๋ฅผ ๋๋ ๋ด์ฉ๊ณผ ์ง์์ ์์ถํด์ ์ ์งํ๋ค๊ณ ํฉ๋๋ค.
๐ Self-generated in-context examples๋ ์์ด์ ํธ๊ฐ ์ค์ค๋ก ์คํํ๋ ์ฑ๊ณต์ ์ธ ๊ฒฐ์ ๊ณผ์ ์ ์ ์ฅํ๊ณ ์ฌ์ฌ์ฉํ๋ฉด์ ๊ณ์ํด์ ์๊ฐ ๊ฐ์ ์ ํ๋ ๊ธฐ๋ฒ์ ๋๋ค.
WebThinker๋ LLM์๊ฒ ์์จ์ ์ผ๋ก ์ฐ๊ตฌ๋ฅผ ์คํํ๊ณ ๊ณผํ ์์ญ์ ๋ณด๊ณ ์๋ฅผ ์์ฑํ๋๋ก ๋์์ฃผ๋ ์น ํ์ ๋๊ตฌ๋ฅผ ์ ๊ณตํ๋ ํ๋ ์์์ ๋๋ค.
๊ฒ์ ๋ฐ RAG
UniversalRAG์ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ์ ๊ฑธ์น ๊ฒ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด์ ํ ์คํธ, ์ด๋ฏธ์ง, ๋น๋์ค ์ฝํผ์ค (Corpus) ์ค์์ ๋ค์ด๋๋ฏนํ๊ฒ, ์์์ ์ ํ์ ํ๋๋ก ํ๋ RAG ์์คํ ์ ๋๋ค.
ReasonIR์ ์ถ๋ก ์ ์ค์ ์ ๋ ํฉ์ฑ ๋ฐ์ดํฐ๋ก ํ๋ จ์ํจ ๊ฒ์๊ธฐ๋ก, ์ต์ํ์ ์ปดํจํ ์์์ผ๋ก๋ RAG ์์คํ ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ฒ ํด ์ค๋๋ค.
์ถ์ฒ ๋ฐ ๊ณํ
X-Cross๋ ํจ์จ์ฑ์ ๋ ๋์ด๊ธฐ ์ํด์ โ์ ์ํ ์ฐ๋ ๊ตฌ์กฐ (Adaptive Integration)โ๋ฅผ ์ฑํ, ๋๋ฉ์ธ๋ณ LLM์ ํตํฉํ๋ Cross-Domain ์ถ์ฒ ์์คํ ์ ๋๋ค.
TeLoGraF๋ ์๊ฐ์ ์ธ ๋ ผ๋ฆฌ ์ ์ฝ ์กฐ๊ฑด ํ์์ ๋น ๋ฅด๊ณ ์ ํํ ํ๋ ๊ณํ์ ์์ฑํ๋ ๊ทธ๋ํ ๊ธฐ๋ฐ ํ๋๋์ ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply