- Turing Post Korea
- Posts
- ๐FOD#86: AIแแ ด แแ ตแแ ข, 'แแ ฉแแ ณแซ (Open)' AIแ แ ณแฏ แแ ฑแแ กแซ 'แแ ฆ แแ กแแ ต แแ กแแ ฒ'
๐FOD#86: AIแแ ด แแ ตแแ ข, 'แแ ฉแแ ณแซ (Open)' AIแ แ ณแฏ แแ ฑแแ กแซ 'แแ ฆ แแ กแแ ต แแ กแแ ฒ'
DeepSeek แแ กแแ ฅแซแแ ณแ แ ฉ แแ กแแ ต แแ กแซ แแ ฅแซ แแ ฉแจแแ กแฏแแ ฌแซ 'แแ ฉแแ ณแซแแ ฉแแ ณ AI' แแ ฉแซแแ ขแผ, แแ ณแ แ ตแแ ฉ แแ ฎแ แ ตแแ ก แแ ฏแซแแ กแแ ณแซ 'แแ กแแ ฒแ แ ฉแแ ฎแซ AI แแ ฆแแ กแผ'
โ๋ค ๊ฐ์ง ์์ (Four Freedoms)โ์ ์ญ์ฌ
1941๋ , ์ธ๊ณ๊ฐ ์ 2์ฐจ ์ธ๊ณ๋์ ์ ํฌํ ์์์ ๋ง ๊ทธ๋๋ก โ๋ถํ์ค๋ฅด๊ณ โ ์์ ๋์ฃ . ๋ฏธ๊ตญ์ ๋ํต๋ น์ด์๋ ํ๋ญํด๋ฆฐ D. ๋ฃจ์ฆ๋ฒจํธ๋ ํ ์ฐ์ค์์ โ๋ค ๊ฐ์ง ์์ โ์ ๋ํด์ ์ด์ผ๊ธฐํ์ต๋๋ค:

ํ๋งํด๋ฆฐ ๋ฃจ์ฆ๋ฒจํธ๊ฐ ์ด์ผ๊ธฐํ ๋ค ๊ฐ์ง ์์
์ธ๋ก ์ ์์ (Freedom of Speech)
์ ๋ถ์ ์ ์ฝ์ด๋ ๊ฐ์ญ์์ด ์๊ฒฌ์ ํํํ ์ ์๋ ๊ถ๋ฆฌ์ ์์ ์์ (Freedom of Worship)
๋ฐํด๋ฐ์ง ์๊ณ ์ด๋ค ์ข ๊ต๋ ๋ฏฟ์ ์ ์๊ณ ์ด๋ค ์ข ๊ต๋ ๋ฏฟ์ง ์์ ์ ์๋ ๊ถ๋ฆฌ๊ฒฐํ์ผ๋ก๋ถํฐ์ ์์ (Freedom from Want)
๋ชจ๋ ์ฌ๋์ ์ํ ๊ฒฝ์ ์ ์์ ๊ณผ ์ ์ ํ ์ํ ์์ค๊ณตํฌ๋ก๋ถํฐ์ ์์ (Freedom from Fear)
์ ์๊ณผ ์ต์์ด ์๋ ์ธ์
์ด โ๋ค ๊ฐ์ง ์์ '์ ๋ํ ์ฐ์ค์ ํตํด์, ์ ๋ฏธ๊ตญ์ด ์ 2์ฐจ ์ธ๊ณ๋์ ์ ๊ด์ฌ์ ๊ฐ์ ธ์ผ ํ๋์ง, ์ด๋ค ๊ฐ์น๋ฅผ ์ํด์ ์ธ์์ผ ํ๋์ง, ๊ทธ๋ฆฌ๊ณ ์ ์ ํ์ ์ธ๊ณ๋ ์ด๋ค ๋ชจ์ต์ด์ด์ผ ํ๋์ง์ ๋ํด ์ ์ํ๋๋ฐ, ๋ฏธ๊ตญ์ธ๋ค์๊ฒ๋ ์ ์์ ์๋ฏธ๋ฅผ ์ค๋ช ํ๊ณ , ์ฐธ์ ์ ์ ๋น์ฑ์ ์ค๋ํ๋ ์ค์ํ ์ญํ ์ ํ์ต๋๋ค. ๋์ค์ ์ด โ๋ค ๊ฐ์ง ์์ '๊ฐ UN ์ธ๊ถ์ ์ธ์ ๊ธฐ์ด๊ฐ ๋๊ธฐ๋ ํ๊ตฌ์.
๋ฌผ๋ก ์ด๊ฒ๋ค์ โ๋ฏธ๊ตญ์ ์ธ ๊ฐ์นโ๋ก๋ถํฐ ์ถ๋ฐํ ์์ ์์ง๋ง, ๋ฃจ์ฆ๋ฒจํธ ๋ํต๋ น์ ์ด๋ฐ ๊ถ๋ฆฌ, ์ด๋ฐ ์์ ๊ฐ ์ ์ธ๊ณ ๋ชจ๋ ๊ณณ์ ๋ชจ๋ ์ฌ๋๋ค์๊ฒ ์ํ ๊ฒ์ด๋ผ๊ณ ๋ถ๋ช ํ ํํํ์ต๋๋ค. ์ด๊ฑด โ์ธ๊ฐ ์กด์์ฑ์ ํต์ฌโ์ ๋ณดํธํ๋ ๊ฒ์ด์์ฃ .
โ๋ค ๊ฐ์ง ์์ โ๋ ์๋ฏผ๋ค์๊ฒ ๊ฒฝ์ ์ ์์ ๊ณผ ๊ฐ์ธ์ ์์ ๋ฅผ ๋ชจ๋ ์ ๊ณตํ๊ณ ์ ํ๋ ๋ฃจ์ฆ๋ฒจํธ์ โ๋ด๋ ์ ์ ์โ ๊น์ด ๋ฟ๋ฆฌ๋ฐํ ์์์ต๋๋ค.
๊ทธ๋ฌ๋ถํฐ ์ฝ 45๋ ์ด ํ๋ฅธ ํ, โ์์ ๋ฅผ ๋๋ฌ์ผ ์ธ์โ์ ์ฅ์ โ์ํํธ์จ์ด ์ธ๊ณโ๋ก ์ฎ๊ฒจ๊ฐ์ต๋๋ค. 80๋ ๋ ์ค๋ฐ๊น์ง, โ๊ธฐ์ โ์ ์ต๋ง์ฅ์์ ์ง๊ฐ๋ณด๋ค๋ ๋ ๊ฝ๊ฝ ์ ๊ธด ์ํ์์ต๋๋ค. ๊ธฐ์ ๋ค์ ํ๋ก๊ทธ๋จ์ด ์ด๋ป๊ฒ ์ฌ์ฉ๋๊ณ , ๊ณต์ ๋๊ณ , ์ฌ์ง์ด ๋ค์ฌ๋ค๋ณด๋ ๊ฒ๊น์ง๋ ํต์ ํ๋๊ฒ ๊ธฐ๋ณธ์ด์์ต๋๋ค. MIT์ ํ๋ก๊ทธ๋๋จธ์๋ ๋ฆฌ์ฐจ๋ ์คํจ๋ง์ "๋์ ๋ด๊ฑฐ๋ ์ ์ ๋ค๋ฌผ๋ผ"๋ ์ด ์ํฉ์ด ๋ง์์ ๋ค์ง ์์๊ณ , 1985๋ โ์์ ์ํํธ์จ์ด ์ฌ๋จ (FSF: Free Software Foundation)โ์ ์ค๋ฆฝํ์ต๋๋ค.

๋ฃจ์ฆ๋ฒจํธ์ ๋ํ ๊ฒฝ์๋ฅผ ํํ๋ฉด์, ๋ฆฌ์ฐจ๋ ์คํจ๋ง์ โ์์ ์ํํธ์จ์ด๋ฅผ ์ํ ๋ค ๊ฐ์ง ์์ โ๋ฅผ ์ ์ํ์ต๋๋ค:

Four Freedoms. Image Credit: FSF
์์ 0 - ์ด๋ค ๋ชฉ์ ์ผ๋ก๋ ํ๋ก๊ทธ๋จ์ ์คํํ ์ ์๋ ์์
์์ 1 - ํ๋ก๊ทธ๋จ์ด ์ด๋ป๊ฒ ์๋ํ๋์ง ์ฐ๊ตฌํ๊ณ ์์ ํ ์ ์๋ ์์
์์ 2 - ํ๋ก๊ทธ๋จ์ ๋ณต์ฌ๋ณธ์ ๋ฐฐํฌํ ์ ์๋ ์์
์์ 3 - ์์ ๋ ํ๋ก๊ทธ๋จ ๋ฒ์ ์ ๋ฐฐํฌํ ์ ์๋ ์์
์ด๋ฐ ์คํจ๋ง์ ํ๋์ด ์คํ์์ค ์ด๋์ ๋ํ์ ์ด ๋์ด์ โ๋ฆฌ๋ ์คโ๋ฅผ ํ์์์ผฐ๊ณ , ์ง๊ธ ์๋ฒ์์ ์ค๋งํธํฐ์ ์ด๋ฅด๊ธฐ๊น์ง ๋ชจ๋ ๊ฑธ ์๋์ํค๋ ์๋๋ ฅ์ด ๋์์ฃ - ๋์์, ๋์งํธ ๊ถ๋ฆฌ, ์จ๋ผ์ธ ์์จ์ฑ ๋ฑ์ ๋ํ ๋์๋ ๋ ผ์์ ์์์ ์ด ๋๊ธฐ๋ ํ๊ตฌ์.
์์ ๋ณด๋ค์ํผ, ์์ ์ํํธ์จ์ด ์ฌ๋จ์ด ์ด์ผ๊ธฐํ๋ โ์์ ์ํํธ์จ์ด (Free Software)โ๋ โ๊ฐ๊ฒฉโ - ๋ฌด๋ฃ๋ก ๊ณต๊ฐํ๋ค - ์ ๋ํ ์ด์ผ๊ธฐ๊ฐ ์๋๋ผ ๋ง ๊ทธ๋๋ก โ์์ (Freedom)โ์ ๋ํ ์ด์ผ๊ธฐ์ ๋๋ค.
์คํ์์ค AI, ๊ทธ๋ฆฌ๊ณ โ์คํโ AI๋ฅผ ํฅํ โ๋ค ๊ฐ์ง ์์ โ
์ด์ , ์ฐ๋ฆฌ๋ AI ์๋์ ์ ์์ต๋๋ค. ๊ฑฐ๋ ๊ธฐ์ ๋ค์ ์๋ก์ด ๋์งํธ ์๊ตญ์ ์ด์ ๋ฅผ ์ฅ๊ณ ์๊ณ ์ถ์ดํ์ฃ . ์ง๊ธ์ ๊ตฌ๋๋ผ๋ฉด, AI๋ฅผ ๋๋ฌ์ผ ์๋ก์ด ํํ์ ์ต์์ด ์๊ฒจ๋ ๊ฐ๋ฅ์ฑ๋ ์๊ฒ ์ต๋๋ค - ์ฐ๋ฆฌ๊ฐ ์๋ฌธ์ ์ ๊ธฐํ๊ณ ํ์ธํด ๋ณผ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ, ๋์์ด, ๋๋ ๋ชจ๋ฅด๊ฒ ์ด์ด์ง๋ ๊ฐ์, ์ค๋๋ ํธ๊ฒฌ์ ๊ฐํํ๋ AI ํธํฅ์ฑ ๊ฐ์ ๊ฒ๋ค์ด์.
๊ทธ๋ฐ ์๋ฏธ์์, DeepSeek ์ฌ๊ฑด ๋ฐ๋ก ์ง๊ธ ํ์ฐธ ์ฌ๋๋ค์ ์ ์ ์ค๋ฅด๋ด๋ฆฌ๊ฒ ๋ โ์คํ์์ค AIโ, ๊ทธ๋ฆฌ๊ณ ๋์๊ฐ โ์คํโ AI์ ๋ํ ๋ ผ์์ ๊ณ ๋ฏผ์ ํฐ ์๋ฏธ๊ฐ ์์ต๋๋ค. โ์คํโ AI๋ผ๋ ํํ์์ ๊ตณ์ด โ์คํโ์ด๋ผ๋ ๋จ์ด๋ฅผ ๋ฐ์ดํ๋ก ๋ฌถ์ ๊ฑด, ๋ฏธ๊ตญ์ AI ํ์ฌ โ์คํ AIโ๋ฅผ ์ง์นญํ๋๊ฒ ์๋๋ผ๋ ๊ฑฐ์ฃ . ๊ทธ๋ ์ง๋ง, ์์ด๋ฌ๋ํ๊ฒ๋ โ์ด๋ฆฐ AIโ๋ฅผ ์ํด์ ์ด๋ค ์์ ๊ฐ ํ์ํ ๊น ์๊ฐํ๊ฒ ๋ ๊ฑด ์ ์ํธ๋ง ๋๋ฌธ์ด๊ธฐ๋ ํฉ๋๋ค.
์๋ ๊ทธ๋ฆผ์ ํ ๋ฒ ๋ณด์๋ฉด, ์ค๋ฅธ์ชฝ์ ์์ด์ปด๋น๋ค์ดํฐ์ ํด ๊ทธ๋ ์ด์, ์คํAI์ ์ ์ํธ๋ง, ๊ทธ๋ฆฌ๊ณ ๊ทธ ์์ ํ์ ํฐ์ ์ธ ๋ฅผ ์ ์ ์๋ก ์์์ธ (Aron Schwartz)๊ฐ ๋ณด์ด๋ค์.

Image Credit: Flaming Hydra
์๋ก ์์์ธ ๋ โ์ง์, ๊ทธ๋ฆฌ๊ณ ์ ๋ณด๋ ์์ ๋กญ๊ฒ ๋๊ฐ์์ด ๊ณต์ ๋์ด์ผ ํ๋คโ๋ ๊ฐ๋ ฅํ ๋ฏฟ์์ ๊ฐ์ก๋ ํ๋์ฃผ์ ์ปดํจํฐ ๊ณผํ์๋ก ์ ๋ช ํฉ๋๋ค. RSS ํ์ค์ ๊ฐ๋ฐ์ ๋์๊ณ ํฌ๋ฆฌ์์ดํฐ๋ธ ์ปค๋จผ์ฆ์ ํจ๊ป ์ผํ๋๋ฐ, ์ด ๋ชจ๋ ํ๋์ ์๋๋ ฅ์ ์ ๋ณด, ํนํ ๋ฉ์ธ์์ ๋์ผ๋ก ๋ง๋ค์ด์ง ์ฐ๊ตฌ๋ ๋ชจ๋์๊ฒ ์ํด์ผ ํ๋ค๋ ์ ๋ ์ด์๋ค๊ณ ํด์. 2010๋ , ํ์ ๋ ผ๋ฌธ์ ์ ๋ฃํ๊ฐ ๋ฐ์ ์ ์ ํดํ๋ค๊ณ ํ์ ํ ์๋ก ์์์ธ ๋ MIT ๋คํธ์ํฌ๋ฅผ ํตํด์ JSTOR์์ ์๋ฐฑ๋ง ๊ฑด์ ํ์ ๋ ผ๋ฌธ์ ๋ค์ด๋ก๋ํ์ต๋๋ค. ์๋ก ์ ๋๊ธฐ๊ฐ โ์ ๋ณด๋ ์์ ๋ก์์ผ ํ๋คโ๋ ์์น๊ณผ ์ ๋ ๋๋ฌธ์ด๊ธด ํ์ง๋ง, ๋ฏธ ์ฐ๋ฐฉ ๋น๊ตญ์ ์๋ก ์๊ฒ ์์ญ๋ ๊น์ง ์ง์ญํ์ ๋ฐ์ ์ ์๋ ํ์๋ฅผ ์ ์ฉํ์ต๋๋ค.
๊ฒฐ๊ตญ, ์ด๋ฅผ ๊ฒฌ๋์ง ๋ชปํ๊ณ , 2013๋ 1์ ์ํ๊น๊ฒ๋ ๋ชฉ์จ์ ๋์์ต๋๋ค.
์ด๋ก๋ถํฐ 2๋ ํ์ธ 2015๋ , ์ ์ํธ๋ง์ โ์คํAI (OpenAI)โ๋ผ๋ ์๋ฆ๋ค์ด ์ด๋ฆ์ ๊ฐ์ง ํ์ฌ๋ฅผ ๊ณต๋ ์ค๋ฆฝํ์ต๋๋ค. ์ฒ์์๋, ์คํAI๊ฐ ์๋ก ์์์ธ ๊ฐ ํ๋ โ์ ๋ณด์ ์์ ๋ฅผ ์ํ ํฌ์โ์ ์ด์ด๋ฐ์ ํ ์์ฐ์ค๋ฌ์ด ํ๊ณ์์ฒ๋ผ ๋ณด์๋๋ฐ์. ๊ทธ ์ดํ์ ์ด๋ค ์ผ๋ค์ด ์ผ์ด๋ฌ๋์ง๋ ์ฐ๋ฆฌ ๋ชจ๋ ์ ์๊ณ ์์ฃ - ๋ ์ ์ ์ธ ์ฝ๋, ์ ๊ทผ์ ์ ํ, ์ ๋ฃํ, ์๋ฆฌ ๊ตฌ์กฐ ๋ฑ์ ๋๋ค. ๊ทธ๋ฆฌ๊ณ , ์ต๊ทผ์ ์ ์ํธ๋ง์ โ์ฐ๋ฆฌ๊ฐ ์ญ์ฌ์ ์๋ชป๋ ํธ์ ์ ์๋์ง๋ ๋ชจ๋ฅธ๋คโ๋ ํค์ ์ด์ผ๊ธฐ๋ฅผ ํ๋ค๊ณ ๋ ํ๋๋ฐ์:

Image Credit: AMA at Reddit (๊ทธ๋ฌ๊ณ ๋ณด๋, ๋ ๋ง๋ ์๋ก ์์์ธ ๊ฐ ๊ณต๋ ์ค๋ฆฝ์๋ก ์ฐธ์ฌํ๋ค์)
๊ทธ๋ ์ง๋ง, ๋ญ ์ํฉ์ด ํฌ๊ฒ ๋ฐ๋ ๊ฑด ์์ง์ ์๋ ๊ฒ ๊ฐ์ต๋๋ค: ์ ์ํธ๋ง์ด - ๋๋ ์คํAI๊ฐ - ์์ฌ๋ ๊ณผ๊ฑฐ ํด ์๋ ์ผ์ ๊ฒฝ์์ฌ๊ฐ ๋๊ฐ์ด ํ๋ ๊ฑธ ๊ฐ์ง๊ณ ๋น๋์ ํ๊ณ ์์์์? ๋ฐ๋ก DeepSeek ์ด์ผ๊ธฐ์ ๋๋ค.
2025๋ 1์, DeepSeek์ด ์์ฌ ์ถ๋ก ๋ชจ๋ธ R1์ ์คํ์์ค๋ก - ์ ํํ๋ โ์คํ ์จ์ดํธโ, ์ฆ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๊ณต๊ฐํ๋ ๋ฐฉ์์ผ๋ก - ๊ณต๊ฐํ๋ฉด์ ๋ชจ๋์๊ฒ ์ฌ๋ฌ๊ฐ์ง ์๋ฏธ๋ก ์ถฉ๊ฒฉ์ ์ฃผ์์ฃ . ์ด ๋ชจ๋ธ์ ์ํ, ์ฝ๋ฉ, ์ถ๋ก ๊ณผ์ ์์ ์ ๋ฐ์ ์ผ๋ก ์คํAI์ o1๊ณผ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
์ด ์ํฉ์์ ์คํAI๊ฐ ํ ์ฌ๋ฌ๊ฐ์ง ๋์ ์ค์, ๋ฐ๋ก โ์ค๊ตญ์ AI ์คํํธ์ DeepSeek์ด Distillation ๊ธฐ์ ์ ์ฌ์ฉํด์ ์์ฌ์ ๋ ์ ๋ชจ๋ธ์ ๋ฌด๋จ์ผ๋ก ๋ณต์ ํ๋คโ๊ณ ์ฃผ์ฅํ ๊ฒ ์์์ฃ . ์ด๋ฐ ์คํAI์ ๋น๋(?)์, AI์ ํธ๋ ์ด๋๊ณผ ๊ด๋ จ๋ ์ด์ค ์ฃ๋๋ก ๋น์ถฐ์ง๊ธฐ๊ฐ ์ฝ์ต๋๋ค - ๋นํ๊ฐ๋ค์ โ์คํAI๊ฐ ์ค์ค๋ก๋ ํ๊ฐ์์ด ๋ฐฉ๋ํ ์์ ์น ๋ฐ์ดํฐ๋ก AI ๋ชจ๋ธ์ ํธ๋ ์ด๋ํ์ผ๋ฉด์, ์ด์ ๋ ๊ฒฝ์์ฌ๋ค์ด ์์ฌ์ ๊ฒฐ๊ณผ๋ฌผ์ ์ฌ์ฉํ๋ ๊ฑธ ๋ง์ผ๋ ค๊ณ ํ๋คโ๊ณ ์ง์ ํ๊ธฐ๋ ํฉ๋๋ค.
๋ ๋ค๋ฅธ ๋ฐํฅ์ ์ผ์ผํจ ๋ชฉ์๋ฆฌ๊ฐ ์์ฃ - ๋ฐ๋ก ์ค์ฐ๋กํฝ์ CEO, ๋ค๋ฆฌ์ค ์๋ชจ๋ฐ์ด๊ฐ ์ด ์ผ์ข ์ โ์ ์ธ๋ฌธโ์ธ๋ฐ์. ๊ธฐ๋ณธ์ ์ผ๋ก โ๋ฏธ๊ตญ์ ์นฉ ์์ถ ํต์ ๋ฅผ ๋์ฑ ๊ฐํํด์, ์ค๊ตญ์ โ์ฒจ๋จ AIโ ๊ทธ๋ฃน์์ ๋ฐฐ์ ํด์ผ ํ๋ค๋ ์ฃผ์ฅ์ผ๋ก ์ฝํ๋๋ค.

โ๋ฐ์ง์ ์ ์โ์์ ๋น๋ณด ๋ฐฐ๊ธด์ค์ ๋ฐ์ง์ ๋ํ ์ง์ฐฉ
"It is mine, I tell you. My own. My precious. Yes, my precious."
๊ทธ๋ฌ๋ค๊ฐ ์ด๋ฐ ์๊ฐ์ด ๋ค์์ต๋๋ค: ์ฐ๋ฆฌ๊ฐ โAI์ ๊ด๋ จํด์ ์คํ์์ค์ ๋ํด์ ๋ง์ด ์ด์ผ๊ธฐ๋ฅผ ํ๊ณ ์์ง๋ง, ์ฌ์ค AI ๋งฅ๋ฝ์์์ ์คํ์์ค๋ ์ผ๋ฐ์ ์ธ ์ํํธ์จ์ด์์์ ์คํ์์ค์ ๊ฐ์๊น? ๊ทธ๋ฆฌ๊ณ , ์คํ์์ค๋ผ๋๊ฒ ๊ฐ์ง๋ ์๋ฏธ๊ฐ, ๊ฐ ๋๋ผ์ ์ํ๊ณ๊ฐ ์ฒํ ์ํฉ๊ณผ ์ ์ฅ์ ๋ฐ๋ผ์๋ - ๊ตฌ์ฒด์ ์ผ๋ก๋ - ๋ค๋ฅด์ง ์์๊น?โ ํ๋ ์๊ฐ์ด์.
์ฐ์ , ์ํํธ์จ์ด์์ ์คํ์์ค๋ ๋จ์ํ ์ฝ๋๋ฅผ ๊ณต์ ํ๋ ๊ฒ ์๋์์ด์. ๊ทธ๊ฑด ํ๋์ ์ฒ ํ์ด๊ณ , ๊ธฐ์ ์ด ์ด๋ป๊ฒ ๋ง๋ค์ด์ง๊ณ , ์์ ๋๊ณ , ํต์ ๋๋์ง๋ฅผ ๋ค์ ์ ์ํ โ๋ค ๊ฐ์ง์ ์์ (Four Freedoms)โ์ ๊ธฐ๋ฐ์ ๋ ๊ฑฐ์์ต๋๋ค. ์ด๋ ์๋๋ , ๊ทธ ์๋๋ฅผ ํ์ฑํ๋ ๊ทธ๋ฐ ์ข ๋ฅ์ โ์ง์ ํ ์์ โ๋ ๊ฒฐ๋จ์ฝ ์ฐ์ฐํ ์๊ฒจ๋ ์ ์ด ์์ต๋๋ค - ๊ทธ ์์ ๋ฅผ ์คํํ ๊ธฐ๋ฐ, ๊ตฌ์กฐ, ๊ทธ๋ฆฌ๊ณ ์์ง๊ฐ ํ์ํฉ๋๋ค.
AI๊ฐ ๋ฐ๋ก ์ง๊ธ ๊ทธ๋ฐ ๋ณ๊ณก์ ์ ์๋ ๊ฒ ๊ฐ์ต๋๋ค.
๋จ์ํ ๋ ๋ง์ ์คํ ๋ชจ๋ธ์ด๋ ๋ ๋์ ๋ผ์ด์ผ์ค๊ฐ ํ์ํ ๊ฒ ์๋ ๊ฒ๋๋ค. AI๊ฐ ์ด๋ป๊ฒ ๋ง๋ค์ด์ง๊ณ , ๊ณต์ ๋๊ณ , ๊ด๋ฆฌ๋์ด์ผ ํ๋์ง๋ฅผ ์ ์ํ๋ ์์ฒด์ ์ธ ์ฒ ํ, ํต์ฌ์ ์ธ ์์ ์ ๋ํ ๊ณ ๋ฏผ๊ณผ ๋์๊ฐ ํ์ํ์ฃ . ๋ฐ๋ก, โ๋ค ๊ฐ์ง ์์ โ์ AI ๋ฒ์ ์ ์จ ๋ด๋ ค๊ฐ์ผ ํ๋ ์๊ฐ์ ์ฐ๋ฆฌ ๋ชจ๋ ์ ์๋ ๊ฑธ์ง๋ ๋ชจ๋ฆ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด, ๊ณผ์ฐ โ์คํ, ์ฆ ์์ ๋ก์ด AIโ๋ฅผ ๊ตฌ์ฑํ๋ ๋ค ๊ฐ์ง ์์ ๋ ๋ญ๊น์? ๊ทธ๋ฆฌ๊ณ ์ผ๋ถ์ ๊ฐ๋ ฅํ ๋๊ตฐ๊ฐ์๊ฒ ํ์ด ๋ ์ง์ค๋๊ธฐ ์ ์ ์ด ์์ ๋ฅผ ์ด๋ป๊ฒ ๋ง๋ค๊ณ ์์ทจํด์ผ ํ ๊น์? ์ฐ๋ฆฌ๊ฐ ๋ง๋ฒ์ ๋ฐ์ง์ ์ํฅ๋ ฅ ์๋ ๋ค์ด๊ฐ ๋ฒ๋ฆฐ ๋น๋ณด ๋ฐฐ๊ธด์ค์ฒ๋ผ ๋๊ธฐ ์ ์์.
์ด ๋ ผ์๋ ์ด์ ์ถ๋ฐ์ ์ ์ ์์ ๋ฟ์ ๋๋ค. ์ ํฌ ํ๋ง ํฌ์คํธ์์๋, ์ํํธ์จ์ด์์์ โ๋ค ๊ฐ์ง ์์ โ์ ๋ํ AI ๊ด์ ์ ํด์์ ํด ๋ณด๊ณ , โ์ด๋ฆฐ AI๋ฅผ ์ํ ์ฌ์ฏ ๊ฐ์ง ์์ โ๋ฅผ ๋จผ์ ๊ฒํ ํด ๋ด์ผ ํ๋ค๊ณ ์ ์ํฉ๋๋ค. ํ ๋ฒ ์ด๊ฒ๋ค ์ค์ ์ด๋ค ๊ฒ ์ค์ํ์ง๋ ์๊ฐํด ๋ณด์๊ธฐ ๋ฐ๋๋๋ค.

ํ๋ง ํฌ์คํธ์์ ์ ์ํ๋, โ์ด๋ฆฐ AI๊ฐ ๊ฐ์ถฐ์ผ ํ 6๊ฐ์ง ์์ โ
๋ฃจ์ฆ๋ฒจํธ๊ฐ ์ ํ ์ธ๊ณ๋ฅผ ์ด๋์ด๊ฐ ์์ ๋ฅผ ๋ช ํํ ํํํ๊ณ , ์คํจ๋ง์ด ๋์งํธ ์๋๋ฅผ ์ํด ๊ฐ์ ์ผ์ ํ๋ค๋ฉด, ์ด์ ๋ AI์ ์์ ๋ฅผ ์๊ฐํ๊ณ ์ ์ํ ๋๋ผ๊ณ ๋ง์๋๋ฆฝ๋๋ค.
๋ค์ ๋ง์๋๋ฆฌ์ง๋ง, ์ด๊ฑด ์ถ๋ฐ์ ์ผ ๋ฟ์ ๋๋ค. ์ด๋ค ์๊ฒฌ์ด๋ ์์ผ์๋ค๋ฉด ํ์ํฉ๋๋ค.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
๊ฐ์ฅ ์ต๊ทผ์ ์ฐ๋ฆฌ ๋ชจ๋๊ฐ ๋ชฉ๋ํ, ๊ฐํํ์ต์ ํ์ ๋ณด์ฌ์ค ์ฌ๊ฑด์ผ๋ก, DeepSeek-R1์ ์ถ๋ก ๋ฅ๋ ฅ์ ๋ง๋ค์ด๋ธ ๊ฐํํ์ต ๊ธฐ๋ฒ, GRPO (Group Relative Policy Optimization)๊ฐ ์์ฃ . ์ฌํด ์ฃผ๋ชฉํด์ผ ํ ํต์ฌ AI ๊ธฐ์ ์ค ํ๋๋ก ๋ถ๋ช โ(์๋ก์ด) ๊ฐํํ์ตโ์ด ํฌํจ๋ ์ ๋ฐ์ ์์ ํ ๋ฐ์.
์์ผ๋ก ์ฌ๋์ ๋ง์ด ๋์์ค AI, ๋์๊ฐ ์ฌ๋ ์ค์ฌ์ AI๋ฅผ ๋ง๋๋ ํต์ฌ ๊ธฐ์ ๋ก ์๋ฆฌ์ก์ ๊ฐํํ์ต. ์ค๋์ ์ด ๊ฐํํ์ต์ ๋ ๊น์ด ์ดํดํ๊ณ ํ์ฉํ๋๋ฐ ๋์์ด ๋ ๋ฌด๋ฃ ์์ค๋ค 8๊ฐ๋ฅผ ์ ๋ฆฌํด ๋ดค์ต๋๋ค:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
China Talk์ Kevin Xu ์ธํฐ๋ทฐ
Interconnected์ ์ค๋ฆฝ์ Kevin Xu์ ์ค๊ตญ ์คํ์์ค AI์ ๋ํด์ ํต์ฐฐ๋ ฅ์๋ ์ด์ผ๊ธฐ๋ฅผ ๋๋ China Talk์ ๊ธ์ ๋๋ค. DeepSeek์ โๅผๆบๆ ๆ(์นด์ด์์์นญํ์ด: ์คํ์์ค ์ ์ )โ์ด ์ฃผ๋ํ๋ ๋น ๋ฅด๊ณ ํ๊ตฌ์ ์ธ ํ์ ์ ๋ณด์ฌ์คฌ์ฃ . ์์ง๋์ด๋ค์ ์๊ตฌ์ ๊ธฐ์ ์ ๋ฐ๋ผ์ก๋ ๊ฑธ ๋ชฉํ๋ก ํ์ง๋ง, ํฌ๋ช ์ฑ๊ณผ ๊ตญ๊ฐ ์ด์ต ์ฌ์ด์ ๊ธด์ฅ ๊ด๊ณ๊ฐ ํฅํ์ ์ ์ฑ ๋ฐฉํฅ์ ์ข์ฐํ ์ ์๊ฒ ์ต๋๋ค.๋ ์ค ํ๋ฆฌ๋๋จผ์ด Interconnects์ Nathan Lambert, ๊ทธ๋ฆฌ๊ณ SemiAnalysis์ Dylan Patel๊ณผ ์ฅ์ฅ 5์๊ฐ์ ๊ฑธ์น ์ธํฐ๋ทฐ๋ฅผ ํ๋ค์.
์นด๋ค๊ธฐ๋ฉ๋ก ๋ํ๊ต์์ 2025๋ 4์ ๊ณต์ ์ถํ๋ โML in Productionโ์ด ์จ๋ผ์ธํ์ผ๋ก๋ ๋ฒ์จ ๊ณต๊ฐ๊ฐ ๋์์ต๋๋ค. ์ธ์ ๋ณด๋์ ์ด๊ฑธโฆ ^.^;
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
๋ชฌํธ๋ฆฌ์ฌ ๋ํ๊ต์ ๊ต์์ด์ MILA์ ๋๋ ํฐ์ธ ์์์ ๋ฒค์ง์ค ๊ต์์ 96๋ช ์ ์ ๋ฌธ๊ฐ๋ค์ด ์ฃผ๋ํด์ ๋ง๋ , ์ฒซ ๋ฒ์งธ โ๊ตญ์ AI ์์ ๋ณด๊ณ ์โ๊ฐ ๋ฐ๊ฐ๋์์ต๋๋ค. ์ด ๋ณด๊ณ ์๋, AI๊ฐ ์ฐ๋ฆฌ๊ฐ ํต์ ํ ์ ์๋ ๋ฅ๋ ฅ๋ณด๋ค๋ ๋ ๋น ๋ฅด๊ฒ ๋ฐ์ ํ๊ณ ์๋ค๊ณ ๊ฒฝ๊ณ ํ๊ณ ์๋ค์. ์ฌ์ด๋ฒ ์ํ, ํธํฅ์ฑ, ๋ ธ๋ ์์ฅ ํผ๋ ๋ฑ์ด ํฐ ๋ฌธ์ ๋ก ๋๋๋๋ฉด์, ์ ์ฑ ์ ์์๋ค์ ์ด๋ ค์ด ์ ํ์ ์ง๋ฉดํ๊ณ ์์ต๋๋ค: ์ง๊ธ ๊ท์ ํ ๊ฒ์ธ๊ฐ, ์๋๋ฉด ๋์ค์ ํผ๋์ ๊ฐ์ํ ๊ฒ์ธ๊ฐ. ์ฐ๋ฆฌ์๊ฒ ์ ์ผํ ํฌ๋ง์ ๋ญ๊น์? AI๊ฐ ์์ง ์ธ๊ฐ์ ์์ ์๋ค๋ ๊ฒ ์ ๋โฆ?
์ผ๋ ๋ธ๋ฉ์ค๊ฐ a16z์ ICONIQ์ด ๋ฆฌ๋ํด์ 1์ต 8์ฒ๋ง ๋ฌ๋ฌ ๊ท๋ชจ์ ์๋ฆฌ์ฆ C ํฌ์๋ฅผ ์ ์นํ์ต๋๋ค. ์ผ๋ ๋ธ๋ฉ์ค์ AI ์์ฑ ๊ธฐ์ ์ด ์ข์ ๋ฐ์์ ์ป๊ณ ์๋ ๊ฐ์ด๋ฐ, NEA, WiL, ๋์ด์นํ ๋ ์ฝค ๊ฐ์ ์๋ก์ด ํฌ์์๋ค๊ณผ ํจ๊ป ๊ธ๋ก๋ฒ ํ์ฅ์ ์ค๋นํ๊ณ ์์ต๋๋ค. ํ์คํ AI๊ฐ ์ฃผ๋ํ๋ ์ธ์์์, ์กฐ์ฉํ ์์ผ๋ฉด ์๋์ ์ผ๋ก ๋ค์ณ์ง๊ฒ ๋๋ ๋ด ๋๋ค.
์คํAI, ๊ณ ์๋ฅผ ๋ฆ์ถ์ง ์๊ณ ๋ฐ๊ฒฉ์ ๋์๋ค
์คํAI๊ฐ ์ฐจ์ธ๋ AI ์์ด์ ํธ ๊ธฐ์ ์ ์ ๋ํ๋ฉด์ ์๋ก์ด ๊ธฐ์ โ๋ฅ ๋ฆฌ์์น (Deep Research)โ๋ฅผ ๋์ฟ์์ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด์ AI ๋ชจ๋ธ์ ๋ฐ์ด๋์ด์ ๋ ์ ๊ตํ๊ฒ ์ ๋ณด๋ฅผ ์์งํ๊ณ ๋ถ์ํ๋ค๊ณ ํฉ๋๋ค. ํนํ ๋ค๋จ๊ณ์ ์น ๊ฒ์์ ์ํํด์ ์ ๋ณด๋ฅผ ์์งํ๊ณ , ์ด๋ฅผ ์ข ํฉ์ ์ผ๋ก ๋ถ์ํด์ ๋ ผ๋ฆฌ์ ์ธ ๊ฒฐ๋ก ์ ๋์ถํ๊ณ , ์ ๋ฌธ๊ฐ ์์ค์ ๋ฆฌํฌํธ๋ฅผ ๋ง๋ญ๋๋ค. 5๋ถ์์ ์ต๋ 30๋ถ๊น์ง, ์๊ฐ ์ ์ฝ์ด ์์ด ๋ฆฌ์์น๋ฅผ ์ํํ๋ ๋ชจ๋ธ์ธ๋ฐ, ์ฑGPT ํ๋ก ์ฌ์ฉ์๋ค์๊ฒ ์คํ๋์ด ์๋ค๊ณ ํ๋ค์. ๊ทธ๋ฐ๋ฐ ๊ตฌ๊ธ์ด ๋ด๋์ ์๋น์ค์ ์ด๋ฆ์ด ๊ฐ๋ค์?
U.S. National Laboratories์์ ํํธ๋์ญ์ ํตํด์, ์คํAI๋ AI๋ฅผ ์ด์ฉํ ์ฒญ์ ์๋์ง, ์ฌ์ด๋ฒ ๋ณด์, ํต ์์ ์์ญ์์์ ํ์ ์ ๋๋ผ์ด๋ธํ๋ค๊ณ ํฉ๋๋ค.
์์ ํ์ ๊ธฐ๋ฐ์ ๋ Madrona Venture Group์ด ์ฐจ์ธ๋ ์ฐฝ์ ์๋ค๊ณผ AI ์ดํ๋ฆฌ์ผ์ด์ ์ ํฌ์ํ๊ธฐ ์ํ 7์ต 7์ฒ๋ง ๋ฌ๋ฌ ํ๋ฉ์ ๋ง์น๋ฉด์ ์ค๋ฆฝ 30์ฃผ๋ ์ ๊ทผ์ฌํ๊ฒ ์ถํํ๊ฒ ๋์์ต๋๋ค. ๋์์ง ์์ (^.^) ์์ผ ์ ๋ฌผ์ด๋ค์.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
๊ธ์ฃผ๋ โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
Qwen2.5-Max from Alibaba๋ 20์กฐ ๊ฐ์ ํ ํฐ์ผ๋ก ์ ๋ฌธ๊ฐ ํผํฉ(Mixture-of-Experts) ๋ชจ๋ธ์ ํ๋ จ์์ผ์, ๋์ ์ถ๋ก ๋ฅ๋ ฅ๊ณผ ๋ฐ์ด๋ ๋ฒค์น๋งํฌ ์ฑ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค. ์ดํ๋ก์ ๊ฐ์ ์ ๊ฐํํ์ต, ๊ทธ๋ฆฌ๊ณ ์ง๋ฅ์ ํ์ฅ, ์ผ๋ฐํ์ ์ด์ ์ ๋ง์ถ๋ค๊ณ ํฉ๋๋ค.
Baichuan-Omni-1.5, technical report์์๋ ํ ์คํธ, ์ค๋์ค, ๋น์ ์ ํตํฉํ๋ ์ ๋ฐฉ์์ ์ธ Omni-Modal ๋ชจ๋ธ์ ์์ธํ ์๊ฐํ๋๋ฐ, ์ค์๊ฐ ์ด์ค์ธ์ด ์์ฑ ์์คํ ์ผ๋ก ์ค์ํ ๋ฉํฐ๋ชจ๋ฌ ๋ฒค์น๋งํฌ๋ค์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
OpenAI o3-mini๋ STEM ์์ญ์ ๊ณผ์ ์ ์ต์ ํ๋, ๋น์ฉ ํจ์จ์ ์ธ ์ถ๋ก ๋ชจ๋ธ์ ๋๋ค. ๊ฐ์ธ์ ์ผ๋ก ์ฌ์ฉํ ๋ ๊ตฌ๊ธ์ Gemini Deep Research๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๊ณ ํฉ๋๋ค.
Mistral Small 3์ 240์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ๋ชจ๋ธ๋ก, ๋น ๋ฅธ ์ถ๋ก ์๋์ ์ค์ ์ ๋์ด์ 3๋ฐฐ ๋ ๋น ๋ฅธ ์๋๋ก ์คํ๋๊ณ , ๋ก์ปฌ์ ๋ฐฐํฌ๋ฅผ ์ง์ํ๋ฉด์ ๋ ํฐ ๋ชจ๋ธ๋ค๊ณผ ๊ฒฌ์ค ๋งํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
Ai2โs Tรผlu 3 405B๋ RLVR (Reinforcement Learning from Verifiable Rewards; ๊ฒ์ฆ ๊ฐ๋ฅํ ๋ณด์์ ํตํ ๊ฐํํ์ต)์ ํ์ฉํ ๋ชจ๋ธ๋ก DeepSeek V3์ GPT-4๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋๋ฐ, ์ปดํจํ ์์์ ํ๊ณ๊ฐ ์๋๋ผ๋ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋์ด๋ ๋ฐฉํฅ์ ์ฐ๊ตฌ์ ๋๋ค.
๊ฐํํ์ต ๋ฐ ์ผ๋ฐํ (Generalization) ๊ด๋ จ ์ฐ๊ตฌ
๐ Towards General-Purpose Model-Free Reinforcement Learning์ ๋ชจ๋ธ์ด ํ์ ์๋ ๊ฐํํ์ต ์๊ณ ๋ฆฌ์ฆ์ธ MR.Q๋ฅผ ๊ฐ๋ฐํ์ต๋๋ค. ํ๊ฒฝ๋ณ๋ก ์กฐ์ ์ ํ์ง ์๋๋ผ๋ ๋ค์ํ ์์ ์์ ์ผ๋ฐํ๊ฐ ๊ฐ๋ฅํ๊ณ , ์ฐ์ ์ ์ด (Continuous Control)๋ผ๋ ๊ฐ ์ํ๋ฆฌ ๊ฒ์์์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐํ ๋ฟ ์๋๋ผ ์ํ ํจ์จ์ฑ์ ๊ฐ์ ํ์ต๋๋ค.
RL + Transformer = A General-Purpose Problem Solver๋ ์ฌ์ ํ๋ จ๋ LLaMA 3.1 ํธ๋์คํฌ๋จธ๋ฅผ ๊ฐํํ์ต์ผ๋ก ํ์ธํ๋ํด์ โIn-Context RLโ์ ๊ฐ๋ฅํ๊ฒ ํด ์ฃผ์์ต๋๋ค. ์ด์ ๋ชจ๋ธ๋ค์ ์ฌํ๋ จ์ ํ์ง ์๊ณ ๋ ๊ธฐ์กด์ ๊ธฐ์ ๋ค์ ์กฐํฉํ๊ณ ๋ค์ด๋๋ฏนํ๊ฒ ์ ์ํ๋ฉด์ ์๋ก์ด ๋ฌธ์ ๋ค์ ํด๊ฒฐํ ์ ์๊ฒ ๋์์ต๋๋ค.
ํ์ธํ๋ vs. ๊ฐํํ์ต
Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate๋ ์ง๋ํ์ต ํ์ธํ๋(SFT)์ ๋์์ผ๋ก CFT(Critique Fine-Tuning)์ ์ ์ํฉ๋๋ค. ์ด ๊ธฐ๋ฒ์ ๋ชจ๋ธ์ด ์๋ต์ ๋จ์ํ ๋ชจ๋ฐฉํ๋ ๋์ ์ค๋ฅ๋ฅผ ๋นํํ๋๋ก ํ๋ จ์์ผ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์์ผ ์ค๋ค๊ณ ํฉ๋๋ค.
๐ SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training์ LLM์ ์ฌํ ํ๋ จ์์ ์ง๋ํ์ต ํ์ธํ๋(SFT)๊ณผ ๊ฐํํ์ต(RL)์ ๋น๊ตํ๋๋ฐ์. ๊ฐํํ์ต์ด OOD (Out-of-Distribution) ์ผ๋ฐํ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ฐ๋ฉด์, ์ง๋ํ์ต ๋ฐฉ์์ ์ฃผ๋ก ๋ฐ์ดํฐ๋ฅผ ์๊ธฐํ๋๋ฐ ๊ทธ์น๋ ๊ฑธ๋ก ๋ํ๋ฌ๋ค์. ๋, ๊ฐํํ์ต์ ์๊ฐ์ ์ธ์ ๋ฅ๋ ฅ๋ ํฅ์์์ผ์ฃผ๋ ๊ฑธ๋ก ๋ณด์ด๋ค์. (Quoc V. Le์ Sergey Levine์ด ์ ์๋ก ์ฐธ์ฌํ์ต๋๋ค.)
์คํAI์ o-์๋ฆฌ์ฆ ๋ชจ๋ธ: ๊ทธ ๋ฅ๋ ฅ๊ณผ ์์ ์ด์
๐ O3-mini vs DeepSeek-R1: Which One is Safer?๋ O3-mini์ DeepSeek-R1์ ์์ ์ฑ์ ํ๊ฐํ๋๋ฐ, O3-mini๊ฐ ํนํ ๊ธ์ต ๋ฒ์ฃ์ ํ ๋ฌ ๊ด๋ จ ํ๋กฌํํธ์์ ์ ํดํ ์๋ต๋ฅ ์ด ํ์ ํ ๋ฎ์ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค.
Early External Safety Testing of OpenAIโs O3-mini: Insights from Pre-deployment Evaluation์์ O3-mini์ ์์ ๋ฉ์ปค๋์ฆ์ ํ๊ฐํ ๊ฒฐ๊ณผ, ์ด์ ์ ์คํAI ๋ชจ๋ธ๋ค๋ณด๋ค ๊ฐ์ ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ง๋ง, ๋ ผ๋์ด ๋๋ ์ฃผ์ , ๋ฒ์ฃ, ํ ๋ฌ ๊ด๋ จ ์ง์์์ ์ทจ์ฝ์ ์ด ๋ฐ๊ฒฌ๋์๋ค๊ณ ํฉ๋๋ค.
On the Underthinking of o1-Like LLMs finds that o1-like LLMs๋ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋๋ฌด ๋นจ๋ฆฌ ํฌ๊ธฐํด์ ๋ฌธ์ ํด๊ฒฐ์ด ํจ์จ์ ์ผ๋ก ๋์ง ์๋ ํ์์ ๋ฐ๊ฒฌํ๊ณ , ํ์ธํ๋์ ํ์ง ์๊ณ ๋ ์ ํ๋๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํ 'Thought Switching Penalty (์ฌ๊ณ ์ ํ ํ๋ํฐ)'๋ฅผ ์ ์ํฉ๋๋ค.
๐ Large Language Models Think Too Fast to Explore Effectively์์ ๊ฒ์ ํ๊ฒฝ์์ LLM๋ค์ ํ ์คํธํ ๊ฒฐ๊ณผ, ์คํAI์ o1 ๋ชจ๋ธ์ด ํ์ ๋ฉด์์ ์ฌ๋๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ธ ๋ฐ๋ฉด, ๋ค๋ฅธ LLM๋ค์ ๋ถํ์ค์ฑ์ ๋๋ฌด ์ผ์ฐ ์ฒ๋ฆฌํด์ ์คํจํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค๊ณ ํฉ๋๋ค.
๊ฐ๋๋ ์ผ, ๊ทธ๋ฆฌ๊ณ ๊ทธ ํํผ๋ฒ
GuardReasoner: Towards Reasoning-Based LLM Safeguards์์๋GuardReasoner๋ผ๋ ์์ ์ฅ์น๋ฅผ ๊ฐ๋ฐํ์ต๋๋ค. ์ถ๋ก ํ์ธํ๋๊ณผ Hard Sample Optimization ๊ธฐ๋ฒ์ผ๋ก ๋ชจ๋ธ์ ์์ ์ฑ์ ๊ฐ์ ํ๊ณ , F1 ์ ์์์ GPT-4o+CoT์ LLaMA Guard 3๋ฅผ ๋ฅ๊ฐํฉ๋๋ค.
Virus: Harmful Fine-tuning Attack for Large Language Models Bypassing Guardrail Moderation์์๋ โVirusโ๋ผ๋ ์ ๋์ ํ์ธํ๋ ๊ณต๊ฒฉ์ ์๊ฐํฉ๋๋ค. ๊ฐ๋๋ ์ผ ๋ชจ๋๋ ์ด์ ์ ์ฐํํด์ 100%์ ์ ์ถ๋ฅ ์ ๋ฌ์ฑํ๊ณ , LLM ์๋ต์ ์ ํด์ฑ์ ํฌ๊ฒ ์ฆ๊ฐ์ํต๋๋ค.
์๋ก์ด ์ํคํ ์ฒ ๋ฐ ํธ๋ ์ด๋ ํจ๋ฌ๋ค์
๐ Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity๋ ๋ฉํฐ๋ชจ๋ฌ ํ์ต์ ์ํด์ ํฌ์์ฑ(Sparsity)๊ณผ ์ํ ๊ณต๊ฐ ๋ชจ๋ธ (SSM)์ ๊ฒฐํฉํฉ๋๋ค.
ARWKV: Pretrain is not what we need, an RNN-Attention-Based Language Model Born from Transformer๋ ์ปดํจํ ์๊ตฌ์ฌํญ์ ์ค์ด๊ธฐ ์ํด์ ํธ๋์คํฌ๋จธ์ ์ ํ ์ดํ ์ ์ RNN ๊ธฐ๋ฐ ์ ๊ทผ๋ฐฉ์์ผ๋ก ๋์ฒดํฉ๋๋ค.
IFormer: Integrating ConvNet and Transformer for Mobile Application์ ๋ชจ๋ฐ์ผ ๋น์ ๋ชจ๋ธ์ ํจ์จ์ฑ์ ๊ฐ์ ํ๊ธฐ ์ํด์ ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง๊ณผ ํธ๋์คํฌ๋จธ๋ฅผ ํตํฉํฉ๋๋ค.
Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling์์๋ LLM ํ๋ จ์ ํจ์จ์ฑ์ ๊ฐ์ ํ๊ธฐ ์ํด์ ์ดํ ํฌ๊ธฐ๋ฅผ ํ์ฅ, ํ ํฐํ๋ฅผ ์ฌ์ ์ํฉ๋๋ค.
๋ชจ๋ธ ์ค์ผ์ผ๋ง ํจ์จํ ๋ฐ ์ต์ ํ
๐ Sana 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer์์๋ ํ๋ จ ๋น์ฉ์ ์ค์ด๊ณ ํ ์คํธ-์ด๋ฏธ์ง ์์ฑ์ ์ํ ํจ์จ์ ์ธ ํ์ฅ์ ๊ฐ๋ฅํ๊ฒ ํ๋ โ์ ํ ํ์ฐ ํธ๋์คํฌ๋จธโ
๐ s1: Simple test-time scaling์ ์ถ๊ฐ์ ์ธ ํ๋ จ์ ํ์ง ์๊ณ ๋ ์ถ๋ก ํจ์จ์ฑ์ ๊ฐ์ ํ๊ธฐ ์ํ Test-Time Scaling ๊ธฐ๋ฒ์ ์ ์ํฉ๋๋ค.
๐ Streaming DiLoCo with Overlapping Communication: Towards a Distributed Free Lunch์์๋ ๋์ญํญ ์๊ตฌ์ฌํญ์ ์ค์ด๊ณ ๋๊ธฐํ์ ์ฐ์ฐ ์์ ์ ์ค์ฒฉ์์ผ์ ๋ถ์ฐ ํ๋ จ์ ์ต์ ํํฉ๋๋ค.
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply