- Turing Post Korea
- Posts
- ๐FOD#94: แแ ฎแแ ณแฏ, แแ ตแแ ฆ AI แแ ฆแแ ตแทแแ ด แแ ฅแซแแ ฎแ แ ฉ แแ กแแ ฅแแ ก?
๐FOD#94: แแ ฎแแ ณแฏ, แแ ตแแ ฆ AI แแ ฆแแ ตแทแแ ด แแ ฅแซแแ ฎแ แ ฉ แแ กแแ ฅแแ ก?
+ แแ ขแซแแ ณแ แ ฉแแ ตแจแแ ด AI แแ ณแฏแ แ ขแจ แแ กแจแแ ณแ แ ณแฏ แแ งแฏแแ ต แแ ฑแแ กแซ แแ งแซแแ ฎ, แแ ณแ แ ตแแ ฉ แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ
๊ตฌ๊ธ Gemini, ๋๋์ด AI ๊ฒฝ์์์ ์น๊ณ ๋๊ฐ๋
์ฌ๋ฌ๋ถ๋ ๊ตฌ๊ธ์ ์ ํ๋ค ๋ง์ด ์ฌ์ฉํ์์ฃ ? ์ ๋ ๊ทธ๋ ์ต๋๋ค.
์ง๋ฉ์ผ๊ณผ Google Docs๋ ์ ์ผ์๊ณผ ๋ผ๋์๋์ผ ๋ ์๊ฐ ์๋ ์ ํ๋ค์ด์ฃ . ์ ๋ชจ๋ ์ ๋ฌด์ฉ ์ด๋ฉ์ผ ์ด์นด์ดํธ๊ฐ ์ง๋ฉ์ผ๋ก ๋ง๋ค์ด์ ธ ์๊ธฐ๋ ํด์. ์ด ๋๊ตฌ๋ค์, (์ฐ๋ฆฌ๊ฐ ๋ง์ด ์ฌ์ฉํด์ ๊ทธ๋ ๊ธฐ๋ ํ์ง๋ง) ์ง๊ด์ ์ด๊ณ , ๋ฏฟ์ ์ ์๊ณ , ์ค๋ซ๋์ ์ฐ๋ฆฌ๋ค์ ์ผ์์ ์ผ๋ถ๊ฐ ๋์ด ์์ต๋๋ค.
ํ์ง๋ง, AI์ ์์ญ์ผ๋ก ๋ค์ด์์, Gemini ๊ฐ์ ๊ตฌ๊ธ์ ๋ํ AI ๋ชจ๋ธ์ ์ข โ์ ์ ๋ถ์ฌ ๋ณด๋ ค๊ณ โ ํ ๋๋ง๋ค, ๋ญ๊ฐ ์ ์๋ฟ์ง๊ฐ ์์์ด์. ChatGPT, Claude, Midjourney, ๊ฐ๋์ Grok๊น์ง๋ ์ด์ ์ผ์์ ์ผ๋ก, ์์ฐ์ค๋ฝ๊ฒ ์์ด ๊ฐ๋ ๋๊ตฌ๊ฐ ๋์๋ค(?)๊ณ ํ ์ ๋์ธ๋ฐ, ๊ตฌ๊ธ์ AI ์ ํ๋ค์, NotebookLM์ ์ ์ธํ๊ณ ๋ ์ข ๋ฉ๊ฒ ๋๊ปด์ก๋ ๊ฒ ์ฌ์ค์ ๋๋ค. ์ต๊ทผ๊น์ง ๊ตฌ๊ธ ๋ฅ๋ฆฌ์์น๋ฅผ ์ธ ๋ ๊ฝค ํ๊ฐ (Hallucination)๋ ์๋ค๊ณ ๋๋ผ๊ธฐ๋ ํ๊ตฌ์.
๊ทธ๋ฐ๋ฐ ๊ฐ์๊ธฐ, ์ง๋ ์ฃผ๋ถํฐ Gemini 2.5 Pro๊ฐ ํค๋๋ผ์ธ์ ์ฑ์ฐ๊ธฐ ์์ํ์ต๋๋ค: Chatbot Arena์์ ELO ์ค์ฝ์ด๊ฐ 40ํฌ์ธํธ๋ ์์นํ๊ณ , Cursor์ Personal API ํค๋ฅผ ์ ๊ณตํ๋ค๋ ๋ฐํ๋ ์์๊ตฌ์. ์ฃผ๋ณ์ ๋ง์ ์ํํธ์จ์ด ๊ฐ๋ฐ์๋ AI ์์ง๋์ด๋ค์ด Gemini์ Gemma์ ๋ํด ๋ง์ ๊ธ์ ์ ์ธ ์ด์ผ๊ธฐ๋ฅผ ํ๋ ๊ฑธ ๋ฃ๊ธฐ ์์ํ์ด์.
Gemini 2.5 Pro sets SOTA on the aider polyglot leaderboard with a score of 73%.
This is well ahead of thinking/reasoning models. A huge jump from prior Gemini models. The first Gemini model to effectively use efficient diff-like editing formats.
aider.chat/docs/leaderboaโฆ
โ Paul Gauthier (@paulgauthier)
8:53 PM โข Mar 25, 2025
๊ทธ๋ ์ง๋ง, ์์ง ์์ฌ์ ๋์ด๋ฆฌ๋ฅผ ๊ฑฐ๋์ง ์์ ์ฑ, ํ ๋ฒ ์ ํฌ์ ์์ฃผ ์ด์ผ๊ธฐ๋ฅผ ๋๋๋ ์๋์ด ๊ฐ๋ฐ์์ด์ AI ์์ง๋์ด, Will Schenk์๊ฒ โ๊ตฌ๊ธ์ด AI ๊ฒ์์์ ์ฐ์๋ฅผ ๋์ฐพ๊ณ ์๋ค๊ณ ์๊ฐํ๋์ง, ์ ๊ทธ๋ฐ์ง, ๊ณผ์ฐ Gemma๊ฐ ์ง์ง ์ฐ๋ฆฌ ์ผ์์ ์ผ๋ถ๋ก ๋ค์ด์ฌ ๋งํ ์ค๋น๊ฐ ๋๊ณ ์๋์งโ ์๊ฒฌ์ ๋ฌผ์ด๋ดค์ต๋๋ค. ๋ต์ ์ ๋ฆฌํด ๋ณด๋ฉด ์ด๋ ์ต๋๋ค:
โ๊ธฐ์ (ํ ํฌ) ํ์์ ์์ ๋งํ๋ ๋ด๋ฌํฐ๋ธ๊ฐ ์ผ๋ง๋ ๋นจ๋ฆฌ ๋ง๋ค์ด์ง๊ณ ๋ฐ๋๋์ง๋ฅผ ๋ณด๋ฉด ์ฌ๋ฏธ์์ด์. ์ง๊ธ ๊ฐ์ฅ ํํ ์ด์ผ๊ธฐ๊ฐ โ๊ตฌ๊ธ์ด AI์์ ๋ค์ณ์ ธ ์๋คโ๋ ๊ฑฐ์ฃ - ์คํAI, ์ค์ฐ๋กํฝ, ์ฌ์ง์ด๋ ์ ๋์ ์ธ ์คํ์์ค ํ๋ ์ด์ด์กฐ์ฐจ ๊ตฌ๊ธ์ด ๋ฐ๋ผ์ก์ผ๋ ค๊ณ ๋ ธ๋ ฅํด์ผ ํ๋ค๋ ๊ฑฐ์์. ํ์ง๋ง ์ค์ ๋ก ๊ตฌ๊ธ์ AI ๋ชจ๋ธ์ ๋ฉด๋ฐํ๊ฒ ์ดํด๋ณด๊ณ ์ฌ์ฉํด ๋ณด๋ฉด, ๊ทธ๋ฐ ์ด์ผ๊ธฐ๋ ์ ๋ง์ง ์๋๋ค๊ณ ์๊ฐํด์.
์์ง ๋ง์์ผ ํ ๊ฑด, ๊ตฌ๊ธ์ด ๋ฐ๋ก GPT-4๋ถํฐ Claude, ํ๊น ํ์ด์ค๋ฅผ ๋น๋ด๊ณ ์๋ ์คํ์์ค LLM์ ์ด๋ฅด๊ธฐ๊น์ง ์ด ๋ชจ๋ ๊ฒ์ ๋ฐํ์ด ๋๋ ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ๊ฐ ํ์ด๋ ๊ณณ์ด๋ผ๋ ๊ฑฐ์์. ๊ทธ๋ฐ๋ฐ๋ ๋์ค์ ์ธ์์ ๋ฐ๋์์ฃ , ๋ง์น ๊ตฌ๊ธ์ด ํ๋ฐ์ฃผ์๋ก ๋ฐ๋ผ์ก๊ณ ์๋ค๋ ๊ฒ์ฒ๋ผ์.
์๋ง, ๊ทธ ์ด์ ์ค ์ผ๋ถ๋ ์๋ฌด๋๋ ๊ตฌ๊ธ์ด AI ์ ํ์ด๋ ๋๊ตฌ๋ฅผ ์ถ์ํ๊ณ ํฌ์ง์ ๋ํ๋๋ฐ ์์ด์ ๋น์ ์์ ์ด๋ผ๊ณ ํ ๋งํผ ๋ณด์์ ์ด์๊ธฐ ๋๋ฌธ์ด๊ฒ ์ฃ . ์ฌ์ ์ ์ผ๋ก๋ ์ดํด๊ฐ ์ ๋๋ ๊ฒ๋ ์๋๊ตฌ์. ๊ตฌ๊ธ์ด ๋ง๋ ์๋น์์ฉ Gemini ์ฑ์ด ์ฑGPT๋งํผ ๋ง๋ฒ๊ฐ์ ๊ธฐ๋ฅ์ ๋ณด์ฌ์ฃผ๊ฑฐ๋ ๋ฐ์์ด ์ข์ง ์์ ์๋ ์์ด์. ํ์ง๋ง ๋ฐ๋ฅ์ ์๋ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ก ๋ค์ด๊ฐ๋ฉด - ์ฆ, ๋ด ๋จธ์ ์์ Gemma 3๋ฅผ ๋๋ฆฌ๊ฑฐ๋ Gemini 2.5 API๋ฅผ ์ฌ์ฉํด ๋ณด๋ฉด - ์ด์ผ๊ธฐ๊ฐ ๋ฐ๋๋ค๊ณ ์๊ฐํด์.
๊ตฌ๊ธ์ ์ด ๋ชจ๋ธ๋ค์๋, ์ ๋ ๋ฌด์ํ ์ ์๋ โํ์ดํธํ ์ง์ค๋ ฅโ ๊ฐ์๊ฒ ๋๊ปด์ ธ์. ๋ชจ๋ธ ๋ ๋ฒจ์์ ์ฌ์ฉํด ๋ณด๋ฉด, ์ ํ์ ๋ง๋ค ๋ ํ๋ ์์ฌ๊ฒฐ์ , ๊ฐ๋๋ ์ผ, UI ๊ด๋ จ๋ ๊ฒ๋ค์ ๋ค ๋ค์ด๋ธ ์์ํ ์ค์ ์์ง๋์ด๋ง์ ๋ ธ๋ ฅ์ ๋๋ ์ ์์ด์. ๊ทธ๋ฆฌ๊ณ Gemini๋ ๋น ๋ฅด๊ณ , ์ง์งํ๊ณ , ์ ํํ๋ค๊ณ ๋๊ปด์. ๋ง์น ๊ณ ์ฑ๋ฅ ๊ธฐ๊ณ๋ฅผ ์ด์ ํ๋ ๊ฒ ๊ฐ์ด์. ๊ฐ์ธ์ ์ธ ๋๋์ผ ์ ์์ง๋ง, ์ถ๋ ฅ ํ์ง์ Claude๋ GPT-4 ๋น์ทํ ์ง ๋ชฐ๋ผ๋ ์ง์ฐ ์๊ฐ, ํ๊ฐ์ ์์ค, ๋ ๋ง์ ๋จ์ด๋ก ๋ ์ค์ ์ ์ธ ๋ด์ฉ์ ์ ๊ณตํ๋ค๊ณ ๋๊ปด์.
๊ณผ์ฐ ๊ตฌ๊ธ DeepResearch๊ฐ ์ง์ง ํต์ฐฐ๋ ฅ์๋ ์ฐ๊ตฌ ๋ณด๊ณ ์๋ฅผ ๋ง๋ค์ด ์ค๊น์? ๊ทธ๊ฑด ์ ๋ชจ๋ฅด๊ฒ ์ด์. ๊ทธ๋ ์ง๋ง, ๋ญ๊ฐ ๋ด๊ฐ ๋ง๋ค๊ณ ์ถ์ AI ์ ํ์ ๋ฒ ์ด์ค ๋ชจ๋ธ๋ก ๋ญ๊ฐ ์ฌ์ฉํ๊ณ ์ถ๋ค๋ฉด, ์ ๋ ์ธ์ ๋ Gemini๋ Gemma 3์์๋ถํฐ ์์ํ๋ฉด ์ข์ ์ ํ์ด๋ผ๊ณ ๋ด์.
Gemma 3์ ํนํ ์ธ์์ ์ด์์. ์คํ์์ค ๋ชจ๋ธ์ด๊ณ , ํจ์ฌ ๋ ํฐ ๋ชจ๋ธ๋ค๋ ๋ง์ง๋ง, ์๊ธฐ๋ณด๋ค ํจ์ฌ ํฐ ๊ฑฐ์ธ๋ค์๊ฒ ํ ๋ฐฉ ๋ ๋ฆฌ๋ ๋๋์ด๋ผ๊ณ ํ ๊น? ๊ฐ์ ์์ค์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ๋ฉด, ํ๋ คํ ํธ๋ฆญ์ ์ฌ์ฉํ์ง ์๊ณ , ๊ทธ๋ฅ ์ ๋ง ์ด์ ์ ์ธ ์์ง๋์ด๋ง์ ํ, ๋ณธ์ง์ ์ธ ๊ทผ์ก์ง ๋ชจ๋ธ์ด๋ผ๋ ์๊ฐ์ด ๋ค๊ณ , ์ด๋ฐ ์ ๋นํ ์ฌ์ด์ฆ์ ์ ์กฐ์ ๋ ๋ชจ๋ธ๋ค์ด ๋ ํฐ ๋ชจ๋ธ๋ค๋ณด๋ค ๋น ๋ฅด๊ฒ ๋ฏธ๋๋ก ํฅํ๊ณ ์์ง ์๋ ์ถ์ด์.
DeepSeek๊ณผ ๋น๊ตํด ๋ณด์๋ฉด, ๋ฌผ๋ก DeepSeek์ด ์์ฃผ ํ๋ฅญํ ๋ชจ๋ธ์ด์ง๋ง Gemini ์์ฒด์ ๋งค๋ ฅ์ด ์์ด์. ๋๋ํ๋ฐ ์ด์ฌํ ์ผํ๋ ์น๊ตฌ๋ผ๋ ๋๋? Gemini๊ฐ ์ด๋ก ๊ณผ ์ฅ์ธ์ ์ ์ ๊ทผ๊ฑฐ๋ฅผ ๋๊ณ ์๋ค๋ฉด, DeepSeek์ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํด์ ํดํน์ ํ๋ ์น๊ตฌ ๊ฐ์์.
โ๋ฉํฐ๋ชจ๋ฌโ ๋ฅ๋ ฅ๋ ๋นผ๋์ ์ ์์ฃ . Gemini 2.5๋ ๋ชจ๋ธ์ด ํ ์คํธ ๋ฟ๋ง์ด ์๋๋ผ ์ด๋ฏธ์ง, ์ค๋์ค ๋ฑ โ๊ฐ๊ฐ์ โ์ธ ์ธ๊ณ๋ฅผ โ์ดํดโํ๋ค๊ณ ๋๋ผ๋ ์ต์ด์ ๋ชจ๋ธ์ด์์. ๋ชฉ์๋ฆฌ์ ์์์ ๊ฐ์ง๊ณ ์ถ๋ก ํ๊ณ , ์ด๋ฏธ์ง๋ฅผ ์ ํธ์งํด ์ฃผ๊ณ , ๊ทธ๊ฒ๋ ๋น๊ต์ ๋น ๋ฅด๊ณ ๋ช ํํ๊ฒ ์์ ์ ์ฒ๋ฆฌํด์. ๋จ์ํ ๋ด ์์ฒญ์ โ์๋ตโํ๋ค๊ธฐ๋ณด๋ค โ๋ด ํ์๋ฅผ ์ธ์ํ๊ณ ์๋โํ๋ค๋ ๋๋์ด์์. ๊ทธ๋์ ์๋ก์ ๊ตฌ์.
๊ฒฐ๋ก ์ ์ผ๋ก, ์ ๋ ๊ตฌ๊ธ์ด ๋ค์ณ์ ธ ์๋ค๊ณ ์๊ฐํ์ง ์์์. ์กฐ์ฌ์ค๋ฝ๊ฒ ์ ๊ทผํ๋ค๊ณ ์๊ฐํ๋ ์ชฝ์ด์ฃ . ๋ชจ๋ ์ฅ์์ ๊ฑท์ด๋ด๊ณ ๋ณด๋ฉด, ๊ตฌ๊ธ์ ๋ชจ๋ธ์ ์ ๊ฐ ์ฌ์ฉํด ๋ณธ AI ๋ชจ๋ธ๋ค ์ค ๊ฐ์ฅ ์ข์ํ๋ ํธ์ด์์. ๊ตฌ๊ธ์ด ์ ๋ง ๊ฒฝ์์ ํ๊ฒ ๋ค๊ณ ๋ง์๋จน๊ณ ๋ฌ๋ฆฌ๋ ์๊ฐ - ๋ณด์์ ์ธ ์์ธ๋ฅผ ๋ฒ์ด๋์ง๊ณ ๋ง์ด์ฃ - ๋ค๋ฅธ ๋๊ตฌ๋ ๋ฐ๋ผ์ก๊ธฐ ์ด๋ ค์์ง ๊ฑฐ์์.
์ง๋ 4์ 5์ผ ๊ตฌ๊ธ ๋ฅ๋ง์ธ๋์ Jack Rae๊ฐ X์ ํฌ์คํ ํ ๊ฑธ ๋ณด๋ฉด, ๋ค์ํ LLM ๋ชจ๋ธ์ ์ฑ๋ฅ๊ณผ API ๋น์ฉ์ ๋น๊ตํด ๋ณธ ์๋ฃ์์ ๊ตฌ๊ธ์ ๋ชจ๋ธ์ด ๋ชจ๋ ๊ฐ์ฑ๋น๊ฐ ๋์ ๊ฑธ๋ก ๋ํ๋๋ค์.
The pricing for 2.5 Pro is out.
Here is the pareto performance of price : lmsys elo visualized as a rainbow.
โ Jack Rae (@jack_w_rae)
6:19 PM โข Apr 4, 2025
์ ๊ทธ๋ฆผ์์ X์ถ์ โPrice per million tokens (Log scale)โ, Y์ถ์ LMSys Elo ์ค์ฝ์ด, ๋ฌด์ง๊ฐ ์๊น ๊ณก์ ์ โPareto Frontier ๊ณก์ โ์ผ๋ก ํน์ ํ ์ฑ๋ฅ์ ๋ฌ์ฑํด์ผ ํ ๋์ ์ต์ ๊ฐ ๋ชจ๋ธ๋ค์ ์ฐ๊ฒฐํ ๊ฒ๋๋ค.
์กฐ์ฉํ ๋ฌผ๋ฐ์์ ์์ง์ด๋ค๊ฐ, ์ด์ ๋ณธ๊ฒฉ์ ์ผ๋ก, ๊ฒ์ ์์ฅ์ ์ฅ์ ํ๋ ๊ฒ์ฒ๋ผ ๊ฐ์ ๊ธฐ์ ์ฐ์ ์ ๋ต์ผ๋ก ์น๊ณ ๋๊ฐ๊ธฐ ์์ํ๋ ํ๋์ ๋ฐ์ฆ์ผ๊น์?
Will Schenk๊ฐ ๋๋ฆ๋๋ก ์ฌ๋ฌ ์ ๋ ๋ชจ๋ธ๋ค์ด ์ผ๋ง๋ ๊น์ ์ดํด ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์๋์ง ๋น๊ตํด ๋ณธ ๊ฒ๋ ์ฌ๋ฏธ์์ผ๋, ๊ด์ฌ์์ผ์ ๋ถ์ ํ ๋ฒ ๋ณด์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค.
์ค์ฐ๋กํฝ์ด ํ๊ตฌํ๋, ์ธ์ด ๋ชจ๋ธ์ ์ ๊ฒฝ ๊ณผํ
์ค์ฐ๋กํฝ๋งํผ, ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ํ ๊บผํ ํ ๊บผํ ๋ฒ๊ฒจ๋ด๋ฉด์ ์ดํดํ๊ธฐ ์ํ ๋ ธ๋ ฅ์ ๊ณ์ํ๋ ์ฐ๊ตฌ์๋, ๊ฑฐ์ ์์ง ์๋ ์ถ์ด์. 2024๋ 5์๋ถํฐ ์ค์ฐ๋กํฝ์ โInterpretability (ํด์ ๊ฐ๋ฅ์ฑ)โ ํ์ Claude์ โ๋ด๋ฉด ์ธ๊ณโ๋ฅผ ๋งคํํ๋ ์์ ์ ํด ์์ต๋๋ค - ์๋ฐฑ๋ง ๊ฐ์ ๋ด๋ฐ ํจํด, ์ฆ โFeatureโ๋ฅผ ๋ฐ๊ฒฌํ๊ณ ์ด๊ฑธ ์ฌ๋์ด ๊ฐ์ง๊ณ ์๋ ๊ฐ๋ ๊ณผ ์ฐ๊ฒฐํ๋ ๊ธฐ์ ์ธ โ๋์ ๋๋ฆฌ ๋ฌ๋ (Dictionary Learning)โ๋ถํฐ ์์ํด์์. LLM์ ํค์ง์ด์ LLM์ โ๋โ์ ๋ํ ๋๋ต์ ์ธ ์ฉ์ด์ง์ ๋ง๋๋ ๊ฑฐ๋ผ๊ณ ๋ ํ ๊น์?
2024๋ 10์๊น์ง๋, โMonosemanticityโ์ ์ง์คํ์ต๋๋ค - ํ๋์ ๋ด๋ฐ ํจํด์ด ํ๋์ ์๋ฏธ์ 1:1๋ก ๋์ํ ์ ์๋ค๋ ์๊ฐ์ด์ฃ . ์ด ์์ ์ Claude ๋ด๋ถ์ ๋ณต์กํ๊ฒ ์ฝํ ์๋ ํํ (Representation)์ ์ฐ๋ฆฌ๊ฐ ์ค์ ๋ก ์ถ๋ก ํ ์ ์๋ ๋ถ๋ถ์ผ๋ก ๋๋ ๋ณด๋๋ฐ ๋์์ ์คฌ์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ 2025๋ 3์, โOn the Biology of a Large Language Modelโ์ ํตํด์, Attribution Graph (Circuit Tracing ๋ฐฉ๋ฒ๋ก )๋ฅผ ์ฌ์ฉํด์ Claude 3.5 Haiku๊ฐ ์ฌ๋ฌ ๋จ๊ณ์ ๊ฑธ์ณ์ ์ด๋ป๊ฒ ์ถ๋ก ์ ํ๋์ง - ๊ทธ๋ฆฌ๊ณ ์๋ฅผ ์ฐ๊ณ , ํ์๋ฅผ ์ง๋จํ๊ณ , ๋ฏธ๋๋ฅผ ๊ณํํ๋์ง - ์ถ์ ํ์ต๋๋ค. ์ฌ๊ธฐ์๋ถํฐ ํ ๊ฐ์ง ๋ถ๋ช ํ ๋ฐ๊ฒฌ์ ํ๋ค๊ณ ์ด์ผ๊ธฐํ๋๋ฐ์ - ๋ฐ๋ก, ์ด ๋ชจ๋ธ๋ค์ด ๋จ์ํ ๋ฌธ์ฅ์ ์์ฑํ๋ ๊ฒ ์๋๋ผ, ์ผ์ข ์ โ์๊ฐโ์ ๊ตฌ์ฑํ๊ณ ์๋ค๋ ๊ฒ๋๋ค.

Circuit Tracing ๋ฐฉ๋ฒ๋ก ์ผ๋ก ๋ถ์ํ, Claude 3.5 Haiku - ์ค์ฐ๋กํฝ์ ๊ฒฝ๋ ๋ชจ๋ธ - ๊ฐ ๋ค์ํ ์์ ์ ํ ๋์ ๊ณผ์ . Image Credit: ์ค์ฐ๋กํฝ
์๋ฅผ ์ด๋ค๋ ๊ฐ, ํ์๋ฅผ ์ง๋จํ๋ค๋ ๊ฐ ํ๋ ๋ฑ์ ์์ ์์ LLM์ ์ด๋ค ๋ถ๋ถ์ด ์ด๋ค ๊ณผ์ ์ ๊ฑฐ์ณ์ ์ด๋ป๊ฒ ์๋ํ๋์ง ์ฌ๋ฏธ์๋ ๋ฐ๊ฒฌ์ด ๋ง์ด ์์ด์. ๊ทธ ์ค์ ์ข ์ฌ์ด ๊ฒ ํ๋๋ก, โCross-Linguistic Semantic Alignmentโ - โ์ธ์ด ๊ฐ ์๋ฏธ๋ก ์ ์ ๋ ฌโ์ด๋ผ๊ณ ๋ฒ์ญํด์ผ ํ ๊น์? - ๊ฐ ์์ด์. ์ธ์ด๊ฐ ๋ค๋ฅด๋๋ผ๋, ๊ทธ ์ฒ๋ฆฌ ๊ณผ์ ๊ณผ ํ์ฑํ๋๋ ์์ญ์ ๋์ผํ ๋ด๋ถ ํ๋ก๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฑด๋ฐ์. ์๋ฅผ ๋ค์ด, โํฌ๋คโ์ โ์๋คโ ๊ฐ์ ๋ฐ์์ ์ธ ๊ด๊ณ๋ฅผ ์ธ์ฝ๋ฉํ๋ ํ๋ก๊ฐ, ์์ด๋ , ํ๋์ค์ด๋ , ํ๊ตญ์ด๋ ๋ค์ํ ์ ๋ ฅ ์ธ์ด์ ๊ฑธ์ณ์ ๋์ผํ ์์ญ์ ํ์ฑํ๋๋ ๊ฑฐ์ฃ . ์ด๋ฐ ์ด์ ๋ก, ์ธ์ด์ ๊ด๊ณ์๋ ๋ถ๋ณ์ ์ถ๋ก , ์ปจํ ์ธ ์ ์ผ๋ฐํ ๋ฑ์ด ๊ฐ๋ฅํด์ง๋ ๊ฒ์ด๊ฒ ์ฃ .
Claude ์ ์ฒด ํ๋ผ๋ฏธํฐ ๊ณต๊ฐ์ ์ฝ 0.1%๋ง ์ถ์ ํ ๊ฒฐ๊ณผ์ด๊ธด ํ์ง๋ง, ์ค์ฐ๋กํฝ์ ์ด๋ฐ ์ฐ๊ตฌ๋, AI ๋ชจ๋ธ์ ํด์ ๊ฐ๋ฅ์ฑ, ๋ชจ๋ธ์ ์ ๋ขฐ์ฑ๊ณผ ์์ ์ฑ ๋ฑ์ ํฐ ์์ฌ์ ์ด ์์ ๊ฒ ๊ฐ์ต๋๋ค. AI ๋ชจ๋ธ์ด ์ผ์ผํฌ ์ ์๋ ๊ณ ์ํ ํ๋ (์๋ฅผ ๋ค์ด, ๊ฐ์ง ๋ด์ค๋ฅผ ๋ง๋๋ ๊ฒ)์ ๋ํ ํ๋ก๋ฅผ ์๋ณํด ๋ด์, ๋ฌธ์ ๊ฐ ์๋ ์ถ๋ ฅ๊ฐ์ ๋ํ ์กฐ๊ธฐ ๊ฒฝ๋ณด ์์คํ ์ ๋ง๋ค๊ฑฐ๋ ๋ ์์ ํ ๋ชจ๋ธ์ด ๋๋๋ก ์ํคํ ์ฒ๋ฅผ ์ฌ์ค๊ณํ ํํธ๋ฅผ ์ค๋ค๊ฑฐ๋ ํ ์ ์์ ๊ฑฐ์์.
๊ทผ๋ณธ์ ์ผ๋ก๋, ์ด๋ฐ ์ฐ๊ตฌ๊ฐ ๊ณ์๋๋ค๋ฉด, ๊ฒฐ๊ตญ์ LLM ๋ชจ๋ธ์ ์ธ์ง ๊ตฌ์กฐ๋ฅผ โํ๋กโ ์์ค์์ ๊ด์ฐฐํ๊ณ ์กฐ์๊น์ง ํ ์ ์๊ฒ ๋๊ณ , AI ๋ชจ๋ธ์ ๋ํ ์ฐ๊ตฌ์ ์ด์ ์ โ๊ฒฐ๊ณผ๋ฌผโ, ์ฆ ์ถ๋ ฅ๋ฌผ์์ โํ๋ก์ธ์คโ, ์ฆ ๊ณผ์ ์ผ๋ก ์ฎ๊ธฐ๋ ์ญํ ์ ํ ๊ฒ๋๋ค. ๋ฐ๋ก, ์ธ๊ณต์ง๋ฅ์ ๋ํ ํด์ ๊ฐ๋ฅ์ฑ ์ฐ๊ตฌ์ ๋ถ์๋ น์ด ๋ , AI์ ์ฌ๊ณ ๊ณผ์ ์ ๋ํ ๊ธฐ๊ณ์ ์ดํด์ ์ถ๋ฐ์ ์ ์ฐ๋ฆฌ๋ ์ ์๋ค๊ณ ํ ์ ์์ ๊ฒ ๊ฐ๋ค์.
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ ์๊ณ , ๋ค๋ฃจ๊ธฐ ์ฌ์ด ์ฌ๋ฌ ๊ฐ์ ๋จ๊ณ๋ก ๋๋ ์, ๊ฐ ๋จ๊ณ๋ฅผ ๋ ผ๋ฆฌ์ ์ผ๋ก ํด๊ฒฐํ๋ฉด์ ์ต์ข ์ ์ธ ๋ต์ ๋์ถํ๋ ๊ธฐ๋ฒ, CoT์ ๋ํด์ ์ด์ ์ต์ํ์ ๋ถ์ด ๋ง์ ๊ฑฐ๋ผ๊ณ ์๊ฐํฉ๋๋ค.
๊ทธ๋ฐ๋ฐ, ํ ์คํธ๊ฐ ์๋ ์ด๋ฏธ์ง, ๋น๋์ค, ์ค๋์ค ๋ฑ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ์ ๋ฐ์ดํฐ๋ค์ ๊ฐ์ง๊ณ ๋ AI ๋ชจ๋ธ์ ์ ์ฌ๋ ฅ์ ์ถฉ๋ถํ ๋ฐํํ ์ ์๋๋ก CoT ๊ธฐ๋ฒ์ด ๋์์ค ์ ์์๊น์?
์ด๋ฒ ์ฃผ ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์๋, ๋ฉํฐ๋ชจ๋ฌ CoT (Multimodal Chain-of-Thought) ๊ธฐ๋ฒ 9๊ฐ์ง๋ฅผ ์ ๋ฆฌํด ๋ดค์ต๋๋ค. ๋๋ถ๋ถ ์คํ์์ค๋ค์:
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
๋ฉํ, ๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ โLlama 4โ ๊ณต๊ฐ
๋ฉํ๊ฐ ํ ์คํธยท๋น๋์คยท์ด๋ฏธ์งยท์ค๋์ค ๋ฑ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ๋ค์ดํฐ๋ธ๋ก ์ฒ๋ฆฌํ ์ ์๋ โLlama 4โ๋ฅผ ๊ณต๊ฐํ์ต๋๋ค.
์ฌ์ด์ฆ๋ณ๋ก โScoutโ, โMaverickโ, โBehemothโ ๋ฑ 3๊ฐ์ง ์ ํ๊ตฐ์ผ๋ก ๊ตฌ์ฑํ๋๋ฐ, ์ฃผ๋ ฅ ๋ชจ๋ธ Maverick์ ์ ๋ ดํ ๋น์ฉ์ผ๋ก ๊ฒฝ์์ฌ ๋ชจ๋ธ๊ณผ ์ ์ฌํ ์ฑ๋ฅ์ ๋ด๋๋ก ํ๋ค๊ณ ํฉ๋๋ค. 100๋ง ํ ํฐ ์ฌ์ฉ ๋น์ฉ์ด ์ต๋ 0.49๋ฌ๋ฌ๋ก ์คํAI GPT-4o์ 10% ์์ค์ ๋๋ค. ๊ตฌ๊ธ์ Gemini 2.5 Pro๋ณด๋ค๋ 60% ์ ๋ ์ ๋ ดํ ์์ค์ด๊ตฌ์.

Image Credit: ๋ฉํ
๊ตฌ๊ธ์ Gemini ๊ด๋ จ ์์
๊ตฌ๊ธ ๋ฅ๋ง์ธ๋๊ฐ Gemini ์ค์ฉํ์ ๊ธธ์ ์์ฅ์๊ณ ์์ต๋๋ค. ๋ฐ๋ก Gemini Robotics ์ด์ผ๊ธฐ์ธ๋ฐ์. Gemini 2.0 ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ง ์ด ์์คํ ์, ๋ก๋ด์ VLA (Vision-Language-Action) ๋ชจ๋ธ์ ์ ๊ณตํด์ ๋ฌผ๊ฑด์ ์ก๊ณ , ๋ฐฉํฅ์ ๊ฐ๋ฆฌํค๊ณ , ํฌ์ฅํ๊ณ , ์ข ์ด์ ๊ธฐ๊น์ง ํ ์ ์๊ฒ ํด ์ค๋๋ค. Zero-shot, Few-shot ํ์ต์ผ๋ก ์๋ก์ด ์์ , ์๋ก์ด ๋ก๋ด ๋ชธ์ฒด์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๊ตฌ์, ์ฌํ๋ จ์ด ํ์์์ต๋๋ค. ์ ๋๋ก ๋ โ๋ฒ์ฉ'์, ๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ฅ์ํ AI๋ฅผ ํฅํ, ์กฐ์ฉํ์ง๋ง ๋๋จํ ๋ ํ ๊ฑธ์์ ๋ด๋์ ๊ฒ ๊ฐ์ต๋๋ค.
๊ตฌ๊ธ์ด Gemini 2.5 Pro Experimental ๋ชจ๋ธ์ ๋ฌด๋ฃ๋ก ์ ๊ณตํฉ๋๋ค. ์ด์ ์ ์ 19.99 ๋ฌ๋ฌ๋ฅผ ๋ด์ผ ์ฌ์ฉํด ๋ณผ ์ ์์๋๋ฐ์, ์ด ์ต์์ ๋ชจ๋ธ์ ์ด์ ํ์ผ ์ ๋ก๋, ์ฑ ํตํฉ, ์๋ก์ด Canvas ๋๊ตฌ์ ํจ๊ป ์ ๊ณต๋ฉ๋๋ค. ์๋ง๋ ๊ตฌ๊ธ์ด ๊ฐ์ง ์ต๊ณ ์ AI ๋ชจ๋ธ - ์ถ๋ก (Reasoning) ์์ ๊ณผ STEM ์์ญ์์ ์ต๊ณ ์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์์ฃ - ์ ์์ฅ์ ํผ๋จ๋ฆฌ๊ธฐ ์ํ ์์ ์ด๊ธฐ๋ ํ ๊ฒ๋๋ค. AI์ โ๋ฏผ์ฃผํโ๋ผ๊ธฐ๋ณด๋ค๋ โBait-and-Switchโ - ๋ฏธ๋ผ ์ ๋ต ์ ๋๋ก ์๊ฐํ๋ฉด ๋ ๋ฏํฉ๋๋ค - ์ ๋ต์ด๊ฒ ์ฃ ? ์๋ง ์๊ฐ(๊ณผ ๊ฐ๊ฒฉ ์ ์ฑ )์ด ๋งํด์ค ๊ฒ๋๋ค.
์คํAI, OpenAI Academy ๋ฐ์นญ, ๊ทธ๋ฆฌ๊ณ ์ ์ด๋ฏธ์ง ์์ฑ๊ธฐ ์ถ์
์คํAI, AI์ ํธ๊ธฐ์ฌ์ ๊ฐ๊ณ ์๋ ์ฌ๋๋ค์ด AI์ ๊ด๋ จ๋ ๋ฅ๋ ฅ์ ์ ๋๋ก ๊ฐ์ถ๊ฒ๋ ๋ง๋ค์ด์ง ๊ธ๋ก๋ฒ ํ์ต ํ๋ธ๋ฅผ ๋ฐ์นญํ์ต๋๋ค. โ๋น์๋ฆฌ ๋จ์ฒด๋ฅผ ์ํ AI ์ ๋ฌธโ, โ๋ ธ๋ ์ธต์ ์ํ AI ์ ๋ฌธโ ์ด๋ฐ ๊ฐ์ข๋ค์ด ๋ณด์ด๋ค์. AI ๋ฆฌํฐ๋ฌ์๋ฅผ ์ฆ์งํ๋๋ฐ ๋์์ด ๋ ๊ฒ ๊ฐ์ต๋๋ค.
์คํAI๊ฐ ์ฑGPT์์ ๋ฐ๋ก ์ฌ์ฉํ ์ ์๋ ์๋ก์ด Image Generator๋ฅผ ๊ณต๊ฐํ์ฃ . ์๋ง ์์ง๋ ์ธํฐ๋ท์ ํฉ์ธ๊ณ ์๋ ์ง๋ธ๋ฆฌ ์คํ์ผ ์ด๋ฏธ์ง ์ด์ผ๊ธฐ๋ ๋ค์ด๋ณด์ จ์ ๊ฒ๋๋ค. ๊ตฌ๊ธ์ Gemini Flash๋ Gemini 2.0์ ํตํด์ ์ด๋ฏธ์ง ์์ฑ์ ํ ์ ์์ง๋ง, ์์ ํํฐ๊ฐ ๋ ์๊ฒฉํด์ ์ ํ๋์ด ์๊ตฌ์. ์คํAI๋ ์ ์ํธ๋ง๋ถํฐ ํด์ ์ง๋ธ๋ฆฌ ์ด๋ฏธ์ง ์์ฑ ์ดํ์ ์ด๋์์ต๋๋ค. ์ด๋ค ์ ๊ทผ์ด ๋ ๋ง๋ค ์๋๋ค๋ฅผ ์ด์ผ๊ธฐํ๊ณ ์ถ์ง๋ ์์ต๋๋ค, ์์ง์์. ๋ค๋ง, ์ด ๊ณผ์ ์์ ์๋ง์ ๋ถ๋ค์ด ๋ณธ์ธ๊ณผ ๊ฐ์กฑ, ์น๊ตฌ๋ค์ ์ฌ์ง์ ์ฌ๋ฆฌ์๊ฒ ๋ ํ ๋ฐ, ๊ทธ ์ด๋ฏธ์ง๋ค์ด ์คํAI ๋ชจ๋ธ ํ๋ จ์ ์ฌ์ฉ๋๊ณ ํน์๋ ๋์ค์ ์ด๋ค ๋ฌธ์ ๊ฐ ์๊ธธ ์๋ ์๋ค๋ ๊ฒฝ๊ณ ๋ฅผ ํ๋ ๋ถ๋ค๋ ์์ต๋๋ค.
the chatgpt launch 26 months ago was one of the craziest viral moments i'd ever seen, and we added one million users in five days.
we added one million users in the last hour.
โ Sam Altman (@sama)
6:11 PM โข Mar 31, 2025
์ง๋ธ๋ฆฌ ์ด๋ฏธ์ง ์์ฑ ์ดํ๊ณผ ๊ด๋ จํด์, ์ ์๊ถ์ ๋ํ ์๊ฐ, ๊ทธ๋ฆฌ๊ณ ๊ทธ๊ฑธ ๋์ด์ ์ค์ค๋ก์๊ฒ ๋์ ธ ๋ดค์ผ๋ฉด ํ๋ ์ง์ง ์ง๋ฌธ๋ค์ ๋ํ ์๊ฐ์ ๊ธ๋ก ํ ๋ฒ ์ ๋ฆฌํด ๋ดค์ต๋๋ค. ๊ด์ฌ์์ผ์ ๋ถ์ ํ ๋ฒ ๋ด ์ฃผ์๊ตฌ์:
์ฌ๊ธฐ ๋ชจ๋ธ ์์คํ ์นด๋๋ฅผ ๋ณด์ค ์ ์๊ตฌ์. ๊ทธ๋ฐ๋ฐ, ์ด๋ฏธ์ง ์์ฑํ์๋ค๋ณด๋ฉด, ์ ์์ฃผ ์ค๋ ์ ๋ท์ค์ผ์ดํ ๋ธ๋ผ์ฐ์ ์์ ์ด๋ฏธ์ง ๋จ๋ฏ์ด โ์์์๋ถํฐ ์๋๋กโ ์ธํฐ๋ ์ด์ฑ ๋๋ ๊ฒ์ฒ๋ผ ๋ณด์ด๋๊ฒ ์ ๊ธฐํ์ง ์์ผ์ จ๋์? ์ดํด๋ณด๋, ๋ธ๋ผ์ฐ์ ํ๋ก ํธ์๋์ ๊ธฐ๋ฅ์ด๋ผ๋๊ตฐ์:
After hacking GPT-4o's frontend, I made amazing discoveries:
๐กThe line-by-line image generation effect users see is just a browser-side animation (pure frontend trick)
๐ฆOpenAI's server sends only 5 intermediate images per generation, captured at different stages
๐พPatch size=8โ Jie Liu (@jie_liu1)
11:19 PM โข Mar 28, 2025
์, ๊ทธ๋ฆฌ๊ณ , ์คํAI๊ฐ ์ค์ฐ๋กํฝ์ MCP (Model Context Protocol)์ ์ฑํํ๋ค๋ ์์์ ๋๋ค. ์น์ดํ๊ฒ ๊ฒฝ์ํ๋ ๊ด๊ณ์ด๊ธฐ๋ ํ์ง๋ง, ๋์ธ์ ์์ํด์ ๊ณต๊ฐ ํ๋กํ ์ฝ ๊ณ์ด์ ํฉ๋ฅํ๋ ๋ชจ์ต์ธ์ง, ์ผ๋จ ๋ฐ๋ผ์ก์ผ๋ฉด์ ๋ค์ ์ ์ธ๋ฅผ ์ญ์ ์ํฌ ๊ธฐํ๋ฅผ ์ดํด๋ณผ์ง, ํฅ๋ฏธ์ง์งํฉ๋๋ค.
์ผ๋ก ๋จธ์คํฌ, X์ xAI๋ฅผ ํฉ์น๋ค
๋ชจ๋ ๊ฒ์ ์ง๋ฐฐํ ํ๋์ ์ ๊ตญ์ผ๋ก์ ๊ธธ์ผ๊น์? ์ผ๋ก ๋จธ์คํฌ๊ฐ ์์ ์ ์์ ํ๋ซํผ X๋ฅผ xAI์ ํตํฉํ๋ค์. ์ด ๋์, xAI ์คํํธ์ ์ ๊ฐ์น๋ฅผ 800์ต ๋ฌ๋ฌ, X์ ๊ฐ์น๋ฅผ 330์ต ๋ฌ๋ฌ(120์ต ๋ฌ๋ฌ์ ๋ถ์ฑ๋ฅผ ์ ๊ฑฐํ ํ)๋ก ํ๊ฐํ๋ ์ ์ก ์ฃผ์ ๊ฑฐ๋๋ก, ์ ๋ต์ ์ธ ์ํ ๊ณ ๋ฆฌ์ ์์ฑ์ ๋๋ค โ AI ๋ชจ๋ธ์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์ป๊ณ , ์ฌ์ฉ์๋ค์ AI ๋ค์ดํฐ๋ธ ๋์ดํฐ๋ฅผ ์ป๋๋ค๋ฉด, ๋จธ์คํฌ๋ ๋ ๋ค์ ๋ํ ๋ ๊ฐ๋ ฅํํ ํต์ ๊ถ์ ์ป๊ฒ ๋๋ค์.
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
๋์งํธ ํฌ๋ฆฌ์์ดํฐ์ด์ Arkabrik์ CD์ด์ Joshua Cho๋์ด โ์ฌ๊ธฐ๋ก์ด ์ฑGPT ์ด๋ฏธ์ง ํ์ฉ ์ฌ๋กโ๋ฅผ ๋ง๋ค์ด์ ๊ณต์ ํด ์ฃผ์ จ์ต๋๋ค. ํ ๋ฒ ๋ค์ด๊ฐ์ ๊ด์ฌ์๋ ๊ฒ๋ค ์๋์ง ๋ณด์๊ณ , ์ง์ ํ์ฉ๋ ํด ๋ณด์๋ฉด ์ฌ๋ฏธ์์ ๊ฒ ๊ฐ์ต๋๋ค.

Image Credit: ํ์ด์ค๋ถ, Joshua Cho
When to use and when not to use fine-tuning by Andrew Ng
โ์ํ ๋ชจ๋ธ์ ํ์ธํ๋โ์ด๋ผ๋ ๋งฅ๋ฝ์์, ์ธ์ ํ์ธํ๋์ ํ๋๊ฒ ์ข์์ง, ์๋๋ฉด ํ๋กฌํํธ ์์ง๋์ด๋ง์ด๋ ์์ด์ ํฑ ์ํฌํ๋ก์ฐ ๋ฑ์ ๋ ๋จ์ํ ๊ตฌ์กฐ์ ๋ฐฉ๋ฒ์ผ๋ก ์ ๊ทผํ๋๊ฒ ์ข์์ง, ์ค๋๋ฅ ์์ด ์๊ฒฌ์ ๊ณต์ ํ ๊ธ์ ๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
๊ธ์ฃผ ์ด ์น์ ์ ํ ์ฃผ ์ฌ์ด๊ฐ๊ฒ ์ต๋๋ค!
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply