- Turing Post Korea
- Posts
- ๐FOD#117: แแ กแซแแ ณแ แ ฆ แแ กแแ กแแ ตแแ ด แแ ฎแซแแ ณแ แ ฉ แแ ฉแซ, LLMแแ ด 'แแ ขแแ ตแแ ตแแ ณแซ แแ ฆแแ จ'
๐FOD#117: แแ กแซแแ ณแ แ ฆ แแ กแแ กแแ ตแแ ด แแ ฎแซแแ ณแ แ ฉ แแ ฉแซ, LLMแแ ด 'แแ ขแแ ตแแ ตแแ ณแซ แแ ฆแแ จ'
+ Werewolf(แแ ณแจแแ ขแแ ตแซแแ กแซ) แแ ฆแซแแ ตแแ กแแ ณ แแ ตแพ แแ ณแทแแ ฎแแ ด แแ ฎแแ ญ แแ ฒแแ ณ แแ ตแพ แแ งแซแแ ฎ
AI ์๋์ ๋ฐฉ๋์ โ์๋๋ ์นดํ์โ์ ๋์ผ๋ก ๋ณธ LLM์ โ๋ด๋น์น๋ ์ธ๊ณโ

์๋๋ ์นดํ์
์ฌ๋ฌ๋ถ๋ค๋ ์๋๋ ์นดํ์์ ๋ํด์ ๋ง์ด ๋ค์ด๋ณด์ จ๊ณ ๋ ์ ์์ค ๊ฒ ๊ฐ์ต๋๋ค. ์๋๋ ๋ AI ์ ๊ณ๊ฐ, ๊ทธ๋ฆฌ๊ณ ๋ง์ ๋ถ์ด ์๋ผ๊ณ ์ข์ํ๋, โ๋ฐฉ๋ํ๋ ์์ฐ์ฃผ์์โ์ด์ฃ . ์คํ ํฌ๋๋ํ๊ต์์ ๋ฐ์ฌ ํ์๋ฅผ ํ ์๋๋ ๋, ํ ๋ ํ ์ฌ๋ผ์ AI๋ฅผ ์ฑ ์์ง๋ ์ด๊ด์ด์๊ณ , ์คํAI์ ์ฐฝ๋ฆฝ ๋ฉค๋ฒ์ด๊ธฐ๋ ํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ , CS231n ๊ฐ์๋ฅผ ํตํด์ ์๋ง์ ์ด์ฑ์ ์ธ AI ์ฐ๊ตฌ์๋ค์๊ฒ โ์ปจ๋ณผ๋ฃจ์ ๋คํธ์ํฌโ์ ๋์ ํตํด์ ์ธ์์ ๋ณด๋ ๋ฒ์ ๊ฐ๋ฅด์น๊ธฐ๋ ํ์ต๋๋ค.
์๋๋ ๋, ๋ง์น ์จ ์ฌ๋ ๊ฒ์ฒ๋ผ ์์ฐ์ค๋ฝ๊ฒ โ์๋ก์ด ์ฉ์ดโ๋ฅผ ๋ง๋ค์ด๋ด๋ ์ฌ์ฃผ๊ฐ ์๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ด์ ์ โ์ํํธ์จ์ด ์ฝ๋โ๋ฅผ โํ์ต๋ ๊ฐ์ค์น(Learned Weights)โ๋ก ๋ค์ ์ ์ํ โ์ํํธ์จ์ด 2.0โ ๊ฐ๋ ์ ์ฒ์ ์ ์ํ๋ ๊ฒ๋ ์๋๋ ์ค๋ฌ์ด ๋ฐ์์ด์๊ตฌ์.
2023๋ ์๋ ์คํAI๋ก ๋์๊ฐ์ GPT-4, ๊ทธ๋ฆฌ๊ณ ChatGPT ์ถ์๋ฅผ ํจ๊ป ๋์๊ณ , 2024๋ ์๋ ๋ค์ ํ์ฌ๋ฅผ ๋ ๋์ ์๋ก์ด ํํ์ โAI-Native ํ๊ตโ๋ผ๊ณ ๋ถ๋ฅผ ๋งํ โ์ ๋ ์นด ๋ฉ์ค(Eureka Labs)โ๋ฅผ ์์ํ์ต๋๋ค. ์ต๊ทผ์๋ ํ๋กฌํํธ(Prompt), ์์ด์ ํธ(Agent), ๊ทธ๋ฆฌ๊ณ ์์จ์ฑ ์ฌ๋ผ์ด๋(Autonomy Slider)๋ผ๋ ์์๋ฅผ ์ค์ฌ์ผ๋ก ์ํํธ์จ์ด๊ฐ ๋์ฑ ์ง๋ฅ์ ์ด๊ณ ๋ค์ด๋๋ฏนํ๊ฒ, โ์ฌ์ฉ์ ๋ง์ถคํโ์ผ๋ก ์๋ํ๋ โ์ํํธ์จ์ด 3.0โ ํจ๋ฌ๋ค์์ ๋ํด์ ๊ณ ๋ฏผํ๊ณ ์๋ค๊ณ ํฉ๋๋ค.
์๋๋ ์ ์์ ๊ฑฐ์น๋ฉด, ์ฅ๋๊ฐ ๊ฐ๋ ๋ ํฌ์งํ ๋ฆฌ๋ โmicrogradโ, โmakemoreโ, โnanoGPTโ์ฒ๋ผ ์์๊ฐ์ ์ปฌํธ์ ์ธ ํด๋์์ด ๋๊ธฐ๋ ํฉ๋๋ค:
micrograd: ์๋ ๋ฏธ๋ถ(Gradient Computation) ์์ง์ 100์ค ์ ๋ ์ฝ๋๋ก ๊ตฌํํ ํ ์ด ํ๋ก์ ํธ. ๋ฅ๋ฌ๋์ ํต์ฌ์ธ Backpropagation์ ์ฝ๊ฒ ์ดํดํ๊ธฐ ํด ์ค๋๋ค.
makemore: ๋ฌธ์ ๋ ๋ฒจ์ ์ธ์ด ๋ชจ๋ธ๋ก, Name Generator๊ฐ์ด ์๋์ ํฉ๋๋ค. RNN์ด๋ Transformer์ ๊ธฐ์ด๋ฅผ ์ค๋ช ํ๊ณ , ๊ฐ๋จํ ๋ฐ์ดํฐ์ ์ผ๋ก AI ๋ชจ๋ธ์ ํ๋ จํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
nanoGPT: GPT ๋ชจ๋ธ์ ์์ฃผ ์์ ๊ท๋ชจ๋ก ์ฌํํ ํ๋ก์ ํธ๋ก, ์๋ฐฑ ์ค ์ฝ๋๋ก ChatGPT ๊ฐ์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์๋ฆฌ๋ฅผ ์ค๋ช ํฉ๋๋ค. ๋ง์ AI ๊ฐ๋ฐ์๋ค์ด ์ค์ค๋ก ๋ชจ๋ธ์ ๋ง๋๋ ๋ฐ ํฐ ๋์๊ณผ ์๊ฐ์ ์คฌ์ฃ .
์ด๊ฒ ๋ฟ์ธ๊ฐ์? โ๋ฐ์ด๋ธ ์ฝ๋ฉ(Vibe Coding)โ ๊ฐ์ ํํ๋ ์๋๋ ์ ์ ์์ ๋์์ ์ด์ AI๋ฅผ ์๋ ๋ชจ๋ ์ฌ๋์ด ๋ฐ๋ผ ์ฐ๋ ์ ํ์ด๊ฐ ๋์์ฃ .
There's a new kind of coding I call "vibe coding", where you fully give in to the vibes, embrace exponentials, and forget that the code even exists. It's possible because the LLMs (e.g. Cursor Composer w Sonnet) are getting too good. Also I just talk to Composer with SuperWhisper
โ Andrej Karpathy (@karpathy)
11:17 PM โข Feb 2, 2025
์๋๋ ๊ฐ ์ฐ๋ ๋ธ๋ก๊ทธ ํฌ์คํธ๋, ์๋ ๊ฐ AI ๋ถ์ผ์ โ๊ต๊ณผ์โ๊ฐ์ ์ทจ๊ธ์ ๋ฐ๊ธฐ๋ ํฉ๋๋ค.
X(๊ตฌ ํธ์ํฐ) ํ๋ก์๋ 130๋ง ๋ช , ์ ํ๋ธ ๊ตฌ๋ ์๋ 100๋ง ๋ช ์ด์ - ๊ทธ์ผ๋ง๋ก ์์ฒญ๋ ์ํฅ๋ ฅ(์์ฃผ ์ข์ ์๋ฏธ์์์)์ ๊ฐ์ง ์ธ๋ฌผ์ด์ฃ .
๊ทธ๋์ ๋ฌธ๋ ์ด๋ฐ ์๊ฐ์ด ๋ค์์ต๋๋ค. โ๋งค๋ฌ ์๋๋ ๊ฐ ๊ด์ฌ์ ๊ฐ์ง๊ณ ์๋ ๊ฒ๋ค์ ์ดํด๋ณด๊ณ , ๊ทธ ํต์ฌ๋ง ์์ ๋ฝ์ ์ ๋ฆฌํด ๋ณด๋ฉด ์ด๋จ๊นโ ํ๋ ์๊ฐ์ด์ - ์ด์ฉ๋ฉด, ์ฐ๋ฆฌ์๊ฒ โ์ 3์ ๋โ์ ์ด์ด์ค ์ง๋ ๋ชจ๋ฅด์์์?
์ง๋ 8์ 28์ผ, 'LLM-๋ค์ดํฐ๋ธ ์ปค๋ฆฌํ๋ผ'์ด๋ผ๋ ๊ฐ๋ ์ ๊น๊ฒ ํ๊ณ ๋๋ ๋ชจ์ต์ ๋ณด์ฌ์ค ์๋๋ ๋, ์ด๋ฐ ์ง๋ฌธ์ ๋์ก์ต๋๋ค: โ์ ๋ชจ๋ธ์๊ฒ ํ ์คํธ ๋ฉ์ด๋ฆฌ์ธ PDF๋ฅผ ๊ทธ๋๋ก ๋์ ธ์ผ ํ๋? ๋๊ฐ์ ์๋ฃ๋ฅผ ๊ธฐ๊ณ๊ฐ ๋ ์ ์ดํดํ ์ ์๋ ๊ณผ์ (Course)์ผ๋ก ์ฌ๊ตฌ์ฑํ๋ฉด ์ด๋จ๊น?" ํ๋ ์ง๋ฌธ์ด์.
๊ทธ๋ฆฌ๊ณ , ๊ทธ ๋ฐฉ๋ฒ์ ๊ตฌ์ฒด์ ์ผ๋ก ์ ์ํ๋๋ฐ์:
์ค๋ช (Exposition): ๋งํฌ๋ค์ด(Markdown)์ผ๋ก ์ ๋ฆฌํ๊ณ ,
๋ฌธ์ ํ์ด(Problems): ์ง๋ ํ์ธํ๋(Supervised Fine-Tuning) ์์ผ๋ก ๋ง๋ค๊ณ ,
์ฐ์ต(Exercises): ๊ฐํ ํ์ต(Reinforcement Environments) ํ๊ฒฝ์ ๊ตฌ์ถํ๊ณ ,
๋ฌธ์ ์์ฑ(Problem Generators): ๋ฌดํํ ๋ง์ ํฉ์ฑ ๋ฌธ์ ๋ฅผ ์๋์ผ๋ก ๋ง๋ค์ด๋ด๋ ๊ฑฐ์ฃ .
์ด๋ฐ ํ๋ ์ ์์์๋ผ๋ฉด, ์๋ง LLM์ ๋จ์ํ ์ ๋ณด๋ฅผ ์๊ธฐํ๋ ๊ฒ ์ด์์ ํด๋ผ์ง๋ ๋ชจ๋ฆ ๋๋ค: ๋ง์น ํ์์ด ํ๋ฏ์ด โ๋ฌผ๋ฆฌํ ๊ฐ์๋ฅผ ๋ค์ผ๋ฉด์ ์ฐ์ต๋ ํ๊ณ , ํผ๋๋ฐฑ๋ ๋ฐ๊ณ , ์ฑ์ ํ๋โ ์ฌ์ดํด์ ๊ฑฐ์น๋ ๊ฒ์ด์ฃ .
์ด ์์ด๋์ด๊ฐ ์คํ๋๊ณ ๊ตด๋ฌ๊ฐ๊ฒ ๋๋ค๋ฉด, ๊ทธ ํ๊ธ๋ ฅ์ ์๋นํ์ง ์์๊น์? ๋ชจ๋ ์ธ๊ฐ์ ํ๋ฌธ ๋ถ์ผ๊ฐ ์ฒด๊ณ์ ์ธ ๋ํํ ๊ต์ก ๊ณผ์ ์ผ๋ก ๋ฐ๋๊ณ , ๊ธฐ๊ณ๊ฐ ์ด ๊ณผ์ ์ ์ง์ ์ด์ํ๋ ๊ฒ ๊ฐ์ 'LLM ์์นด๋ฐ๋ฏธ'๊ฐ ์ด๋ฆด ์ ์๋ค๋ ์๋ฏธ๋๊น์. ์ด๋ ๊ฒ ๋๋ฉด, ๋ณ๋ชฉ(Bottleneck)์ ์ธํฐ๋ท์ ์๋ ํ ์คํธ๋ฅผ ์์งํ๋ ๊ฒ ์๋๋ผ โLLM์ ์ํ ๊ต์ก ํ์ดํ๋ผ์ธ์ ์ค๊ณํ๋ ๊ฒโ์ด ๋๋ฉด์ ํ๋๊ฐ ์์ ํ ๋ฐ๋ ๊ฒ ๊ฐ์ต๋๋ค.
์ ํฌ์ ์ง๋ฌธ์, โ์ธํฐ๋ท์ด ์ฌ์ ํ์ต(Pre-training)์ ์ํ ํ๋ จ์ฅ ์ญํ ์ ํ๋ค๋ฉด, LLMํ๋ ์ปค๋ฆฌํ๋ผ์ ์ง์์ ํ์ฉ(Application)๊ณผ ์ถ๋ก (Reasoning)์ ์ํ ํ๋ จ์ฅ์ด ๋ ์ ์์๊น?โํ๋ ๊ฒ๋๋ค. ์ธํฐ๋ท์ ๋ฐ์ดํฐ๋ ๊ฝค ๋ง์ ๊ฒฝ์ฐ์ ๋ถ์ ํํ๊ฑฐ๋ ๋ชจ์์ด ๋ ๋๋ ์๊ณ , ์ฒด๊ณ์ ์ด์ง๋ ์์ฃ . ํ ๊ถ์ ์ฑ ์ด๋ผ๊ธฐ๋ณด๋ค๋ ๋์๊ด์์ ๋ฌด์์๋ก ๋ฝ์ ํ์ด์ง ๋ฌถ์ ๊ฐ์ ๊ฑฐ๋ผ๊ณ ํ ๊น์? LLM์ด ์ฌ๊ธฐ์ ๊ธฐ๋ณธ์ ์ธ ๋ฌธ๋ฒ๊ณผ ์์์ ์ต๋ํ์ง๋ง, ๊น์ด ์๋ ์ฌ๊ณ ์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ์๊ธฐ์๋ ๋ถ์กฑํ ์ ์์ต๋๋ค.
๋ฐ๋ฉด์, LLMํ๋ ์ปค๋ฆฌํ๋ผ์ ์ ์ง์ธ ๊ต๊ณผ์ ๊ฐ์ ๊ฑฐ๋ผ๊ณ ๋ด์ผ๊ฒ ์ฃ . ๋จ๊ณ๋ณ๋ก ๋์ด๋๋ฅผ ๋์ฌ๊ฐ๋ฉด์ ๋ฌธ์ ๋ฅผ ํ๊ณ , ์ค์๋ฅผ ๋ฐ๋ก์ก๋ ๊ณผ์ ์ ํตํด์ ๋ชจ๋ธ์ด ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ , ๊ฐ์ค์ ์ธ์ฐ๊ณ , ๋ ผ๋ฆฌ์ ์ผ๋ก ํด๊ฒฐํ๋ ๋ฅ๋ ฅ์ ๋ฐฐ์ธ ์ ์์์ง๋ ๋ชจ๋ฆ ๋๋ค.
๋ชจ๋ธ์ด โํ์ตํ๋ ๋ฐฉ๋ฒโ์ ๊ฐ๊ฐ ์๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐ ์์์ ์งํํด ์์ฃ :
์ฌ์ ํ์ต(Pre-Training) ์๋์๋ ์ธํฐ๋ท ํ ์คํธ๊ฐ ๊ทธ ์ญํ ์ ํ๊ณ ,
์ง๋ ํ์ธํ๋(Supervised Fine-Tuning) ์๋์๋ ๋ํํ ๋ฐ์ดํฐ๊ฐ,
๊ฐํ ํ์ต(Reinforcement Learning) ์๋์๋ ํ๊ฒฝ(Environments)์ด ๋ฐ์ดํฐ์ ํต์ฌ์ด์๋ค๊ณ ํ ์ ์์ต๋๋ค.
์ง๊ธ ํ์ฌ, ๊ฐ์ฅ ํฐ ๋๊ด์ ์ด 'ํ๊ฒฝ'์ ๋๊ท๋ชจ๋ก ๊ตฌ์ถํ๋ ๊ฒ๋๋ค. ๋ชจ๋ธ์ด ๋ง์๊ป ์ํธ์์ฉ์ ํ๊ณ , ์ค์ค๋ก๋ฅผ ์ํํ๋ฉด์ ์ฑ์ฅํด ๊ฐ ์ ์๋ ์ผ์ข ์ '์๋๋ฐ์คโ๋ฅผ ๋ง๋๋ ๊ฑฐ์ฃ .
์์ ์ ์คํAI์ 'Gym'์ด ๋ก๋ด์ด๋ ์ํ๋ฆฌ ๊ฒ์ ์์ด์ ํธ๋ฅผ ์ํ ํ๊ฒฝ์ด์๋ค๋ฉด, ์ง๊ธ 'Prime Intellect'์ 'Environments Hub' ๊ฐ์ ์๋๋ LLM์ ์ํ ์ฝ๋ฉ, ์ถ๋ก , ๊ณํ ์ธ์ฐ๊ธฐ ๊ฐ์ ํ๊ฒฝ์ ๋ง๋ค๊ณ ์์ต๋๋ค.
๊ทธ๋ฐ๋ฐ, ์๋๋ ๋ '๋ณด์ ํจ์(Reward Functions)'์ ๋ํด์๋ ํ์์ ์ธ ์๊ฐ์ ๋๋ฌ๋ด๊ณ ์์ต๋๋ค: ์ธ๊ฐ์ด ์ง์ ์ธ ๊ณผ์ ๋ฅผ ๋จ์ํ ๋ณด์๊ณผ ๋ฒ์น์ ํตํด ๋ฐฐ์ฐ๋ ๊ฒ ์๋๋ผ๊ณ ์๊ฐํ๋ ๊ฒ๋๋ค. ๋์ ์, ์๋ก์ด ํจ๋ฌ๋ค์์ ์์ํ๊ณ ์๋๋ฐ, ๋ฐ๋ก ์์คํ ํ๋กฌํํธ ํ์ต(System-Prompt Learning), ๋งฅ๋ฝ ๊ธฐ๋ฐ ์ ๋ฐ์ดํธ(Context-Driven Updates), ๊ทธ๋ฆฌ๊ณ ๊ธฐ์ต ์ ์ (Memory Distillation) ๊ฐ์ ๊ฒ๋ค์ ๋๋ค:
์์คํ ํ๋กฌํํธ ํ์ต: ์ด๊ฑด AI์๊ฒ ์ญํ ์ ์ ํด์ฃผ๋ ๊ฒ๋๋ค. ์๋ฅผ ๋ค์ด์, "๋๋ ์ต๊ณ ์ ์ญ์ฌํ์์ผ"๋ผ๊ณ ๋งํด์ฃผ๋ฉด, AI๋ ๋ณด์์ด ์์ด๋ ์ญ์ฌํ์์ฒ๋ผ ๊น์ด ์๊ณ ๋ ผ๋ฆฌ์ ์ธ ๋ต๋ณ์ ํ๋ ค๊ณ ๋ ธ๋ ฅํฉ๋๋ค. ๋จ์ํ ๋ฌธ์ ๋ฅผ ํ๊ธฐ๋ณด๋ค๋, ์ญํ ์ ๋ชฐ์ ํด์ ๋ฐฐ์ฐ๋ ๊ฑฐ์ฃ .
๋งฅ๋ฝ ๊ธฐ๋ฐ ์ ๋ฐ์ดํธ: AI๊ฐ ๋ํ์ ํ๋ฆ๊ณผ ๋์์ค๋ฅผ ์ดํดํ๋ ๊ฒ๋๋ค. ๋๊ตฐ๊ฐ "๋ฐฉ๊ธ ๊ฑด ๋๋ด์ด์์ด"๋ผ๊ณ ๋งํ๋ฉด, AI๋ '๋๋ด'์ด๋ผ๋ ๊ฐ๋ ์ ๋ํ์ ๋งฅ๋ฝ ์์์ ๋ฐฐ์ฐ๊ณ , ๋ค์์ ๋น์ทํ ์ํฉ์ด ์ค๋ฉด ๊ทธ ์ง์์ ์ ์ฉํฉ๋๋ค. ์ ํด์ง ๋ฐ์ดํฐ๊ฐ ์๋๋ผ, ์ค์๊ฐ ๋ํ์์ ๋ฐฐ์ฐ๋ ๋ฐฉ์์ ๋๋ค.
๊ธฐ์ต ์ ์ : AI๊ฐ ๋ฐฐ์ด ๋ชจ๋ ์ ๋ณด ์ค์์ ๊ฐ์ฅ ์ค์ํ ํต์ฌ๋ง ๋จ๊ธฐ๋ ๊ฒ๋๋ค. ์ฑ ์ ์ฝ๊ณ ๋์ ํต์ฌ ์์ฝ๋ณธ์ ๋ง๋ค๋ฏ์ด, AI๋ ๋ฐฉ๋ํ ์ง์ ์์์ ์ค์ํ ์๋ฆฌ๋ ํจํด์ ์ค์ค๋ก ๋ฐ๊ฒฌํ๊ณ ์์ถํฉ๋๋ค. ์ด๋ ๊ฒ ๋๋ฉด ๋ถํ์ํ ์ ๋ณด๋ ๋ฒ๋ฆฌ๊ณ , ๊ผญ ํ์ํ ์ง์๋ง ๋จ๊ฒ ๋์ด์ ํจ์ฌ ํจ์จ์ ์ผ๋ก ์ฌ๊ณ ํ ์ ์์ต๋๋ค.
๊ณผ์ฐ, ๊ฐํํ์ต์ ์๋ ์ดํ์ ๋ฐ๋ผ์ฌ, ๊ธฐ๊ณ ํ์ต(ML)์ ๋ค์ ์ ๊ฑฐ์ฅ์ ์ด๋์ผ๊น์?
์๋๋ ๊ฐ ์์ํ๋ ๊ฒ์ฒ๋ผ, ๋ค์ ํจ๋ฌ๋ค์์ '์๊ธฐ ์ฃผ๋์ ํ์ต(Self-Directed Learning)' ๋๋ '๋ด๋ฌํฐ๋ธ ๊ธฐ๋ฐ ํ์ต(Narrative-Based Learning)'์ด ๋ ๊ฐ๋ฅ์ฑ์ด ๋์ง ์์๊น์? ๋ณด์์ ์์กดํ์ง ์๊ณ , ๋ชจ๋ธ ์ค์ค๋ก๊ฐ ํ์ต์ ์ฃผ์ฒด๊ฐ ๋๋ ๋ฐฉ์์ด์.
๊ด์ฐฐ ๋ฐ ๋ชจ๋ฐฉ: ๋ชจ๋ธ์ด ์ธ๋ถ ํ๊ฒฝ์ ๋จ์ํ ๊ด์ฐฐํ๊ณ , ์ธ๊ฐ์ด๋ ๋ค๋ฅธ ๋ชจ๋ธ์ ํ๋์ ๋ชจ๋ฐฉํ๋ฉด์ ํ์ตํ๋ ๊ฒ๋๋ค. ๋ง์น ์์ด๊ฐ ๋ถ๋ชจ์ ํ๋์ ๋ณด๋ฉด์ ๋ฐฐ์ฐ๋ ๊ฒ์ฒ๋ผ์.
๋ด๋ถ ์๋ฎฌ๋ ์ด์ : ์ธ๋ถ ํ๊ฒฝ ์์ด๋ ๋ชจ๋ธ ์ค์ค๋ก๊ฐ ๊ฐ์์ ์๋๋ฆฌ์ค๋ฅผ ๋ง๋ค์ด ๋ด๊ณ , ๊ทธ ์์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉฐ ์ง์์ ์๋ ๋ฐฉ์์ ๋๋ค. ๋ง์น ์์ค ์ ์ฃผ์ธ๊ณต์ฒ๋ผ ๋ณต์กํ ์ด์ผ๊ธฐ ์์์ ๋ค์ํ ์ํฉ์ ๊ฒช์ผ๋ฉฐ ๊ฒฝํ์ ์ถ์ ํ๋ ๊ฒ๊ณผ ๋น์ทํฉ๋๋ค.
์ง์์ ๊ตฌ์กฐํ: ๋จ์ํ ์ธ๋ถ ์ ๋ณด๋ฅผ ๋ฐ์๋ค์ด๋ ๊ฒ์ด ์๋๋ผ, ์ค์ค๋ก ์ง์์ ๋ ผ๋ฆฌ์ ์ผ๋ก ์ฐ๊ฒฐํ๊ณ ์ฌ๊ตฌ์ฑํ๋ฉฐ ์๋ก์ด ๊ฐ๋ ์ ์ฐฝ์กฐํ๋ ๋จ๊ณ์ ์ด๋ฅด๋ ๊ฒ๋๋ค.
์ด๋ฐ ์ ๊ทผ์, ์ฒ ํ์ ์ผ๋ก๋ ์ ๋ฅด์ฟค์ ์๊ฐ๊ณผ ์ผ๋งฅ์ํตํ๋ ์ธก๋ฉด๋ ์์ด ๋ณด์ ๋๋ค - โ๋ฌผ๋ฆฌ์ ์ธ ์ธ๊ณโ๋ฅผ ๋์์ผ๋ก ํ๋๋, โ์ง์ ์ธ ์ธ๊ณโ๋ฅผ ๋์์ผ๋ก ํ๋๋์ ์ฐจ์ด๋ ์์ง๋ง์.
์๊ฐ์ด ์ง๋๊ณ ์ฐ๋ฆฌ ์์ ์ ๋์๋ณผ ์ ์๋ค๋ฉด, ์ง๋ 2024๋ ์ ๋ํ์ ์ธ ๋ชจ์ต์ด '์ฑ๋ด๊ณผ์ ๋ํ'์๋ค๋ฉด, 2025๋ ์ ๋ํ์ ๊ธด ๋ชจ์ต์ 'AI์์ ์ฝ๋ฉ'์ด ๋ ๊ฑฐ๋ผ๊ณ ์๊ฐํฉ๋๋ค. ์๋๋ ๋, ์๊ธฐ๊ฐ ์ฌ์ฉํ๋ ์ฝ๋ฉ ์ํฌํ๋ก์ฐ๋ฅผ ์ฌ๋ฌ ๊ฐ์ ์ธต์๋ก ๋๋์ด ์ค๋ช ํ๋๋ฐ์:
Cursor Autocomplete: ๊ฐ๋ฒผ์ด - ๊ทธ๋ ๊ฒ ๋๊ท๋ชจ ๊ฐ๋ฐ์ด ํ์ํ์ง ์์ - ์๋๋ฅผ ๋น ๋ฅด๊ฒ ์ฝ๋๋ก ๋ง๋ค๊ณ ์ถ์ ๋ ์ฌ์ฉํฉ๋๋ค.
โHighlight-and-editโ: ์ค๊ฐ ์ ๋ ๊ท๋ชจ์ ํด๋นํ๋ ์ฝ๋๋ฅผ ๋ค๋ฌ์ ๋ ์ ์ฉํ ์ ๋ต์ ๋๋ค.
Claude Code/Codex: ๋๊ท๋ชจ์ ์์ ์ด๋, ์ผํ์ฑ ์ ํธ๋ฆฌํฐ๋ฅผ ๋ง๋ค ๋ ์ฃผ๋ก ํ์ฉํฉ๋๋ค.
GPT-5 Pro: ์ต๊ณ ์ ๋๋ฒ๊ฑฐ์ด์ ๋ฆฌ์์น ๋๊ตฌ๋ก์ ์ฌ์ฉํ๋ค๊ณ ํฉ๋๋ค.
์ง๋ 1๋ ๊ฐ AI ๊ธฐ๋ฐ ์ฝ๋ฉ์ด ์ผ๋ง๋ ๋ฐ์ ํ๋์ง ๋์ด์ผ๋ณด๋ฉด, ๋ง์น ์ฝ๋์ โํฌ์์ฑโ์ด ์ฌ๋ผ์ง ์๋ - ๋์งํธ ํ๋ฆ ์๋์ ํ๋ฆ์ ํฌ์์ฑ์ด ์ฌ๋ผ์ก๋ ๊ฒ์ฒ๋ผ์ - ๊ฐ ์๋๊ฐ ํฉ๋๋ค. ์ด์ ์์ฒ ์ค์ ์ฝ๋๋ฅผ ๋ง๊ตฌ ๋ถ๋ด์์ด ์์ฑํ๊ณ ๋ฒ๋ฆด ์๋ ์์ฃ . ๋๋ถ์ ์ฝ๋๋ฅผ '์ฐ๋' ๊ฒ์ ๋ํ ๋ถ๋ด์ ์ค์ด๋ค์์ง๋ง, ์ด์ ๋ ์ฌ๋ฌ AI ๋๊ตฌ๋ค์ ์ฎ์ด ๋๊ฐ๋ฉด์๋ ์๊ธฐ๋ง์ ๊ฐ๊ฐ, ์ถ์ํ ๋ฅ๋ ฅ, ๋ฐฉํฅ์ฑ์ ์์ง ์๋ ๊ฒ ์ค์ํ ๊ณ ๋ฏผ์ด ๋์์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด, ๊ฐ๋ฐ์์ ์ญํ ์ ์์ผ๋ก ์ด๋ป๊ฒ ์ ์๋๊ณ , ์ฃผ๋์ด ๊ฐ๋ฐ์๋ ์ด๋ป๊ฒ ํ๋ จํ๊ณ ๋ฐฐ์์ผ ํ ๊น์?
AI๊ฐ ์ฝ๋ฉ์ ๋ง์ ๋ถ๋ถ์ ๋์ ํ๋ ์๋์ ๊ฐ๋ฐ์์ ์ญํ ์ ๋ฌ๋ผ์ง ์๋ฐ์ ์์ฃ . ์์ ์ ๊ฐ๋ฐ์๊ฐ '์ฝ๋๋ฅผ ์ฐ๋ ์ฌ๋'์ด์๋ค๋ฉด, ์ด์ ๋ 'AI๋ฅผ ์งํํ๋ ์ฌ๋'์ด ๋์ด์ผ ํ๋ค๊ณ ๋ค ์ด์ผ๊ธฐ ๋ง์ด ํฉ๋๋ค:
์ค๊ณ์ (Architect): ๋ณต์กํ ์์คํ ์ ์ ์ฒด ๊ตฌ์กฐ๋ฅผ ์ค๊ณํ๊ณ , AI๊ฐ ์์ฑํ ์ฝ๋ ์กฐ๊ฐ๋ค์ ์ด๋ป๊ฒ ์ฐ๊ฒฐํ ์ง ํฐ ๊ทธ๋ฆผ์ ๊ทธ๋ฆฌ๋ ์ญํ ์ ๋๋ค.
์งํ์ (Orchestrator): ์ฌ๋ฌ AI ๋๊ตฌ๋ค์ ์ ์ฌ์ ์์ ๋ฐฐ์นํด์ ์ต์์ ๊ฒฐ๊ณผ๋ฌผ์ ์ป์ด๋ด๋ ๋ฅ๋ ฅ์ด ์ค์ํด์ง๋๋ค. ์ด๋ค ์์ ์ ์ด๋ค AI๋ฅผ ์ธ์ง, ์ด๋ค ์์๋ก ํ์ฉํ ์ง๋ฅผ ๊ฒฐ์ ํด์ผ ํ์ฃ .
๋ฌธ์ ํด๊ฒฐ์ฌ (Problem Solver): AI๊ฐ ์ฝ๊ฒ ํด๊ฒฐํ์ง ๋ชปํ๋ ์ฐฝ์์ ์ด๊ฑฐ๋ ์ถ์์ ์ธ ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ํด๊ฒฐํ๋ ๋ฅ๋ ฅ์ ์ฌ์ ํ ์ฌ๋์ ๋ชซ์ ๋๋ค. AI์ ๋์์ ๋ฐ๋๋ผ๋, ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ ์ ๋ณธ์ง์ ๊ฟฐ๋ซ์ด ๋ณด๋ ํต์ฐฐ๋ ฅ์ด ์ค์ํด์ง๋๋ค.
์ฃผ๋์ด ๊ฐ๋ฐ์๋, ๋จ์ํ ์ฝ๋ฉ์ ๋ฌธ๋ฒ์ ์ง์คํ๊ธฐ๋ณด๋ค๋, AI๋ฅผ ํ์ฉํ๋ฉด์๋ ํํํ ๊ธฐ์ด๋ฅผ ๋ค์ง ์ ์๋ ๋ผ๋๋ฅผ ๋ง๋ค์ด๊ฐ์ผ ํฉ๋๋ค:
'์?'์ ์ง์คํ๊ธฐ: AI๊ฐ ์ฝ๋๋ฅผ ์์ฑํด์ฃผ๋๋ผ๋, ๊ทธ ์ฝ๋๊ฐ ์ ๊ทธ๋ ๊ฒ ์๋ํ๋์ง ์๋ฆฌ๋ฅผ ์ดํดํ๋ ค ๋ ธ๋ ฅํด์ผ ํฉ๋๋ค. ์ฝ๋ฉ ๋ฌธ๋ฒ๋ณด๋ค๋ ์ปดํจํฐ ๊ณผํ์ ๊ธฐ๋ณธ์ ์ธ ์๋ฆฌ, ๋ฐ์ดํฐ ๊ตฌ์กฐ, ์๊ณ ๋ฆฌ์ฆ์ ๊น์ด ์๊ฒ ๊ณต๋ถํ๋ ๊ฒ์ด ํจ์ฌ ์ค์ํด์ง๋๋ค.
๋๋ฒ๊น ๋ฅ๋ ฅ ํค์ฐ๊ธฐ: AI๊ฐ ์์ฑํ ์ฝ๋์๋ ๋ฒ๊ทธ๊ฐ ์์ ์ ์์ต๋๋ค. AI๊ฐ ๋ง๋ค์ด๋ธ ์์ญ, ์๋ฐฑ ์ค์ ์ฝ๋์์ ๋ฌธ์ ๋ฅผ ์ฐพ์๋ด๊ณ ํด๊ฒฐํ๋ ๋ฅ๋ ฅ์ ์ฌ์ ํ ๊ฐ๋ฐ์์ ํต์ฌ ์ญ๋์ ๋๋ค.
์ ๊ทน์ ์ธ '์งํ' ์ฐ์ต: AI์๊ฒ ๋จ์ํ "์ด ์ฝ๋๋ฅผ ๋ง๋ค์ด์ค"๋ผ๊ณ ๋งํ๋ ๊ฒ๋ณด๋ค, "์ด๋ฐ ๊ธฐ๋ฅ์ ๊ฐ์ง ์ฝ๋๋ฅผ ๋ง๋ค๋, A, B, C์ ๊ฐ์ ์กฐ๊ฑด๊ณผ ๊ตฌ์กฐ๋ฅผ ์ ์ฉํด์ค"๋ผ๊ณ ๊ตฌ์ฒด์ ์ผ๋ก ์ง์ํ๋ ์ฐ์ต์ ํด์ผ ํฉ๋๋ค. ์ด๋ ๊ณง ๋ ผ๋ฆฌ์ ์ฌ๊ณ ๋ ฅ๊ณผ ๋ฌธ์ ์ ์ ๋ฅ๋ ฅ์ ๊ธธ๋ฌ์ค๋๋ค.
๊ฒฐ๊ตญ AI๋ ๋ฐ์ด๋ '๋๊ตฌ'์ผ ๋ฟ์ ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ค์ํ ๊ฑด ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ ์ธ๊ฐ์ ์๋์ ์ค๋ ฅ์ด์ฃ . AI ์๋์ ์ฃผ๋์ด ๊ฐ๋ฐ์๋ ์ฝ๋๋ฅผ ๋น ๋ฅด๊ฒ '์น๋' ๋ฐฉ๋ฒ์ ๋ฐฐ์ฐ๊ธฐ๋ณด๋ค, ์ฝ๋๋ฅผ ๊น์ด ์๊ฒ '์ดํดํ๊ณ , ์ค๊ณํ๊ณ , ์งํํ๋' ๋ฅ๋ ฅ์ ํค์์ผ ํ ๊ฒ๋๋ค. (์์ ์๋ ์ด๋ฐ ๋ฅ๋ ฅ์ ์ค์ํ์ฃ )
์ง๋ 8์ 9์ผ, ์๋๋ ๋ ์ฃผ์ AI ๋ชจ๋ธ๋ค์ ๋ํด์ ์ฝ๊ฐ์ ๋ถํธํ ๋ง์์ ๋๋ฌ๋์ต๋๋ค. ๋ชจ๋ธ๋ค์ด ๋ง์น โ์ํ ๋ชจ๋โ์ ๋ค์ด๊ฐ ๊ฒ์ฒ๋ผ ํ๋ํ๋ค๋ ๊ฑด๋ฐ์ - ๊ทธ๋ฅ ๊ฐ๋ณ๊ฒ ํ์ธํ ์ฌํญ์ด ์์ด์ ์ง๋ฌธ์ ํ๋๋ฐ ๋ชจ๋ธ์ด ๋ช ๋ถ์ฉ์ด๋ ์ถ๋ก ์ โํด๋๊ณ โ, ๋ฆฌํฌ์งํ ๋ฆฌ๋ฅผ ๋ค์ง๊ณ , ์ด๋ค ๊ฒฝ์ฐ๋ ๊ณผ๋ํ๊ฒ ๋ถ์์ ํ๋ค๋ ๊ฒ๋๋ค. ์ด๊ฑด ์๋ง ๋ฒค์น๋งํฌ์ ํ๊ฐ ๋ฐฉ์์ด ๋ชจ๋ธ๋ก ํ์ฌ๊ทผ โ์ง๋์น๊ฒ ์๊ฐโํ๋ ๋ฐฉํฅ์ผ๋ก ํ๋ จ์์ผฐ๊ธฐ ๋๋ฌธ์ด๊ฒ ์ฃ .
์ฐ๋ฆฌ ์ธ๊ฐ์ ์ง๊ด์ ์ผ๋ก '๋น ๋ฅด๊ฒ ํ์ธํ๋ฉด ๋ ๊ฒ'๊ณผ '๋ ์๊ฐ์ง๋ฆฌ ์ฌ์ธต ๋ถ์์ ํด์ผ ๋๋ ๊ณผ์ โ์ ์ฐจ์ด๋ฅผ ํ์ ํด ๋ ๋๋ค. ํ์ง๋ง ๋ชจ๋ธ์ ๊ทธ ์ฐจ์ด๋ฅผ ๋ชจ๋ฅด๋ ๊ฑฐ์ฃ . ์๋๋ ๋, ์ฌ๊ธฐ์ ๋น ์ง ํต์ฌ ์์๋ฅผ '์๋ ์ฑ๋(Intent Channel)'์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค: LLM์๊ฒ ์ฐ๋ฆฌ๊ฐ ์๋๋ฅผ ์ํ๋์ง, ๊น์ด๋ฅผ ์ํ๋์ง, ์ง๊ด์ ์ํ๋์ง, ์๋๋ฉด ์๊ฒฉํ ๋ถ์์ ์ํ๋์ง๋ฅผ ์๋ ค์ฃผ๋ ๋ฐฉ์์ด์ฃ .
๋ณดํต ์ด์ผ๊ธฐํ๋ โ๋ผ์ฐํ ์์คํ โ์ด ์ด๋ฐ โ์๋์ ๋ฌธ์ โ๋ฅผ ํด๊ฒฐํ๋๋ฐ ํจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ์ด ๋ ์๋ ์์ต๋๋ค. ๋ผ์ฐํ ์์คํ ์ ์ฌ์ฉ์ ์๋์ ๋ฐ๋ผ์ AI ๋ชจ๋ธ๋ก ๊ฐ๋ ์์ฒญ์ ๊ฐ์ฅ ์ ํฉํ ๊ฒฝ๋ก๋ก ๋ณด๋ด๋ ์ญํ ์ ํ์ฃ - ์ฐ์ฒด๊ตญ์์ ํธ์ง ๋ดํฌ์ ์ ํ ์ฃผ์๋ฅผ ๋ณด๊ณ ๊ฐ์ฅ ๋น ๋ฅธ ๋ฐฐ๋ฌ ๊ฒฝ๋ก๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ์ฒ๋ผ์.
์๋ฅผ ๋ค์๋ฉด:
์ฌ์ฉ์๊ฐ "๊ฐ๋จํ๊ฒ ์ค๋ช ํด์ค"๋ผ๊ณ ์ ๋ ฅํ๋ฉด, ์์คํ ์ ์ด ์์ฒญ์ ๋น ๋ฅด๊ณ ๊ฐ๋ณ๊ฒ ์๋ตํ๋ ๋ชจ๋ธ์ด๋ ๊ฒฝ๋ก๋ก ๋ณด๋ ๋๋ค.
๋ฐ๋ฉด์ "์์ธํ ๋ถ์ํด์ค" ๋๋ "์ด ์ฝ๋์ ๋ชจ๋ ์์ธ ์ํฉ์ ์ฐพ์์ค"๋ผ๋ ์์ผ๋ก ์ ๋ ฅํ๋ฉด, ์์คํ ์ ๋ณต์กํ ์ถ๋ก ๊ณผ ์ฌ๋์๋ ๋ถ์์ ์ ํ๋ ๋ ํฌ๊ณ ๊ฐ๋ ฅํ ๋ชจ๋ธ๋ก ์์ฒญ์ ๋ณด๋ด๊ตฌ์.
์ด๋ ๊ฒ ๋๋ฉด, ์ฌ์ฉ์๊ฐ ๋งค๋ฒ ๊ธธ๊ณ ๋ณต์กํ ํ๋กฌํํธ๋ฅผ ์์ฑํ ํ์ ์์ด, ์๊ธฐ๊ฐ ์๋ํ ๋ฐ์ ๋ง๋ ๋ต๋ณ์ ๋ฐ๋ก ์ป์ ์ ์์ต๋๋ค. AI ๋ชจ๋ธ๋ ๋ถํ์ํ ๊ณผ๋ถํ ์์ด ์ญ๋์ ํจ์จ์ ์ผ๋ก ํ์ฉํ๊ฒ ๋๊ตฌ์.
๊ฒฐ๊ตญ, ๋ผ์ฐํ ์์คํ ์ ์๋๋ ๊ฐ ๋งํ '์๋ ์ฑ๋'์ ๊ตฌํํ๋ ํ์ค์ ์ธ ๊ธฐ์ ๊ธฐ๋ฐ์ด ๋ ์ ์์ต๋๋ค. ์ฌ์ฉ์์ ์๋๋ฅผ ๋ถ์ํ๊ณ , ๊ทธ์ ๋ง๋ AI ๋ชจ๋ธ์ ์ฐ๊ฒฐํด ์ฃผ๋ ๋๋ํ ๊ตํต ์ ๋ฆฌ ์ญํ ์ ํด์ฃผ๋ ๊ฑฐ์ฃ .
LLM์ โ๋ด๋น์น๋ ์ธ๊ณ(้ใ้ใไธ็)โ

๋ด๋น์น๋ ์ธ๊ณ. Image Credit: ๊ท๋ฉธ์ ์นผ๋
์ ๊ฒ๋ ์ด๋ฒ์ ์๋๋ ์นดํ์์ ์ฌ๋ฌ ๊ธ์ ์ ๋ฆฌํด ๋ณธ ์์ ์ ์์ฃผ ์ ์ตํ์ต๋๋ค. 8์์ ์ฌ๋ฆฐ ํฌ์คํธ๋ค์ ๋ค์ ์ญ ์ฝ์ด๋ณด๋, ํ๋์ ์ผ๊ด๋ ํ๋ฆ์ด ๋ณด์๋ค๊ณ ๋ ํ ๊น์? ํ์ง๋ก๊ฐ โ๋ด๋น์น๋ ์ธ๊ณโ๋ฅผ ํฐ๋ํ์ ๋๋งํผ์ ์๋๊ฒ ์ง๋ง์ ^.^;
์๋๋ ์ ์๊ฐ๋ค์ ๋ฐ๋ผ๊ฐ๋ค ๋ณด๋ฉด, LLM์ด๋ผ๋ ๊ธฐ์ , ๊ทธ์ ๊ธฐ๋ฐํ ์๋น์ค๊ฐ ์ด๋๋ก ํฅํ๊ณ ์๋์ง, ๊ทธ๋ฆฌ๊ณ ์ธ๊ฐ๊ณผ AI์ ํ์ ์ด ์์ง ์ด๋ค ๋ถ๋ถ์์ ๋ฏธ์์ฑ์ธ์ง๋ฅผ ๋ณด์ฌ์ฃผ๋ ์ง๋๋ฅผ ์์ํด ๋ณผ ์ ์์ต๋๋ค.
์๋๋ ๊ฐ ๋จธ๋ฆฟ์์ ๊ฐ๊ณ ์๋ ๊ทธ๋ฆผ์, ์ด์ฉ๋ฉด '์ ํ๊ธฐ์ ์ํ๊ณ'๊ฐ์ ๊ฒ์ผ ๊ฒ๋๋ค. ๋ชจ๋ธ์ด ๋จ์ํ ์ฌ๋์ด ๊ธฐ๋กํด ์จ ํ ์คํธ๋ฅผ ์ญ์ทจ, ์๋นํ๋ ๋ชจ์ต์ผ๋ก๋ถํฐ, ์ด์ ๋ ๊ทธ๋ค๋ง์ ํ๊ฒฝ ์์์ ๊ณต๋ถํ๊ณ , ํ๋ํ๊ณ , ์ฝ๋ฉํ๊ณ , ์ถ๋ก ํ๋ ๋ชจ์ต์ผ๋ก ๋์๊ฐ๊ณ ์๋ ๊ฑฐ์ฃ . ๊ฐ๊ฐ์ ๋จ๊ณ๋ง๋ค ์ด๋ป๊ฒ ์ค๊ณํ๊ณ ๊ต์ก/ํ๋ จ์ ํ ์ง, ํ์ ์ ์ด๋ป๊ฒ ๊ตฌ์ฑํด์ผ ํ๋์ง ๋ฑ์ ๋ํด ์๋ก์ด ์ง๋ฌธ๋ค์ด ๋์์ด ์๊ฒจ๋ฉ๋๋ค.
์์ ์ด์ผ๊ธฐํ๋ค์ํผ, 2024๋ ์ด '์ฑ(Chat; ๋ํ)'์ ์๋์๊ณ , 2025๋ ์ด '์ฝ๋(Code)'์ ์๋๋ผ๋ฉด, 2026๋ ์ 'ํ๊ฒฝ(Environments)'์ ์๋๊ฐ ๋ ์ง๋ ๋ชจ๋ฆ ๋๋ค. ๋ชจ๋ธ ๋ฟ๋ง ์๋๋ผ ์ฐ๋ฆฌ ์ฌ์ฉ์๋ค, ์ธ๊ฐ๋ค ์ญ์ ๊ทธ ํ๊ฒฝ ์์์ ์ด๊ณ ์ผํ๋ ๋ฒ์ ๋ฐฐ์์ผ ํ๋ ์๋๊ฐ ์ฌ ํ ๊ตฌ์.
*์์ง ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ ๊ตฌ๋ ์ ํ์ จ๋์? ๊ตฌ๋ ํด ์ฃผ์๋ฉด ๋งค์ฃผ ์ค์ํ AI ๋ด์ค๋ฅผ ์ ๋ฆฌํ ๋ค์ด์ ์คํธ๋ฅผ ๋ฐ์ผ์ค ์ ์์ต๋๋ค!
ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ (Twitter Library) ๐ฆ
AI ๋ชจ๋ธ, ์ค์ค๋ก ๋ง๋ค์ด๋ธ ์ถ๋ ฅ๊ฐ์ด ์ข์ ๊ฒ์ธ์ง ๊ทธ๋ ์ง ์์์ง์ ๋ํ ํผ๋๋ฐฑ์ ๋ฐ๋ ๊ฒ ์์ฃผ ์ค์ํฉ๋๋ค. PO(Policy Optimization; ์ ์ฑ ์ต์ ํ)๋ฅผ ํตํด์ ๋ชจ๋ธ์ ํ๋์ ๋ํ ์ฌ์ฉ์์ ์ ํธ๋, ๊ทธ๋ฆฌ๊ณ ๋ณด์์ด ์ค์ ๋ชจ๋ธ์๊ฒ ์๋ฏธ์๋ ํ๋ จ์ ์ ํธ๋ฅผ ์ฃผ๊ฒ ๋์ฃ .
์ด ๋ถ์ผ๋, PPO, GRPO ๋ฑ ๊ธฐ์กด์ ๋ค์ํ ๋ฐฉ๋ฒ๋ก ์ ํจ์ฌ ๋ฐ์ด๋์ผ๋ฉด์ ๋น ๋ฅด๊ฒ ์งํํ๊ณ ์๋ ๋ถ์ผ์ ๋๋ค. ์ค๋ ํธ์ํฐ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์๋, ์ต์ ์ PO ๊ธฐ๋ฒ 10๊ฐ์ง์ ๋ํด ๊ฐ๋ตํ ์๊ฐํด ๋ณด๊ณ ์ ํฉ๋๋ค:
๊ธ์ฃผ์ ์ฃผ๋ชฉํ ๋งํ ์ ๊ณ ๋ํฅ ๐ฐ
โ๋ฃ๋โ ์๋์ฐจ, ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด๋ค
ํ๋ผ์ดํธํผ(Fraunhofer) ์ฐ๊ตฌ์์ 'ํ์ด๋ง ์นด(Hearing Car)' ํ๋ก์ ํธ๋ ์์จ์ฃผํ์ฐจ์ ๋๋๋๋ก ์ธ๊ฐ์ ์ธ ๋ฅ๋ ฅ, ์ฆ '์ฒญ๊ฐ'์ ๋ถ์ฌํฉ๋๋ค. ๋ผ์ด๋ค๋ ๋ ์ด๋์ ๋ฌ๋ฆฌ, ์ด AI ๊ธฐ๋ฐ ์ํฅ ๊ธฐ์ ์ ์นด๋ฉ๋ผ๊ฐ ๋ฏธ์ฒ ๋ณด์ง ๋ชปํ๋ ์๊ฐ์๋ ์ฌ์ด๋ ์๋ฆฌ, ๋ฏธ๋๋ฌ์ด ๋๋ก ์๋ฆฌ, ์ฌ์ง์ด ์์ด๋ค์ด ๋ ธ๋ ์๋ฆฌ๊น์ง ํฌ์ฐฉํฉ๋๋ค. ๋ค๋ง, ์ฌ๋์ ๋ํ ์๋ฆฌ๋ ์ค์๊ฐ์ผ๋ก ๊ฑธ๋ฌ๋ ๋๋ค. ์ฌ๋ฌ๋ถ์ ์ด๋ป๊ฒ ์๊ฐํ์๋์? ์ํฅ ์ผ์๊ฐ ์ด์ ๋ณด์กฐ ์์คํ ์ ๋ค์ ๋จ๊ณ๋ฅผ ์ด๋๋ ์๋จ์ด ๋ ์ ์์๊น์?
BMW, ํ์ปด๊ณผ ์์ก๊ณ ์์จ์ฃผํ ๊ธฐ์ ์ ๋ณด์ธ๋ค
ํ์ปด๊ณผ BMW๊ฐ ํ๋ ฅํด์ ๊ณต๋ ๊ฐ๋ฐํ ์์จ์ฃผํ ์์คํ '์ค๋ ๋๋๊ณค ๋ผ์ด๋ ํ์ผ๋ฟ(Snapdragon Ride Pilot)'์ด BMW iX3์ ์ฒ์์ผ๋ก ํ์ฌ๋ฉ๋๋ค. ์ด ์์คํ ์ AI ๊ธฐ๋ฐ์ ์ธ์ง ๋ฅ๋ ฅ, ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ ๊ฒฐ์ , ๊ทธ๋ฆฌ๊ณ ํด๋ผ์ฐ๋ ๊ธฐ๋ฐ ํผ๋๋ฐฑ ๋ฃจํ๋ฅผ ๊ฒฐํฉํด์ ์ค์ค๋ก ๋๋ก ์์์ ๋์์์ด ํ์ต์ ํ๋ค๊ณ ํฉ๋๋ค.
ํํ์น, ๋ฏธ๊ตญ ์ ๋ ฅ๋ง์ ๋๊ท๋ชจ ํฌ์
์ฐ์ ์ ๋์ฆ์ ์ง์ ํ์ ํ์ด๋ฐ์ด ์ ๋ฌํ๊ฒ ๋ง์๋จ์ด์ง ๊ฐ์ด๋ฐ, ํํ์น ์๋์ง(Hitachi Energy)๊ฐ ๋ฏธ๊ตญ ๋ด ์์ฐ ์์ค์ 10์ต ๋ฌ๋ฌ๋ฅผ ํฌ์ํฉ๋๋ค. ํนํ ๋ฒ์ง๋์์ฃผ์ 4์ต 5,700๋ง ๋ฌ๋ฌ๋ฅผ ๋ค์ฌ์ ๊ฑฐ๋ํ ๋ณ์๊ธฐ ๊ณต์ฅ์ ์ง์ต๋๋ค. ๋ชฉํ๋ ๋ฏธ๊ตญ์ AI ๋ถ๊ณผ ์ ๋ ฅ๋ง ๋ณต์๋ ฅ์ ๊ฐํํ๋ ๋์์ 800๊ฐ ์ด์์ ์ผ์๋ฆฌ๋ฅผ ์ฐฝ์ถํ๋ ๊ฒ์ด๋ผ๊ณ ํฉ๋๋ค. ์๋์ง ์ ์ฑ ๊ณผ ์ ์กฐ์ ๋ถํ์ด ๋ง๋ฌผ๋ฆฐ, ์ ๊ฑฐ์ ํด์ ์ด์ธ๋ฆฌ๋ ๊ทน์ ์ธ ํ๋ณด๋ผ๊ณ ํ์ง ์์ ์ ์๋ค์.
์๋ง์กด, ๋์ผ๋ก ์ผํํ๋ค

์๋ง์กด ๋ ์ฆ ๋ผ์ด๋ธ. Image Credit: Amazon
์๋ง์กด์ด '๋ ์ฆ ๋ผ์ด๋ธ(Lens Live)'๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๊ธฐ์กด์ ์๋ ์๊ฐ ๊ฒ์ ๋๊ตฌ๋ฅผ ๊ฐํํ ์ด ๊ธฐ๋ฅ์ ์ด์ ์ค์๊ฐ์ผ๋ก ์ํ์ ์ค์บํ๊ณ , AI ๋ฃจํผ์ค(Rufus)์ ํตํฉ๋ ์ธ์ฌ์ดํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์นด๋ฉ๋ผ๋ฅผ ๋น์ถ๊ธฐ๋ง ํ๋ฉด, ์ ํ ๋น๊ต, ์ฅ๋ฐ๊ตฌ๋ ๋ด๊ธฐ, ์์๋ฆฌ์คํธ ์ถ๊ฐ ๊ธฐ๋ฅ์ด ์บ๋ฌ์ ํํ๋ก ํ ๋ฒ์ ๋ํ๋ฉ๋๋ค. ๋ง ๊ทธ๋๋ก ๋์ผ๋ก ๋ณด๋ฉด์ ์ผํํ๋ ๊ฒฝํ์ ๋จธ์ ๋ฌ๋์ด ๊ฐ์ํํ ์ ์ด๋ค์.
์ค์ฐ๋กํฝ, ๊ฑฐ์นจ์๋ ์ฑ์ฅ์ธ
์ค์ฐ๋กํฝ(Anthropic)์ด 130์ต ๋ฌ๋ฌ ๊ท๋ชจ์ ์๋ฆฌ์ฆ F ํฌ์๋ฅผ ์ ์นํ๋ฉด์ 1,830์ต ๋ฌ๋ฌ์ ๊ธฐ์ ๊ฐ์น๋ฅผ ์ธ์ ๋ฐ์์ต๋๋ค. ์ด๋ก์จ ํด๋ก๋(Claude)๋ ๋ช ์ค์๋ถํ ๊ธฐ์ ์ฉ AI ์์ฅ์ ์์ข์ ์ฌ๋๋ค๊ณ ํ ์ ์๊ฒ ๋๋ฐ์. 1๋ ๋ ์ฑ ๋์ง ์์ ๋งค์ถ์ด 10์ต ๋ฌ๋ฌ์์ 50์ต ๋ฌ๋ฌ๋ก ๊ธ์ฆํ๊ณ , ํนํ ํด๋ก๋ ์ฝ๋ ํ๋๋ก 5์ต ๋ฌ๋ฌ์ ์์ต์ ์ฌ๋ ธ์ต๋๋ค. ์ด์ ๋จ์ํ ์ ํ์ด ์๋, ๋ณธ๊ฒฉ์ ์ธ ๋น์ฆ๋์ค ๋ํ์ด๋ผ๊ณ ๋ด์ผ ํ์ง ์์๊น์? ์์ด์ฝ๋(ICONIQ)์ด ํฌ์๋ฅผ ์ฃผ๋ํ๋ฉด์ ์ค์ฐ๋กํฝ์ '์์ ์ฐ์ , ๋น ๋ฅธ ํ์ฅ' ์ ๋ต์ ํฌ๊ฒ ๋ฒ ํ ํ์ต๋๋ค.
์คํAI, โ์คํ ์์งโ์ ์ธ์ํ๋ค
์คํAI๊ฐ ์คํฏ์๊ทธ(Statsig)๋ฅผ ์ธ์ํ๊ณ , ์ฐฝ์ ์ ๋น์ ์ด ๋ผ์ง(Vijaye Raji)๋ฅผ ์ ํ๋ฆฌ์ผ์ด์ CTO๋ก ์๋ช ํ์ต๋๋ค. A/B ํ ์คํ ์ ๋ฌธ ์ ์ฒด๋ก ์๋ ค์ง ์คํฏ์๊ทธ๋ ์ด๋ฏธ ์คํAI๊ฐ ๋น ๋ฅด๊ฒ ์๋น์ค๋ฅผ ๊ฐ์ ํ ์ ์๊ฒ๋ ๋์์ฃผ๋ ํต์ฌ ์์ง์ผ๋ก ์๋ ค์ ธ ์๋๋ฐ, ์ด์ ์คํAI ๋ด๋ถ๋ก ๋ค์ด์๋ค์. ๋น์ ์ด๊ฐ ChatGPT์ Codex ๊ฐ๋ฐ์ ์ด๊ดํ๊ฒ ๋๋ฉด์, ์ด๋ฒ ์ธ์๋ ๋ฐ์ดํฐ ๊ธฐ๋ฐ์ ์๊ฒฉํ ์ ํ ํ๊ฐ/ํ ์คํธ๋ก ์ ํ์ ์์ฑ๋๋ฅผ ๋์ด๊ฒ ๋ค๋ ์ ํธ๋ก ํด์๋ฉ๋๋ค.

Image Credit: OpenAI M&A (CBInsights)
ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์ํ์ด ์ฝ๊ณ ์๋ ๊ฒ๋ค
gpt5 is smarter than you are by Will Schenk
GPT-5, ๋จ์ํ ์ ๋ณด๋ฅผ ์ฐพ๋ ๋๊ตฌ๋ฅผ ๋์ด์, ์๊ฐ์ ๊ฒฝ๊ณ๋ฅผ ํ์ฅํ๋ ์๋ก์ด ํํธ๋๊ฐ ๋๊ณ ์์ต๋๋ค. ์ ์ ํฌ(Will Schenk)๋ GPT-5๊ฐ ์ด์ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ ์ ์์ ์ ๋๋ก ๋๋ํ๋ค๊ณ ์ฃผ์ฅํฉ๋๋ค.
์์ ์ ํํ ๋ต์ด ์ ํด์ง์ง ์์ ๋ณต์กํ ์ง๋ฌธ, ์๋ฅผ ๋ค์ด์ ์ฌ๋ฆฌํ ์ด๋ก ๊ณผ ์ค๋งํธํฐ ์ค๋ ์ ๊ด๊ณ, ํน์ ์ ๋น์ฃผ์ ์ฒ ํ ๊ฐ๋ ์ฒ๋ผ ๋ต์ด ๋ชจํธํ ์ฃผ์ ๋ค์ GPT-5์๊ฒ ๋์ ธ๋ณด๋๋ฐ์. GPT-5๋ ๋๋๊ฒ๋ ๋ฐฉ๋ํ ์ง์์ ์ฎ์ด๋ด๊ณ , ๋ณต์กํ ๊ฐ๋ ์ฌ์ด์ ์จ๊ฒจ์ง ์ฐ๊ฒฐ๊ณ ๋ฆฌ๊น์ง ์ฐพ์๋ด๊ธฐ๋ ํ์ต๋๋ค. ์ด ๊ณผ์ ์์ ์์ GPT-5์ ๋ต๋ณ์ด '์ ํํ์ง'๋ฅผ ํ๋จํ๋ ๊ฒ ์์ฒด๊ฐ ๋ฌด์๋ฏธํ ์ ์๋ค๊ณ ๋๋๋๋ค. ์คํ๋ ค ์ค์ํ ๊ฒ์, ์ ํด์ง ๋ต์ ์ฐพ๋ ๊ฒ์ด ์๋๋ผ ์์ด๋์ด๋ฅผ ํ์ํ๊ณ ์ดํด๋ฅผ ๋ํ๋ ๊ณผ์ ์ด๋ผ๋ ๊ฒ์ ๊นจ๋ซ๊ฒ ๋ ๊ฑฐ์ฃ .
๊ฒฐ๊ตญ ์์ GPT-5๊ฐ ๋จ์ํ ๊ฒ์ ์์ง์ ๋์ด์, ์ธ๊ฐ์ ์ง์ ํธ๊ธฐ์ฌ์ ์๊ทนํ๊ณ ์๋ก์ด ์ง๋ฌธ์ ๋์ง๊ฒ ๋ง๋๋ ์ง์ ํ '๋ํ ์๋'๊ฐ ๋์ด๊ฐ๊ณ ์๋ค๊ณ ๋งํฉ๋๋ค. ๋ง์น ์์ด๋ค์ด ๋ต๋ณด๋ค ์ง๋ฌธ ์์ฒด๋ฅผ ์ฆ๊ธฐ๋ ๊ฒ์ฒ๋ผ, GPT-5๋ ์ฐ๋ฆฌ๊ฐ ๊ทธ๋์ ๋์ง ๊ณณ์ด ์์๋ ์๋ง์ ์ง๋ฌธ๋ค์ ํ์ด๋์ ์ ์๋ ๊ณต๊ฐ์ด ๋์ด์ฃผ๊ณ ์์ต๋๋ค.
Are we truly on the verge of the humanoid robot revolution? by US Berkeley News
UC ๋ฒํด๋ฆฌ์ ๋ก๋ด ๊ณตํ์ ์ผ ๊ณจ๋๋ฒ๊ทธ(Ken Goldberg) ๊ต์๋, โํด๋จธ๋ ธ์ด๋ ๋ก๋ด์ ํ๋ช ์ด ๊ณง ์ฌ ๊ฒโ์ด๋ผ๋ ์ผ๋ถ ๊ธฐ์ ๋ฆฌ๋๋ค์ ์ฃผ์ฅ์ ํ์์ ์ธ ์๊ฐ์ ๋๋ฌ๋์ต๋๋ค. AI ์ฑ๋ด์ด ๋ฐฉ๋ํ ์ธํฐ๋ท ๋ฐ์ดํฐ๋ก ๋น ๋ฅด๊ฒ ํ์ตํ ๊ฒ๊ณผ ๋ค๋ฅด๊ฒ, ๋ก๋ด์ ํ์ค ์ธ๊ณ์ ๋์์ ๋ํ ๋ฐ์ดํฐ๊ฐ ํฑ์์ด ๋ถ์กฑํด์ ์ง๋ฅ์ ๋น ๋ฅด๊ฒ ์ต๋ํ๊ธฐ ์ด๋ ต๋ค๋ ๊ฑด๋ฐ์. ํนํ ์ ๋ฆฌ์์ ์ก๊ฑฐ๋ ์ ๊ตฌ๋ฅผ ๋ฐ๊พธ๋ ๊ฒ๊ณผ ๊ฐ์ ์ฌ์ธํ ์์ฌ์ฃผ๊ฐ ํ์ํ ์์ ์์ ๋ก๋ด์ด ์ฌ์ ํ ์ด๋ ค์์ ๊ฒช๋ ์ด์ ๊ฐ ๋ฐ๋ก ์ฌ๊ธฐ์ ์๋ค๊ณ ํฉ๋๋ค. ๊ณจ๋๋ฒ๊ทธ ๊ต์๋ ์์ผ๋ก ๋ก๋ด์ด ์ค์ค๋ก ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ํ์ตํ ์ ์๋๋ก ํ๋ ๊ฒ์ด ์ค์ํ๊ณ , ๋น๋ถ๊ฐ์ ๋ธ๋ฃจ์นผ๋ผ ์ง์ ๋ณด๋ค ๋ฌธ์ ์์ฑ๊ณผ ๊ฐ์ ์ผ๋ถ ํ์ดํธ์นผ๋ผ ์ง์ ์ด ๋ ๋น ๋ฅด๊ฒ ์๋ํ๋ ๊ฐ๋ฅ์ฑ์ด ๋๋ค๊ณ ๋ด๋ค๋ดค์ต๋๋ค.
๋ฏธ๊ตญ ์ต๋ ๊ธ์ฌ ์ํํธ์จ์ด ์ฌ์ ์์ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ์คํ ํฌ๋์ ์๋ก์ด ์ฐ๊ตฌ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด, ์์ฑํ AI๊ฐ ๋ ธ๋ ์์ฅ์ ์์๋ณด๋ค ๋น ๋ฅด๊ฒ ์ํฅ์ ๋ฏธ์น๊ณ ์๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ํนํ, AI์ ๊ฐ์ฅ ๋ง์ด ๋ ธ์ถ๋ ์ง์ ๊ตฐ์ ์ข ์ฌํ๋ ์ฌํ ์ด๋ ์(22~25์ธ)๋ค์ด ๊ฐ์ฅ ํฐ ํ๊ฒฉ์ ์ ๊ณ ์์ต๋๋ค.
์ฐ๊ตฌ๋ AI๊ฐ ๋๋ฆฌ ๋ณด๊ธ๋ ์ดํ, ์ด ์ฌ๋๋ค์ ๊ณ ์ฉ๋ฅ ์ด ๋ค๋ฅธ ์ง์ ๊ตฐ์ ๊ทผ๋ก์๋ค๋ณด๋ค ์๋์ ์ผ๋ก 13% ๊ฐ์ํ๋ค๋ ์ฌ์ค์ ๋ฐํ๋์ต๋๋ค. ๋ฐ๋ฉด์, AI ๋ ธ์ถ๋๊ฐ ๋ฎ์ ์ง์ ์ด๋ ๊ฐ์ ์ง์ ๊ตฐ์ด๋ผ๋ ๊ฒฝ๋ ฅ์ด ๋ง์ ์๋ จ๋ ๊ทผ๋ก์๋ค์ ๊ณ ์ฉ์ ์์ ์ ์ผ๋ก ์ ์ง๋๊ฑฐ๋ ๊ณ์ ์ฆ๊ฐํ์ต๋๋ค.
์ด๋ฒ ๋ณํ๋ ๊ธ์ฌ๊ฐ ์๋ '๊ณ ์ฉ' ๊ฐ์๋ผ๋ ํํ๋ก ๋ํ๋๊ณ ์๋๋ฐ, AI๊ฐ ์ธ๊ฐ์ ์ ๋ฌด๋ฅผ '๋ณด์กฐ'ํ๋ ์ญํ ๋ณด๋ค๋ '์๋ํ'ํ๋ ๊ฒฝํฅ์ด ๊ฐํ ์ง์ ๊ตฐ์์ ๋๋๋ฌ์ง๊ฒ ๊ด์ฐฐ๋์์ต๋๋ค. AI ํ๋ช ์ด ๋ฏธ๊ตญ ๋ ธ๋ ์์ฅ์ ์ ์ ๊ทผ๋ก์๋ค์๊ฒ ๋ถ๊ท ํ์ ์ผ๋ก ํฐ ์ํฅ์ ๋ฏธ์น๊ธฐ ์์ํ๋ค๋ ๊ฐ์ค์ ๋ท๋ฐ์นจํ๋ ๊ฐ๋ ฅํ ์ฆ๊ฑฐ๋ผ๊ณ ํ ์ ์๊ฒ ์ต๋๋ค.
์ฒดํฌํด ๋ณผ ๋งํ ๋ฒค์น๋งํฌ (๋งํผ์ ๊ฒ์ ๊ฐ์์!)

Image Credit: Probing LLM Social Intelligence via Werewolf
์ต๊ทผ์ ๋ค์ํ ์๋ฆฌ์์ โ๋ฒค์น๋งํฌโ์ ๋ํ ์ด์ผ๊ธฐ๋ฅผ ๋ง์ด ๋๋ฆฌ๊ธฐ๋ ํ๊ณ , ๋ฃ๊ธฐ๋ ํฉ๋๋ค. AI ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ๋งํผ์ด๋ ๋ด๊ฐ ์ํ๋ ๋ฒค์น๋งํฌ๋ฅผ ๊ตฌ์ฑํ๋ ๊ฒ์ด ์ ๋ง ์ค์ํ์์์?
์ค๋์ LLM์ ์๋ก์ด ๋ฅ๋ ฅ์ ์ธก์ ํ๋ Werewolf ๋ฒค์น๋งํฌ๋ฅผ ์๊ฐํฉ๋๋ค. ์ด ๋ฒค์น๋งํฌ๋ ๋จ์ํ ๋ฌธ์ ํ์ด๋ฅผ ๋์ด์์, ๋ง์น ๋งํผ์ ๊ฒ์์ฒ๋ผ LLM์ด ๋ณต์กํ ์ฌํ์ ์ํธ์์ฉ๊ณผ ์ํต ๋ฅ๋ ฅ์ ์ผ๋ง๋ ์ ์ดํดํ๋์ง ํ๊ฐํฉ๋๋ค. ๋๋, ์ฃผ๋ฏผ ๋ฑ ๋ค์ํ ์ญํ ์ ๋ถ์ฌํด์ ๋ชจ๋ธ์ ์ธ์ด ์ ๋ต๊ณผ ์ถ๋ฆฌ ๋ฅ๋ ฅ์ ์ธก์ ํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค.
Werewolf ๋ฒค์น๋งํฌ๋, ๊ธฐ์กด ๋ฒค์น๋งํฌ์ ๋ค๋ฅด๊ฒ ์ ๋ต์ ๋งํ๋ ๋์ ๋ชจ๋ธ์ ์ ๋ต์ ์ธ ์ํต ๋ฅ๋ ฅ๊ณผ ํ์ํฌ๋ฅผ ํ๊ฐํ๋ ๊ฑธ ๋ชฉํ๋ก ๋ง๋ค์ด์ก์ต๋๋ค. ๊ฒ์ ์ค์ ์์ด๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก Elo ์ ์๋ฅผ ๋งค๊ธฐ๋ ๋ฑ, ๋ชจ๋ธ์ ์ฌํ์ ์ง๋ฅ์ ๋ค์ด๋๋ฏนํ๊ฒ ์ธก์ ํฉ๋๋ค. ๋ฐ๋ก, LLM์ ์ฑ๋ฅ์ ๋จ์ํ ๊ธฐ์ ์ ์ธ ๋ฉด ๋ฟ๋ง ์๋๋ผ ์ฌํ์ ๋งฅ๋ฝ์์๋ ํ๊ฐํ๋ ค๋ ์๋ก์ด ์๋๋ผ๊ณ ํ ์ ์์ ๊ฒ๋๋ค.
์ด ๋ฒค์น๋งํฌ๋ ์ด๋ฏธ Gemini๋ GPT์ ๊ฐ์ ์ฃผ์ LLM์ ํ๊ฐํ๋ ๋ฐ ํ์ฉ๋๊ณ ์์ต๋๋ค. LLM์ด ๋จ์ํ ๋๊ตฌ๋ฅผ ๋์ด์ ์ฐ๋ฆฌ ์ฌํ์ ์ผ์์ผ๋ก์ ๋ ๋์ ์ํต๊ณผ ํ๋ ฅ์ ํ ์ ์๋๋ก ๋๊ธฐ ์ํด ๋ง๋ค์ด์ง Werewolf ๋ฒค์น๋งํฌ. ์ธ๊ณต์ง๋ฅ์ ๋ฏธ๋๊ฐ ๋จ์ํ ๋๋ํ ๊ฒ์ ๋์ด์ ์ธ๊ฐ๊ณผ ๋ ์ ์ํธ์์ฉํ๋ ๋ฐฉํฅ์ผ๋ก ๋์๊ฐ๊ณ ์๋ค๋ ๊ฑธ ๋ณด์ฌ์ฃผ๋ ์ค์ํ ์ฌ๋ก์ ๋๋ค.
์๋ก ๋์จ, ์ฃผ๋ชฉํ ๋งํ ์ฐ๊ตฌ ๋ ผ๋ฌธ
โ์ฃผ๋ชฉํ ๋งํ ์ต์ ์ AI ๋ชจ๋ธโ์ ๋จผ์ ์๊ฐํ๊ณ , ๊ฐ ์์ญ๋ณ๋ก โTop Pickโ์ ํด๋น ๋ ผ๋ฌธ ์์ ๋ณํ(๐)๋ก ํ์ํ์ต๋๋ค!
์ฃผ๋ชฉํ ๋งํ ์ต์ AI ๋ชจ๋ธ
EmbeddingGemma - ์จ๋๋ฐ์ด์ค(On-Device) ๊ฒ์, ํด๋ฌ์คํฐ๋ง, ์์น์ ์ต์ ํ๋ ์คํ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ์ ๊ณตํ๋๋ฐ, ๋ค๊ตญ์ด ํ์ดํ๋ผ์ธ๊ณผ ์๋ฒ ๋ฉ ํฌ๊ธฐ๋ฅผ ์ ์ฐํ๊ฒ ํ ์ ์๊ฒ๋ ์ง์ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
LLaVA-Critic-R1: Your Critic Model is Secretly a Strong Policy Model โ ๊ฐํ ํ์ต์ ํตํด์ ๋ฉํฐ๋ชจ๋ฌ ๋นํ๊ฐ ๋ชจ๋ธ์ ํตํฉ๋ Critic-Policy ๋ชจ๋ธ๋ก ๋ณํํด์, ์์ฑ ๋ฅ๋ ฅ๋ ๊ฐ๋ ฅํ๊ฒ ํ ๋ฟ ์๋๋ผ ์๊ฐ ๋นํ๋ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Kwai Keye-VL 1.5 Technical Report โ Slow-fast ์ธ์ฝ๋ฉ ์ ๋ต, ์ฅ๋ฌธ(Long-context) ํ์ต, ๊ทธ๋ฆฌ๊ณ ์ถ๋ก ์ค์ฌ์ ํ์ ํ์ต์ ํตํด์ MLLM(๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ)์ ๋น๋์ค ์ดํด ๋ฅ๋ ฅ์ ๋ฐ์ ์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Robix: A Unified Model for Robot Interaction, Reasoning and Planning โ ์ฅ๊ธฐ ๊ณผ์ (Long-horizon Tasks)์ ์ํ ๊ณํ, ์คํ, ์ํธ์์ฉ์ ํ๋ ๋จ์ผํ ๋น์ -์ธ์ด ์ ์ฑ ์์์ ๋์ ์์ค์ ๋ก๋ด ๊ณํ๊ณผ ๋ํ๋ฅผ ํตํฉํฉ๋๋ค โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Flavors of Moonshine: Tiny Specialized ASR Models for Edge Devices โ ํจ์จ์ ์ผ๋ก ํ์ต ๋ฐ์ดํฐ๋ฅผ ํผํฉํด์, ์ธ์ด๋ณ๋ก ์ํ ์์ฑ ์ธ์๊ธฐ๋ฅผ ํนํํด์ ์ฃ์ง ํ๋์จ์ด์์์ ์ ํ๋๋ฅผ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ํคํ ์ฒ ๋ฐ ํจ์จ์ฑ (๋ชจ๋ธ, ์ตํฐ๋ง์ด์ , Representations)
๐ Gated Associative Memory: A Parallel O(N) Architecture for Efficient Sequence Modeling (by Rishiraj Acharya) โ ์ดํ ์ (Attention) ๋ฉ์ปค๋์ฆ์ ์ตํฉ๋ ๋ก์ปฌ ์ปจ๋ณผ๋ฃจ์ (Fused Local Convolution)๊ณผ ์ ์ญ์ ์ฐ๊ด ๊ฒ์(Global Associative Retrieval)์ผ๋ก ๋์ฒดํด์ ์ ํ์ ์ผ๋ก ํ์ฅํ ์ ์๊ฒ ํด ์ค๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Fantastic Pretraining Optimizers and Where to Find Them (by Stanford) โ ์๊ฒฉํ ํ๋๊ณผ ์์ฐ ์กฐ๊ฑด ํ์์ ์ฌ๋ฌ ์ตํฐ๋ง์ด์ (Optimizer)๋ฅผ ๋น๊ตํด์, ์ ์ฒด ์๋-ํฌ-์๋ ๊ณผ์ (End-to-End)์์ ์ํญ์ ์๋ ํฅ์๊ณผ Matrix Preconditioners์ ๋ํด์ ๊ท๋ชจ์ ์์กดํ๋ ์ด๋์ด ์๋ค๋ ๊ฒ์ ๋ฐํ๋ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Reasoning Vectors: Transferring Chain-of-Thought Capabilities via Task Arithmetic โ GRPO ๋ชจ๋ธ๊ณผ SFT ๋ชจ๋ธ ์ฌ์ด์ ์ถ๋ก ๋ธํ(Reasoning Delta)๋ฅผ ์ถ์ถํ๊ณ , ์ด๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์ ์ฉํด์ ๋ค์ด์คํธ๋ฆผ ๊ณผ์ (Downstream)์์์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์์ด์ ํธ ๋ฐ ๋๊ตฌ ์ฌ์ฉ (GUI, ์ํํธ์จ์ด ๊ณตํ, ๋ฉํฐํด ๋๊ตฌ)
UI-TARS-2 Technical Report: Advancing GUI Agent with Multi-Turn Reinforcement Learning โ ๋ฐ์ดํฐ ํ๋ผ์ดํ (Data Flywheels), ์์ ํ๋ ๋ฉํฐํด ๊ฐํํ์ต(RL), ํ์ด๋ธ๋ฆฌ๋ OS ํ๊ฒฝ์ ํ์ฉํด์ ๋ค์ดํฐ๋ธ GUI ์์ด์ ํธ๋ฅผ ํ์ฅํ๊ณ , ์ฌ๋ฌ ๋ฒค์น๋งํฌ์ ๊ฑธ์น(Cross-Benchmark) ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use โ ์ฌ๋ฌ ๋๋ฉ์ธ์ ๊ฑธ์ณ์ ๋น๋๊ธฐ์ ๋กค์์(Asynchronous Rollouts)๊ณผ ๋ชจ๋ํ ๋๊ตฌ API๋ฅผ ํตํฉํด์, ๋ฉํฐํด(Multi-Turn) ๋ฐ ๋๊ตฌ๋ก ๊ฐํ๋(Tool-Augmented) ์์ด์ ํธ๋ฅผ ํ๋ จ์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฌํ ํ๋ จ(Post-training) ๋ฐ ์ถ๋ก ์ต์ ํ (RLVR, SFT ๋ฑ)
Towards a Unified View of Large Language Model Post-Training โ ๊ณตํต๋ ๊ทธ๋๋์ธํธ ์ถ์ ๋(Gradient Estimator) ํ์์ SFT(์ง๋ ๋ฏธ์ธ ์กฐ์ )์ RL(๊ฐํํ์ต)์ ํตํฉํ๊ณ , ์ ํธ๋ฅผ ๋ค์ด๋๋ฏนํ๊ฒ ์ ํํ๋ ํ์ด๋ธ๋ฆฌ๋ ํ์ ํ์ต์ ๋์ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
SimpleTIR: End-to-End Reinforcement Learning for Multi-Turn Tool-Integrated Reasoning โ ์๋ฏธ ์๋ ํด(Void-Turn)์ ๊ถค์ ์ ํํฐ๋งํด์ ๊ทธ๋๋์ธํธ ํญ๋ฐ(Gradient Explosions)์ ๋ฐฉ์งํจ์ผ๋ก์จ, ๋ฉํฐํด(Multi-Turn) ๋๊ตฌ ์ฌ์ฉ์ ์์ ์ ์ผ๋ก ํ ์ ์๊ฒ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Beyond Correctness: Harmonizing Process and Outcome Rewards through RL Training โ ๊ณผ์ -๊ฒฐ๊ณผ ์ผ๊ด์ฑ ํํฐ(Process-Outcome Consistency Filters)๋ฅผ ์ฌ์ฉํด์ ๋ฐ์ดํฐ๋ฅผ ํ๋ ์ด์ ํด์, ์ต์ข ์ ์ธ ์ ํ๋์ ๋จ๊ณ๋ณ ํ์ง์ ํจ๊ป ํฅ์์ํต๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
DCPO: Dynamic Clipping Policy Optimization โ ํด๋ฆฌํ(Clipping) ๊ฒฝ๊ณ๋ฅผ ํ ํฐ ๋จ์๋ก ์กฐ์ ํ๊ณ ์๊ฐ ๊ฒฝ๊ณผ์ ๋ฐ๋ฅธ ์ด๋๋ฐดํฐ์ง(Advantages)๋ฅผ ํํํ(Smooth)ํด์, ๊ทธ๋๋์ธํธ๊ฐ ์ ์ฉํ ์ ๋ณด๋ฅผ ๋ด๊ณ ํจ๊ณผ์ ์ผ๋ก ์ ์ง๋๋๋ก ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ฐ์ดํฐ ๋ฐ ํ๊ฐ (๋ฒค์น๋งํฌ, ๋ฐ์ดํฐ์ , ์ธก์ )
Open Data Synthesis For Deep Research โ ์ฌ์ธต ์ฐ๊ตฌ(Deep Research)๋ฅผ ๊ณ์ธต์ ์ ์ฝ ๋ง์กฑ(Hierarchical Constraint Satisfaction) ๋ฌธ์ ๋ก ๊ณต์ํํ๊ณ , ๊ฒ์ฆ ๊ฐ๋ฅํ ๋๊ท๋ชจ ๋ค๋จ๊ณ(Multi-Step) ์ง๋ฌธ์ ์์ฑํด์ LLM์ด ์ฆ๊ฑฐ๋ฅผ ์ข ํฉํ๊ฒ๋(Evidence-Synthesizing) ํ๋ จํ๊ณ ํ ์คํธํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth โ ์์ฌ์ ์ผ๋ก๋ ์ญ์ค์ ์ด์ง๋ง ์๋ฏธ ์๋ ํ ์คํธ๋ก ๊ตฌ์ฑ๋ ๋ค๊ตญ์ด ๋ฒค์น๋งํฌ๋ฅผ ๊ตฌ์ถํด์, ์ค์ฉ์ , ๊ฐ์ ์ , ๋๋์ ์ถ๋ก ์ ๊ฒฉ์ฐจ(Inference Gaps)๋ฅผ ํ์ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ LMEnt: A Suite for Analyzing Knowledge in Language Models from Pretraining Data to Representations โ ๊ฐ์ฒด์ ์ฃผ์์ด ๋ฌ๋ฆฐ(Entity-Annotated) ์ฝํผ์ค, ๊ฒ์ ๋๊ตฌ, ๊ทธ๋ฆฌ๊ณ ์ฒดํฌํฌ์ธํธ๋ ๋ชจ๋ธ์ ์ ๊ณตํด์, ์ธ์ด ๋ชจ๋ธ(LM) ๋ด๋ถ์์ ์ฌ์ค(Facts)์ด ์ด๋ป๊ฒ ์ ๋ ฅ๋๊ณ ์งํํ๋์ง๋ฅผ ์ถ์ ํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ The Gold Medals in an Empty Room: Diagnosing Metalinguistic Reasoning in LLMs with Camlang (by Cambridge, Oxford, UIUC) โ ๋ฌธ๋ฒ๊ณผ ์ฌ์ ์ ๊ฐ์ถ ์ธ๊ณต ์ธ์ด(Constructed Language)๋ฅผ ๋์ ํด์, ํจํด ๋งค์นญ๊ณผ๋ ๊ตฌ๋ณ๋๋ ๋ช ์์ ์ธ ๊ท์น ๊ธฐ๋ฐ ์ถ๋ก (Rule-Based Reasoning)์ ํ ์คํธํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
Flaw or Artifact? Rethinking Prompt Sensitivity in Evaluating LLMs โ ํ๊ฐ ํด๋ฆฌ์คํฑ(Evaluation Heuristics)์ด ํ๋กฌํํธ ๋ฏผ๊ฐ๋(Prompt Sensitivity)๋ฅผ ๋ถํ๋ฆฐ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ฃผ๊ณ , 'LLM-as-a-Judge' ํ๋กํ ์ฝ์ ํตํด์ ๋ถ์ฐ(Variance)์ด ๊ฐ์ํ๋ค๋ ๊ฒ์ ์ ์ฆํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์์ , ๊ฐ๋๋ ์ผ ๋ฐ ๋ฐ์ด์ด์ค (์ ์ฑ , ๊ฒ์ธก, ๊ฐ๊ฑด์ฑ)
DynaGuard: A Dynamic Guardrail Model With User-Defined Policies โ ์ ์ ์ธ ๋ถ๋ฅ ์ฒด๊ณ(Static Taxonomies)๋ฅผ ๋์ด์ ์ฌ๋ฌ ๋๋ฉ์ธ์ ๊ฑธ์ณ์, ๋น ๋ฅธ ํ์ง ๋๋ CoT(Chain-of-Thought) ์ ๋นํ๋ฅผ ํตํด์ ์ฌ์ฉ์ ๋ง์ถคํ ์ ์ฑ (Customizable Policies)์ ์ํํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ AMBEDKAR: A Multi-level Bias Elimination through a Decoding Approach with Knowledge Augmentation โ ์ฌํ๋ จ ์์ด ์ถ๋ก ์์ ์ 'ํ๋ฒ ๊ธฐ๋ฐ์ ์ถ์ธก์ฑ ๋์ฝ๋ฉ(Constitution-Guided Speculative Decoding)'์ ์ ์ฉํด์, ๋ฌธํ์ ์ผ๋ก ๋ฌธ์ ๊ฐ ๋๋ ์ ํด์ฑ(Culturally Specific Harms)์ ์ค์ ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ฉํฐ๋ชจ๋ฌ ์์ฑ ๋ฐ ํธ์ง (์ด๋ฏธ์ง, ๊ฐ์ธํ)
MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement โ ๋ค์ค ํผ์ฌ์ฒด ํฉ์ฑ(Multi-Subject Synthesis) ์์ ์์ ํผ์ฌ์ฒด๋ฅผ ๋ชฉํ ์์ญ์ ์ ๋ ฌํ๊ณ ํน์ง๋ค์ ๋ถ๋ฆฌ(Disentangle)ํด์ ๊ฐ ํผ์ฌ์ฒด์ ์ ์ฒด์ฑ์ ๋ณด์กดํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๐ Discrete Noise Inversion for Next-scale Autoregressive Text-based Image Editing โ ์๊ธฐํ๊ท(Autoregressive) ์ํ๋ง ๋ ธ์ด์ฆ๋ฅผ ์ญ์ ์์ผ์, ํ๋กฌํํธ์ ๋ถํฉํ๋ฉด์๋ ๊ตฌ์กฐ๋ฅผ ๋ณด์กดํ๋(Structure-Preserving) ๋ฐฉ์์ผ๋ก ์ด๋ฏธ์ง๋ฅผ ์ฌ๊ตฌ์ฑํ๊ณ ํธ์งํฉ๋๋ค. โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
๋ก๋ณดํฑ์ค ๋ฐ ์ธ์ง ์์ (3D ๊ธฐํํ, Sim-to-Real)
๐ Manipulation as in Simulation: Enabling Accurate Geometry Perception in Robots (by ByteDance) โ ์ฌ๋ ์นด๋ฉ๋ผ(Depth-Camera)์ ๋ ธ์ด์ฆ๋ฅผ ๋ชจ๋ธ๋งํด์ ์ค์ ๊ฑฐ๋ฆฌ ์ธก์ ๊น์ด(Metric Depth)์ ๋ ธ์ด์ฆ๋ฅผ ์ ๊ฑฐํด์, ์๋ฎฌ๋ ์ด์ ์์ ํ๋ จ๋ ์ ์ฑ (Policies)์ด ์ค์ ์กฐ์(Real Manipulation) ํ๊ฒฝ์ผ๋ก ์ง์ ์ ์ด๋ ์ ์๊ฒ๋ ํด ์ค๋๋ค.
โ> [๋ ผ๋ฌธ ๋ณด๊ธฐ]
์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค. ํ๋ฆฌ๋ฏธ์ ๊ตฌ๋ ์๊ฐ ๋์ด์ฃผ์๋ฉด ํ๋ง ํฌ์คํธ ์ฝ๋ฆฌ์์ ์ ์์ ํฐ ๋์์ด ๋ฉ๋๋ค!
Reply