- Turing Post Korea
- Posts
- 2025년 상반기 'AI 101' 되짚기: 5가지 AI 모델
2025년 상반기 'AI 101' 되짚기: 5가지 AI 모델
튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 의미있는 AI 모델들, 다시 한 번 상기해 봅시다

2025년의 상반기를 마무리하는 지금 이 시점에서, 말씀드린 바와 같이 튜링 포스트 코리아는 상반기에 있었던 여러 가지 새로운 기술, 모델 등을 여러분들과 함께 돌아보면서 Recap하는 시간을 가지고 있습니다.
구독자분들이 많이 봐 주시는 ‘AI 101’ 섹션에서 올해 상반기에 포스팅했던 글들을 세 가지 주제로 나눠서 정리하고 있는데요:
핵심적인 기법들 (Methodology & Technique)
주목할 모델들 (AI Models)
AI 영역의 핵심 개념들
오늘은, 그 중 두 번째로, 2025년 1월부터 6월까지 독창적인 접근 방식으로 눈에 띈 모델과 생태계, 도구들에 집중해 봅니다. AI 101 섹션에서 소개된 아래의 주요 사례들을 중심으로 살펴볼 예정입니다:
AlphaEvolve
Codex
Mixture-of-Mamba
World Model
Reasoning Model
이 모델들은 각각 어떻게 작동하고, 어떤 점에서 특별할까요? 지금 바로 핵심 포인트를 함께 살펴보세요!
1. 엔비디아의 'Cosmos WFM 플랫폼'에 대해 알아봅시다!
Physical AI는 지금 많은 기업들이 주목하고 진출하고 있는 분야죠 - 엔비디아도 그런 움직임의 중심에 있습니다.
2025년 초, 엔비디아는 Cosmos World Foundation Model(WFM)이라는 통합 생태계 플랫폼을 공개했고, 이 플랫폼은 지금도 계속 발전하는 중입니다. 이 플랫폼은 Physical AI를 위한 WFM(World Foundation Model)을 생성하고, 학습시키고, 배포하는 데 필요한 도구와 모델들을 포함하고 있습니다.
‘월드 모델(World Model)’은 Physical AI의 핵심 기술로 떠오르고 있는데요. 이번 글에서는 엔비디아가 이 기술을 어떻게 실현하고 있는지, 그 구조와 작동 방식에 대해 함께 살펴봅니다:
2. '월드 모델 (World Models)'이란 무엇인가?
월드 모델(World Model)을 만들기 위해서 꼭 알아야 할 핵심 개념들을 소개합니다. 월드 모델이란, 에이전트(Agent)가 자신의 환경을 학습을 통해서 시뮬레이션한 내부 모델로, 에이전트가 실제 행동을 취하기 전에 미리 상상하고 시도해볼 수 있도록 해주는 역할을 합니다.
이 글에서는 아래와 같은 대표적인 최신의 월드 모델 사례들을 중심으로, 그 작동 원리와 구조를 깊이 있게 살펴봅니다:
구글 딥마인드의 DreamerV3와 Genie 2
엔비디아의 Cosmos WFM
메타의 Navigation World Model (NWM)
월드 모델의 역사부터 최신 발전까지, 그리고 이게 AI의 미래를 위한 핵심적인 퍼즐 조각인 이유를 함께 파헤쳐 봅니다. AI를 더 깊이 이해하고 싶은 개발자, 기획자, 그리고 관심 있는 일반인 모두에게 유익한 내용이라고 생각합니다:
3. 추론 모델, 그냥 진화한 LLM일까? 아니면 완전히 다른 종(種)일까?
2025년의 가장 큰 변화 중 하나는, 아마도 AI가 단순한 답변 생성을 넘어서 ‘천천히, 더 깊이 사고하면서 추론하는 Reasoning Language Model(RLM)’로 발전하고 있다는 점일 겁니다.
이 모델들은 아래와 같은 능력을 갖추고 있습니다:
답변을 단계별로 신중하게 생성하고
시도와 오류를 통해서 학습하고
스스로를 되돌아보고,
외부 도구까지 활용할 수 있습니다.
이제 이런 모델들을 기존 언어 모델과는 구분되는 새로운 범주로 봐야 할까요? 이번 글에서는 그 질문에 대한 답을 찾아보고, 현재 이 범주에 속하는 대표적인 Reasoning 모델들도 함께 정리해 봅니다.
4. MoM (Mixture-of-Mamba)은 무엇인가?
Mixture-of-Mamba(MoM)는 하이브리드 모델의 훌륭한 예시로, 기존의 Mamba 아키텍처를 한층 확장한 형태입니다.
이 모델은 두 가지 핵심 개념을 결합해서 빠르고 효율적인 멀티모달 처리 능력을 갖추고 있습니다:
Mixture-of-Transformers 개념을 도입해서 다양한 처리 경로를 유연하게 활용하고,
모달리티 인식 희소성(Modality-aware Sparsity)을 적용해서, 텍스트, 이미지, 오디오 등 서로 다른 데이터 유형에 따라 필요한 부분만 선택적으로 처리합니다.
이 글에서는, ‘Mamba의 선택적 상태 공간 모델(Selective State Space Model, SSM)’이 어떻게 이런 기법들을 활용해서 멀티모달 데이터를 효과적으로 다룰 수 있는지 그 구조와 작동 방식을 자세히 설명합니다.
멀티모달 AI의 최신 진화 방향을 이해하는 데 꼭 필요한 내용입니다:
5. AlphaEvolve와 Codex가 멋진 이유
AlphaEvolve와 Codex는 전통적인 의미의 AI 모델이라기보다는, 실제의 문제 해결을 위한 강력한 도구이자 협업형 에이전트에 가깝습니다. 그래서 더욱 주목할 가치가 있죠.
AlphaEvolve는 구글 딥마인드가 개발한 ‘진화’ 기반의 코딩 에이전트로, 새로운 알고리즘이나 과학적 해결책을 스스로 탐색합니다. 하드웨어 설계 같은 공학적 알고리즘도 최적화할 수 있고, 복잡한 문제 해결 능력을 갖추고 있습니다.
OpenAI의 Codex는 ‘클라우드 기반의 자율 소프트웨어 엔지니어(A-SWE)’로, ChatGPT 안에서 마치 가상의 동료처럼 동작합니다. 코드 저장소를 안전하게 다루고, 코드를 작성하고, 테스트하고, 오류를 수정하는 작업을 스스로 수행합니다.
이 글에서는 이 두 가지 도구가 어떻게 실제의 개발 업무를 더 실용적이고 편리하게 바꾸고 있는지, 그리고 그 작업 방식(워크플로우)은 어떻게 구성되어 있는지를 자세히 살펴봅니다.
코딩과 엔지니어링 최적화의 미래, 지금 확인해 보세요:
읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!
Reply