• Turing Post Korea
  • Posts
  • 2025년 상반기 'AI 101' 되짚기: 5가지 AI 모델

2025년 상반기 'AI 101' 되짚기: 5가지 AI 모델

튜링포스트 코리아 'AI 101 섹션'에서 다룬 것들 중 가장 의미있는 AI 모델들, 다시 한 번 상기해 봅시다

2025년의 상반기를 마무리하는 지금 이 시점에서, 말씀드린 바와 같이 튜링 포스트 코리아는 상반기에 있었던 여러 가지 새로운 기술, 모델 등을 여러분들과 함께 돌아보면서 Recap하는 시간을 가지고 있습니다.

구독자분들이 많이 봐 주시는 ‘AI 101’ 섹션에서 올해 상반기에 포스팅했던 글들을 세 가지 주제로 나눠서 정리하고 있는데요:

  1. 핵심적인 기법들 (Methodology & Technique)

  2. 주목할 모델들 (AI Models)

  3. AI 영역의 핵심 개념들

오늘은, 그 중 두 번째로, 2025년 1월부터 6월까지 독창적인 접근 방식으로 눈에 띈 모델과 생태계, 도구들에 집중해 봅니다. AI 101 섹션에서 소개된 아래의 주요 사례들을 중심으로 살펴볼 예정입니다:

  • AlphaEvolve

  • Codex

  • Mixture-of-Mamba

  • World Model

  • Reasoning Model

이 모델들은 각각 어떻게 작동하고, 어떤 점에서 특별할까요? 지금 바로 핵심 포인트를 함께 살펴보세요!

1. 엔비디아의 'Cosmos WFM 플랫폼'에 대해 알아봅시다!

Physical AI는 지금 많은 기업들이 주목하고 진출하고 있는 분야죠 - 엔비디아도 그런 움직임의 중심에 있습니다.

2025년 초, 엔비디아는 Cosmos World Foundation Model(WFM)이라는 통합 생태계 플랫폼을 공개했고, 이 플랫폼은 지금도 계속 발전하는 중입니다. 이 플랫폼은 Physical AI를 위한 WFM(World Foundation Model)을 생성하고, 학습시키고, 배포하는 데 필요한 도구와 모델들을 포함하고 있습니다.

‘월드 모델(World Model)’은 Physical AI의 핵심 기술로 떠오르고 있는데요. 이번 글에서는 엔비디아가 이 기술을 어떻게 실현하고 있는지, 그 구조와 작동 방식에 대해 함께 살펴봅니다:

2. '월드 모델 (World Models)'이란 무엇인가?

월드 모델(World Model)을 만들기 위해서 꼭 알아야 할 핵심 개념들을 소개합니다. 월드 모델이란, 에이전트(Agent)가 자신의 환경을 학습을 통해서 시뮬레이션한 내부 모델로, 에이전트가 실제 행동을 취하기 전에 미리 상상하고 시도해볼 수 있도록 해주는 역할을 합니다.

이 글에서는 아래와 같은 대표적인 최신의 월드 모델 사례들을 중심으로, 그 작동 원리와 구조를 깊이 있게 살펴봅니다:

  • 구글 딥마인드의 DreamerV3와 Genie 2

  • 엔비디아의 Cosmos WFM

  • 메타의 Navigation World Model (NWM)

월드 모델의 역사부터 최신 발전까지, 그리고 이게 AI의 미래를 위한 핵심적인 퍼즐 조각인 이유를 함께 파헤쳐 봅니다. AI를 더 깊이 이해하고 싶은 개발자, 기획자, 그리고 관심 있는 일반인 모두에게 유익한 내용이라고 생각합니다:

3. 추론 모델, 그냥 진화한 LLM일까? 아니면 완전히 다른 종(種)일까?

2025년의 가장 큰 변화 중 하나는, 아마도 AI가 단순한 답변 생성을 넘어서 ‘천천히, 더 깊이 사고하면서 추론하는 Reasoning Language Model(RLM)’로 발전하고 있다는 점일 겁니다.

이 모델들은 아래와 같은 능력을 갖추고 있습니다:

  • 답변을 단계별로 신중하게 생성하고

  • 시도와 오류를 통해서 학습하고

  • 스스로를 되돌아보고,

  • 외부 도구까지 활용할 수 있습니다.

이제 이런 모델들을 기존 언어 모델과는 구분되는 새로운 범주로 봐야 할까요? 이번 글에서는 그 질문에 대한 답을 찾아보고, 현재 이 범주에 속하는 대표적인 Reasoning 모델들도 함께 정리해 봅니다.

4. MoM (Mixture-of-Mamba)은 무엇인가?

Mixture-of-Mamba(MoM)하이브리드 모델의 훌륭한 예시로, 기존의 Mamba 아키텍처를 한층 확장한 형태입니다.

이 모델은 두 가지 핵심 개념을 결합해서 빠르고 효율적인 멀티모달 처리 능력을 갖추고 있습니다:

  • Mixture-of-Transformers 개념을 도입해서 다양한 처리 경로를 유연하게 활용하고,

  • 모달리티 인식 희소성(Modality-aware Sparsity)을 적용해서, 텍스트, 이미지, 오디오 등 서로 다른 데이터 유형에 따라 필요한 부분만 선택적으로 처리합니다.

이 글에서는, ‘Mamba의 선택적 상태 공간 모델(Selective State Space Model, SSM)’이 어떻게 이런 기법들을 활용해서 멀티모달 데이터를 효과적으로 다룰 수 있는지 그 구조와 작동 방식을 자세히 설명합니다.

멀티모달 AI의 최신 진화 방향을 이해하는 데 꼭 필요한 내용입니다:

5. AlphaEvolve와 Codex가 멋진 이유

AlphaEvolveCodex는 전통적인 의미의 AI 모델이라기보다는, 실제의 문제 해결을 위한 강력한 도구이자 협업형 에이전트에 가깝습니다. 그래서 더욱 주목할 가치가 있죠.

  • AlphaEvolve는 구글 딥마인드가 개발한 ‘진화’ 기반의 코딩 에이전트로, 새로운 알고리즘이나 과학적 해결책을 스스로 탐색합니다. 하드웨어 설계 같은 공학적 알고리즘도 최적화할 수 있고, 복잡한 문제 해결 능력을 갖추고 있습니다.

  • OpenAI의 Codex는 ‘클라우드 기반의 자율 소프트웨어 엔지니어(A-SWE)’로, ChatGPT 안에서 마치 가상의 동료처럼 동작합니다. 코드 저장소를 안전하게 다루고, 코드를 작성하고, 테스트하고, 오류를 수정하는 작업을 스스로 수행합니다.

이 글에서는 이 두 가지 도구가 어떻게 실제의 개발 업무를 더 실용적이고 편리하게 바꾸고 있는지, 그리고 그 작업 방식(워크플로우)은 어떻게 구성되어 있는지를 자세히 살펴봅니다.

코딩과 엔지니어링 최적화의 미래, 지금 확인해 보세요:

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

Reply

or to participate.