금주에는 마이크로소프트의 ‘빌드 2025’, 그리고 구글의 ‘I/O 2025’라는 두 개의 아주 대형 행사들이 있었는데요. 저희 튜링 포스트 팀은 마이크로소프트 빌드 2025에 참관하고 많은 사람들과 이야기를 나눴습니다.

아시다시피, 마이크로소프트 ‘빌드’는 5,000명 이상의 개발자, 애널릿트 등이 참석하는 거대한 행사죠. 전반적으로, 올해는 마이크로소프트가 ‘정신을 제대로 차리고’, ‘플랫폼’ 회사로서의 정체성을 다시 정리해서, 소비자가 AI를 비롯한 다양한 기술을 잘 사용하면서 소프트웨어를 만들고 나아가 비즈니스를 연결하는 방식을 ‘완전히 재정의’하도록 할, 일관된 발표가 이어졌던 것 같습니다. 50개가 넘는 발표가 있었지만, 느낌상 이 모든 발표가 ‘하나의 일관된 스토리’ 아래에서 이루어졌다는 생각이 듭니다.

마이크로소프트 ‘빌드 2025’를 통해서, 우리 모두가 ‘에이전틱 웹 (Agentic Web)의 시대로 성큼 성큼 전진하고 있고, AI 에이전트가 가장 중요한 비즈니스의 한 요소로 주목받고 있다’는 점이 명확해졌다고 정리할 수 있을 것 같습니다.

마이크로소프트 빌드 2025에서, 사티아 나델라의 발표 - 오픈 에이전틱 웹

마이크로소프트의 비전에 영향을 받게 될 사용자들, 그리고 생태계의 규모는 이미 엄청나죠: Visual Studio는 현재 5천만 명의 사용자 베이스를 갖고 있고, GitHub는 1억 5천만 명에게 서비스를 제공하고 있구요, GitHub Copilot도 이미 1,500만 명이 넘는 개발자가 사용하고 있으니까요. 이런 엄청난 플랫폼 기반이, 이제 ‘에이전트 중심의 미래’를 위해서 근본적인 업그레이드의 길을 가고 있습니다.

전반적으로 마이크로소프트의 ‘빌드 2025’에서 눈에 띄었던 부분은, ‘AI 에이전트’ 시대로의 전환을 위한 마이크로소프트의 ‘Offering (비전과 제공하는 제품, 플랫폼, 서비스 등)’이 상당히 ‘체계적’이 되었다는 겁니다. 굳이 비교를 하자면, 구글과 같은 경쟁자들이 종종 멋진 기능 - 제품까지는 아니지만 쓸만한 서비스나 제품의 일부 - 을 발표하고 나서 그 나머지는 개발자나 고객들이 알아서 해결하도록 하는 경우가 있는데, 마이크로소프트는 스스로 이야기하는 ‘에이전트 시대’의 비전을 ‘일관성 있으면서도 개방적이고, 통합된 제품과 기술의 스택’으로 묶어냈습니다.

“세상 모든 사람을 마이크로소프트의 생태계 안에 묶어버려야지” 하는, 이전의 인터넷 익스플로러로 저질렀던 것 같은 실수를 반복하지 않겠다는 의지를 분명히 표현했습니다. 물론, 편의성, 일관성, 그리고 엄청난 스케일을 기반으로 고객이 자연스럽게 마이크로소프트의 생태계에 참여하고 싶게끔 할 거고, 거기에는 아무런 문제가 없습니다. 심지어 코딩 에이전트 디자인을 Cursor가 Claude와 똑같이 보이게끔 만들기까지 했어요 - 많은 사람들이 좋은 접근방식이고 훌륭한 디자인이라고 반응을 보이고 있습니다.

이 모든 플랫폼, 제품, 기술 스택을 합쳐서, 마이크로소프트가 꿈꾸는 건 바로 ‘개방적인 에이전틱 웹’입니다. 여기에서 우리가 알아두어야 할 8가지 핵심적인 사항이 있다고 생각합니다:

  • 에이전트 (Agent): 비즈니스를 위한 역할을 수행하는 엔티티, 그리고 MS365의 핵심 요소

    마이크로소프트는, ‘에이전트’를 이야기할 때 ‘업무를 위한 최초의 추론용 에이전트’라는 표현으로 아주 구체적으로 그 역할을 명시하고 있습니다. Microsoft 365 Copilot 업데이트를 보면 더 잘 이해할 수 있는데요, 채팅, 검색, 노트북, 각종 내용의 생성 기능, 그리고 ‘Researcher’나 ‘Analyst’ 같은 특수한 에이전트들을 통합하고 결합했습니다. Copilot Tuning 기능을 사용해서 기업들이 각자 보유한 회사의 지식, 언어, 브랜드에 맞춰 이런 에이전트들을 파인튜닝할 수 있습니다. 아마 이런 과정을 거치면, ‘고객 (또는 내부 직원)과 대화할 수 있는 강력한 브랜드 북’이 만들어지는 것이겠죠.

    2028년까지 13억개의 AI 에이전트가 만들어질 거라고 예측되는 가운데, 이미 23만개 이상의 조직에서 Copilot Studio를 사용해서 맞춤형 에이전트를 구축하고 있다는 점 (지난 분기 대비 130% 증가한 수치라고 합니다), 이미 여기서 스케일의 싸움에서 앞서나가는 모습을 보여줍니다.

  • 에이전트의 신원을 확인한다 - ID를 기반으로 한 중앙집중형 거버넌스

    에이전트의 자율성이 높아지게 되면, 그만큼 에이전트의 ‘신원’과 ‘보안’이 중요해지겠죠.

    Microsoft Entra Agent ID는 (현재 기준) Copilot Studio, 그리고 Azure AI Foundry에서 만들어진 AI 에이전트에 ‘고유하고 검증 가능한’ 신원을 부여합니다. 새로 만들어지는 차량에 차대 번호를 새기는 것과 비슷하죠. 이렇게 해서, 에이전트와 사용자 관리를 중앙집중화하면, 관리자가 모든 에이전트를 확인하고 접근 권한을 파악하기 용이해 집니다.

MS Entra Agent ID for Secure Enterprise Agent 개요

  • 기반 계층 (Foundational Layer): NLWeb, MCP, 오픈 프로토콜

    HTTP, 그리고 HTML이 전통적인 웹의 기반을 닦았다고 한다면, 마이크로소프트는 NLWeb (RSS, RDF, Schema.org를 만든 R.V. Guha가 고안)을 ‘에이전틱 웹’의 기반 기술로 밀고 있습니다. NLWeb은, 간단하게 이야기하면 ‘모든 웹사이트가 쉽게 자연어 인터페이스를 만들어서 방문자나 사용자와 채팅할 수 있게 하는 기술’인데, 중요한 건 모든 NLWeb 인스턴스가 MCP 서버로 작동한다는 점이예요.

    MCL는 아시다시피 앤쓰로픽에서 고안한 공개 표준으로, AI 에이전트와 LLM 기반의 앱이 다양한 데이터와 서비스에 일관된 방식으로 접근할 수 있게 만들어져 있죠. 마이크로소프트는 Github, Copilot Studio, Dynamics 365, Azure AI Foundry, Windows 11까지 자사의 제품을 광범위하게 MCP와 통합해 가면서 전폭적인 지원을 하고 있는데요. 이 움직임이 계속된다면, 개방적이면서도 상호 운용성이 보장되는 ‘에이전트 생태계’를 조성하는데 큰 역할을 할 것 같습니다.

‘에이전틱 웹’을 위한 NLWeb. Image Credit: Sumit Bhattacharyya


  • Agentic DevOps를 기반으로 한 소프트웨어 개발 과정의 혁신

    소프트웨어 개발 라이프사이클 자체가 ‘Agentic DevOps’에 의해서 변화하고 있습니다. 새로운 GitHub Copilot Coding Agent (누구나 사용할 수 있고, Cursor나 Claude의 인터페이스와 놀라울 정도로 닮았어요)는 이슈를 할당해 놓기만 하면 자동적으로 코드 리팩토링을 하고, 테스트 커버리지를 개선하고, 결함을 고치고, 새로운 기능을 구현할 수도 있습니다. 레거시 Java 애플리케이션이나 .NET 앱의 Modernization까지도 할 수 있고, 메모리 누수 같은 라이브 사이트의 이슈에 대해서 분류부터 원인 분석, 위험 완화 액션 등까지 자율적ㅇ로 처리하는 SRE Agent를 포함하고 있습니다.

    또 다른 것 하나는, VS Code의 확장 프로그램으로 연결되는 GitHub Copilot Chat 부분을 오픈소스화했다는 건데요, 완벽한 모든 것의 오픈소스화는 물론 아니지만, 아주 쿨하면서도 전략적인 의미가 있는 한 걸음이라고 하겠습니다.

  • ‘에이전트를 만들어내기 위한 공장’: Azure AI Foundry 및 Copilot Studio

    이런 정교한 에이전트들을 만들고 관리하고 계속해서 확장하려면, 그만큼 강력한 플랫폼이 필요하죠. Azure AI Foundry는 AI 앱과 에이전트를 설계하고 맞춤화하고 관리할 수 있는 ‘통합된 에이전트 팩토리’로 포지셔닝됩니다.

    기본적으로 제공되는 모델에 더해서, 직접 만들거나 튜닝한 모델 등을 포함해서 BYOM (Bring Your Own Model) 으로 모델 사용과 관련한 다양한 선택지를 주고, 평가, 모니터링, 메모리 등을 위한 도구도 제공합니다. 그리고 개발자들이 수백만 명의 Copilot, Teams 사용자들에게 에이전트를 ‘게시 (Publish)’할 수 있게 해 주는 Agent Store도 있습니다.

Azure AI Foundry

  • 핵심은, ‘협업’: 사람-Agent 간 협업, Agent 간 협업, 그리고 허브로서의 Teams

    에이전트의 시대로 가기 위해서는 ‘협업’이 필수적인 전제입니다: 사람과 에이전트 간, 그리고 에이전트들 끼리의 협업을 포함해서요.

    마이크로소프트의 Teams는 이런 협업을 위한 ‘멀티플레이어’ 허브로 포지셔닝을 하고 있는데, MCP를 지원하고 에이전트 간의 안전한 P2P 커뮤니케이션을 위한 A2A를 지원하는, 한층 강화된 Teams AI 라이브러리를 제공합니다. 개발자들이 Teams 에이전트에 Semantic Memory를 추가할 수도 있습니다.

  • ‘AI의 대중화’를 향한, ‘온-디바이스’ 기치 : Windows AI Foundry 및 Open Initiative

    에이전트의 시대, 클라우드만으로는 구현할 수 없겠죠.

    Windows AI Foundry (Recall 같은 기능을 구축하는 데 내부적으로 사용되는 Windows Copilot Runtime의 진화된 버전 정도로 이해하시면 될 듯)는 로컬에서의 AI 개발을 위한 통합 플랫폼으로, Windows 11에서 직접 AI 모델, 도구, 에이전트를 더 쉽게 실행하게끔 해 줍니다.

    Foundry Local은 이런 지원을 macOS까지도 확장해 줄 수 있습니다. Windows에서의 MCP 네이티브 지원 기능으로 AI 에이전트가 네이티브 Windows 앱과 연결할 수 있게 됩니다.

  • ‘비즈니스’를 넘어, ‘과학적 발견과 개척’을 위한 Microsoft Discovery

    일단 언뜻 보자면 구글 딥마인드에서 진행하는 작업과 비슷해 보이는데, Microsoft Discovery 플랫폼으로 과학적인 관점의 돌파구를 실험하고 발견하는 과정을 가속화하는 전용 플랫폼을 갖추게 되었습니다.

    이 플랫폼은, 과학자들이 아래와 같은 용도로 AI 에이전트를 사용하도록 해 줍니다:

    1) 방대한 지식을 기반으로 한 추론: 공개된, 그리고 비공개된 과학적 데이터를 대상으로 강력한 그래프 기반의 지식 엔진 (Graph RAG)을 활용한 추론을 할 수 있습니다.

    2) 과학적 가설의 수립: 새로운 연구 계획을 수립하고, 신물질 등의 후보가 될 분자나 재료를 만들어낼 수 있습니다.

    3) 가설 검증을 위한 실험 실행: 복잡한 시뮬레이션과 분석 작업을 조정하면서 진행할 수 있습니다.

    ‘빌드 2025’의 한 발표에서 이 플랫폼을 사용한 실제 사례를 보여줬는데요. 데이터 센터용으로 더 안전한 PFAS-Free 침수 냉각제를 개념에서부터 실험실 검증까지 마친 과정이었습니다. 이 발표는 앞으로 에이전틱 AI가 인류 앞에 놓인 거대한 도전 과제들을 해결하는데 큰 도움이 될 거라는 것을 보여준, 영감을 준 발표였습니다.

마이크로소프트는, 자사가 제공하는 다양한 제품과 기술 스택을 기반으로 ‘에이전트 중심의 미래’를 구축하자고 모두를 초대하는 강력한 논리를 ‘빌드 2025’에서 제시했다고 생각합니다.

물론 오픈 프로토콜, 오픈소수 도구들이 AI 에이전트 생태계의 성장에 큰 기여를 하겠지만, 마이크로소프트가 제시하는 진짜 매력은, 아마도 ‘긴밀하게 통합된 플랫폼’에 있을 거라고 봅니다.

이제 기업들이 스스로의 운영 모델과 경쟁력을 어떻게 ‘AI 에이전트’를 중심으로 재편해야 할지, 진지하게 고민할 때가 다가오는 것 같습니다.

트위터 라이브러리 (Twitter Library) 🐦

‘집단 지능’, 바로 AI의 미래의 한 모습이겠죠?

에이전트의 맥락에서 이 말을 해석해 보자면, ‘단일 에이전트’로는 충분하지 않다는 걸로 이야기할 수도 있을 것 같은데요. 한 가지 작업을 해결하더라도, 복잡한 워크플로우를 혼자 관리하는 것보다 ‘함께 일하는 단순하고 전문화된 에이전트의 팀’이 훨씬 더 나은 선택지일 수도 있습니다.

그렇지만, 이런 ‘멀티 에이전트 시스템’을 구축하는게 쉬운 일은 아니죠. 그래서, 오늘 MAS (Multi-Agent System)에 대해 많은 공부를 할 수 있는 자료를 7개 소개합니다:

*아직 튜링 포스트 코리아 구독 안 하셨나요? 구독해 주시면 매주 중요한 AI 뉴스를 정리한 다이제스트를 받으실 수 있습니다!

튜링 포스트 코리아팀이 읽고 있는 것들

Lilian Weng의 2025년 5월 1일자 블로그 글인데요. 이 글에서는, AI 모델의 사고 과정을 개선하기 위한 다양한 접근법에 대해서 이야기합니다. 우선, 사람의 사고 방식을 모델링하는 것이 중요하다는 이야기를 하는데요. Kahneman의 'Thinking, Fast and Slow' 이론을 인용해서, 직관적이고 빠른 '시스템 1' 사고, 그리고 깊이 있는 분석을 하는 '시스템 2' 사고를 구분하구요, 왜 모델이 더 깊이 있는 사고를 할 수 있게 해야 하는지 설명합니다. 둘째로, Test-Time Compute를 기반으로 해서 모델의 사고 능력을 확장하는 방법에 대해서 이야기합니다 - 특히, CoT 기법으로 모델이 문제 해결 과정을 단계별로 나누어 사고하도록 유도해서, 복잡한 문제의 해결 성능을 향상시킬 수 있다는 걸 보여줍니다.

엔비디아의 젠슨 황이 Stratechery와 한 인터뷰입니다. ‘AI Factory’의 시대에 대해서 이야기하면서, AI 스택이 플랫폼으로서 작동해면서 규모가 커질수록 더 많은 개발자와 애플리케이션을 끌어들인다고 이야기합니다. 미국의 현재 정책에 대해서는, 미국에서 만들어지는 AI 기술에 대한 접근을 제한하기보다 전세계의 많은 국가가 미국 기술을 채택할 수 있도록 더 가속화해야 한다고 주장하고, 로보틱스가 몇 년 안에 AI 인프라의 핵심이 되어서 노동력 부족 문제를 해결하고 GDP를 늘릴 거라고 예측합니다. 특히 에너지는 풍부하지만 노동력이 부족한 사우디아라비아, UAE 같은 국가들이 새로운 시장이 될 것으로 보고 있네요.

마이크로소프트 빌드 2025의 사티아 나델라 키노트입니다.

금주의 주목할 만한 업계 동향 📰

마이크로소프트 빌드 2025, 구글 I/O 2025 소식을 제외하면, 금주의 가장 흥미로웠던 소식은 아무래도 구글의 AlphaEvolve, 그리고 오픈AI의 Codex였는데요.

AlphaEvolve는 새로운 알고리즘이라든가 과학적인 해결책 등을 자율적으로 발견하게끔 설계된, 진화형의 코딩 에이전트라고 할 수 있겠습니다.

Codex는 코드를 작성하고 테스트 해 가면서 수정하는 AI 기반의 코딩 어시스턴트로, 챗GPT 안에서 Virtual Coworker로 작동합니다.

차주 초에 이 두 가지 도구에 대해서 AI 101 에피소드로 커버할 예정이니, 조금만 기다려 주세요!

새로 나온, 주목할 만한 연구 논문

‘주목할 만한 최신의 AI 모델’을 먼저 소개하고, 각 영역별로 ‘Top Pick’은 해당 논문 앞에 별표(🌟)로 표시했습니다!

주목할 만한 최신 AI 모델

  • 세일즈포스의 BLIP3-o는 CLIP Feature를 생성하기 위한 Diffusion Transformer, 그리고 이해력을 보존하면서 생성을 할 수 있게끔 하는 순차 훈련 (Sequential Training)을 통해서 이미지의 이해, 그리고 생성 기능을 통합합니다.

  • 🌟 Aya Vision (by Cohere)은 합성 생성된 주석과 Cross-Modal 데이터를 병합해서 다국어 멀티모달 모델의 생성 능력을 스케일링하는데, 다국어 환경 내의 시각적 추론 작업에서 더 큰 대형 모델들을 능가하는 성능을 보여줍니다.

  • 🌟 MiniMax-Speech (by MiniMax)는 Speaker Encoder와 Flow-VAE로 제로 샷 (Zero-Shot)으로 고품질의 음성 합성 능력을 구현하고, 복제, 감정 컨트롤, 다국어 지원 관점에서 뛰어난 성능을 보여줍니다.

  • 🌟 SWE-1 (by Windsurf)은 도구를 인식해서 추론 문제를 해결하는 능력, 정보가 부족한 상태에서도 추론을 진행하는 능력, 그리고 타임라인 기반의 컨텍스트 유지 기능을 통합해서 ‘소프트웨어 엔지니어링’ 워크플로우를 가속화합니다. 그리고 훌륭한 에이전틱 코딩 경험도 제공한다고 합니다.

흥미로운 평가 벤치마크

  • 🌟 워싱턴 대학교, Ai2, Anderson Collegiate Vocational Institute의 연구진이 함께 개발한 PointArena는, 멀티모달 모델이 자연어를 사용해서 이미지에서 ‘가리키기 (Pointing)’ 하는 능력을 벤치마크하는 새로운 평가 플랫폼입니다. 여기에는 세 가지 구성 요소가 있는데요:

    Point-Bench : 5가지의 추론 유형에 대한 982개의 작업
    Point-Battle : 4,500개 이상의 투표를 통한 실시간 Pairwise 비교
    Point-Act : 로봇의 ‘Pointing’ 작업

    현재 벤치마크 결과로, Molmo-72B가 모든 작업에서 다른 모델들을 능가하는 모습을 보여주고, 놀랍게도 Chain-of-Thought는 성능을 저하시키는 걸로 보이네요.

추론 (Reasoning) 성능 및 모델 Alignment 개선

  • 🌟 Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models는 추론 작업의 신뢰성과 성능을 개선하기 위해서 ‘메타 추론’ 능력 (연역, 귀납 등)으로 모델을 Align하는 방법을 제안합니다. —> [논문 보기]

  • 🌟 J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning은 ‘깊은 사고를 한 평가’에 대해서 구조화된 보상을 해서, 평가자들이 더 나은 평가를 할 수 있게끔 훈련시킵니다. —> [논문 보기]

  • 🌟 The CoT Encyclopedia는 Chain-of-Thought 기법을 통한 생성 작업에서 추론 전략이 얼마나 다양한지를 매핑을 통해서 확인, 모델의 사고 과정을 유도하고 평가하는데 도움을 줍니다. —> [논문 보기]

트레이닝, 프롬프팅, 스케일링 최적화

  • 🌟 System Prompt Optimization with Meta-Learning은 시스템 프롬프트를 사용자 프롬프트와 함께 최적화하는 기법으로, 어떤 작업에든 잘 일반화되는 시스템 프롬프트를 학습하도록 합니다. —> [논문 보기]

  • 🌟 Parallel Scaling Law for Language Models는 모델 크기나 토큰을 늘리는 대신, 계산 작업을 병렬화하는 방식으로 새로운 스케일링의 패러다임을 시험합니다. —> [논문 보기]

  • 🌟 Insights into DeepSeek-V3는 새로운 Attention과 Precision 기법을 통해서 하드웨어-모델을 공동으로 설계하는 것이 거대한 LLM을 효율적으로 스케일링하는데 어떻게 도움이 되는지 탐구합니다. —> [논문 보기]

생성형 모델 및 시각 모델의 개선

  • 🌟 QuXAI: Explainers for Hybrid Quantum Machine Learning Models는 ‘특징 기여도 (Feature Attributions)를 활용해서 하이브리드 양자-고전 ML 모델에 대한 설명 가능성의 프레임웍을 검토합니다. —> [논문 보기]

  • Unified Continuous Generative Model은 Diffusion, Flow-Matching, Consistency 모델을 단일한 프레임웍으로 통합해서 생성 훈련을 더 효율적으로 하고 샘플링효율도 높이는 방법을 연구합니다. —> [논문 보기]

  • Depth Anything with Any Prior는 Sparse Metric Prior와 Dense Relative Prediction을 결합해서 높은 일반화 능력을 가진 Monocular Depth Model을 구축합니다. —> [논문 보기]

  • MetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning은 순수한 비전 모델과 새로운 One-Prompt 기법을 사용해서 범용으로 활용할 수 있는 이상 탐지 세그멘테이션을 수행합니다 —> [논문 보기]

*리뷰를 남기시려면 로그인하시거나 구독해 주세요. 감사합니다!

읽어주셔서 감사합니다. 프리미엄 구독자가 되어주시면 튜링 포스트 코리아의 제작에 큰 도움이 됩니다!

Reply

Avatar

or to participate

Keep Reading