🌁FOD#144: 새로운 스케일링 법칙? NVIDIA가 GTC 2026에서 꺼낸 가장 큰 카드

In partnership with

The Future of AI in Marketing. Your Shortcut to Smarter, Faster Marketing.

Unlock a focused set of AI strategies built to streamline your work and maximize impact. This guide delivers the practical tactics and tools marketers need to start seeing results right away:

7 high-impact AI strategies to accelerate your marketing performance
Practical use cases for content creation, lead gen, and personalization
Expert insights into how top marketers are using AI today
A framework to evaluate and implement AI tools efficiently

Stay ahead of the curve with these top strategies AI helped develop for marketers, built for real-world results.

Download the Free Report

NVIDIA, 그 엄청난 변혁의 힘

지난 3월 16일~19일 열렸던 NVIDIA의 GTC 2026.

산호세 다운타운을 걷다 보면, NVIDIA가 진짜 어디에나 있다는 느낌을 받을 수 있습니다. GTC 행사를 알리는 초록색 풍선들이 레스토랑, 카페 등에 장식되어 있고, 곳곳의 건물들에서 크고 작은 컨퍼런스 행사가 열립니다. 호텔들에서는 ‘NVIDIA의 행사에 걸맞는 서비스를 제공하겠다’고 선언들도 하구요. 압도적인 NVIDIA의 존재감이 느껴집니다.

올해 GTC에는 190개국 이상에서 3만 명이 넘는 참가자들이 산호세에 모였습니다. 젠슨 황의 기조연설과 1,000개가 넘는 세션이 행사를 꽉 채웠구요. 표면적인 이야기는, NVIDIA가 어마어마하게 커졌다는 것이지만, 더 흥미로운 이야기는, NVIDIA 관계자들이 여러 차례 강조했듯이, 이 회사가 세상의 모든 AI 기업과 함께 일하는 유일한 회사라는 점에 대한 끝없는 반복이었습니다.

그리고 이제 NVIDIA는, 이전에 스스로 제시했던 스케일링 법칙을 새롭게 바꾸려고 하고 있습니다.

지난 2년간 AI 업계는 사전 학습(Pretraining), 사후 학습(Post-training), 그리고 최근에는 테스트타임 스케일링(Test-Time Scaling)을 강조해 왔습니다. 여기다가 NVIDIA는 네 번째 법칙을 추가하려고 합니다: 바로 에이전트 스케일링(Agentic Scaling)입니다.

쉽게 말하자면, AI 시스템이 단순히 대답하고 멈추지 않는다는 뜻입니다. 도구를 호출하고, 코드를 작성하고, 검색하고, 파일을 확인하고, 서브 에이전트를 생성하고, 긴 컨텍스트를 유지하고, 다른 AI와 상호작용하는 시스템으로 빠르게 변화하고 있고, 이런 워크로드는 인프라에 전혀 다른 압박을 가하게 되죠. 기존 챗봇 기반의 추론 서비스에서는 생각해 본 적 없는 수준의 강도로 새로운 문제를 발생시키기도 하고, 이런 새로운 워크로드에서는 지연 시간(Latency), 메모리 이동, 스토리지 경로, 그리고 시스템 조율(Coordination)이 핵심 키워드로 떠오릅니다.

Image Credit: NVIDIA

새로운 법칙과 함께 새로운 플레이어들도 등장하게 되는데, 이 모든 인프라 이야기 속에 ‘조용히 숨어 있지만 가장 큰’ 발표 중의 하나가 바로 NemoClaw입니다. 거대한 랙과 초당 토큰 수로 유명한 GTC 컨퍼런스의 토픽으로는 다소 낯설게 들릴 수 있지만, 전략적으로는 어떤 신규 하드웨어 못지않게 중요한 의미를 가지는 발표입니다.

젠슨 황도 OpenClaw에 대한 애정을 숨기지 않았습니다: "30년 만에 Linux가 이룬 것을 뛰어넘었다!", "모두가 OpenClaw 전략이 필요하다!", "SaaS에서 에이전트-as-a-서비스로, 엔터프라이즈 IT 르네상스가 시작된다!"고 힘주어 외치는 모습, 보셨나요?

Image Credit: NVIDIA

NemoClaw는 NVIDIA가 빠르게 성장하는 OpenClaw 생태계에 기여하고자 내놓은 하나의 결과물입니다. 장기 실행 자율 에이전트를 위한 프레임웍이라고 하겠는데, 그 아이디어는 단순합니다: 명령어 하나로 OpenClaw와 Nemotron 모델, 그리고 NVIDIA의 새로운 보안 런타임 OpenShell을 함께 설치할 수 있습니다. 다시 말해서, NVIDIA는 이제 모델에 동력(Power)을 공급하는 데 그치는 플레이어가 아니라, 에이전트 그 자체의 기저에 자리를 잡는 플레이어가 되겠다는 겁니다.

그리고, 바로 이 지점에서 GTC 2026 기조연설의 모든 내용이 하나로 이어집니다.

에이전트 시스템은 복잡합니다. 몇 시간씩 쉬지 않고 돌아갑니다. 도구를 호출하고, 코드를 실행하고, 데이터베이스를 검색하고, 파일에 접근하고, 다른 모델들과 조율(Coordination)합니다. 이 워크로드는 단순한 챗봇 응답과는 전혀 다른 방식으로 하드웨어를 혹사시키게 되죠. 빠른 추론, 낮은 지연 시간, 지속적인 메모리, 보안 가드레일, 그리고 시스템 일관성을 유지하는 오케스트레이션 레이어가 모두 필요합니다.

NVIDIA가 에이전트 스케일링에 그토록 많은 시간을 쏟아부은 이유가 바로 여기에 있습니다.

새로운 하드웨어 스택 – Vera Rubin 플랫폼과 GPU + LPU 랙을 포함 – 은 에이전트가 지속적으로 작동할 수 있는 수준까지 ‘토큰 생성속도’와 ‘추론 처리량’을 끌어올리게끔 설계되었습니다. 다시 말해서, 데이터센터 자체를 에이전트를 위해서 다시 설계하고 있는 겁니다(젠슨 황에 따르면, Vera Rubin은 올해 하반기 출시 예정이라고 합니다).

오래전부터 NVIDIA는 반도체를 훨씬 넘어서는 역할로 영역을 넓혀왔죠. AI 생태계의 인프라 기반을 한 층 한 층 쌓아온 셈인데, 이번 GTC에서 그 전체 그림이 비로소 선명하게 보인다는 느낌을 받았습니다.

NVIDIA, 이 회사는 이제 AI 스택의 거의 모든 레이어에 존재감을 드러냅니다: 칩, 네트워킹, 스토리지, 런타임 소프트웨어, 모델, 시뮬레이션 시스템, 로보틱스 플랫폼, 개발자 툴링까지요. NVIDIA는 이제 더 이상 뛰어난 모델이나 더 빠른 GPU를 하나씩 내놓는 수준이 아니라, AI 인프라 전체 스택에 대한 하나의 이론을 제시합니다 – 에너지, 실리콘, 네트워킹, 스토리지, 모델, 소프트웨어, 로봇, 통신, 데이터센터를 ‘하나의 프로덕션 시스템’으로 엮어내고 있습니다. 젠슨은 NVIDIA를 "세계와 개방적인 수평적 통합을 이루는 수직 통합형 컴퓨팅 회사"라고 표현했습니다.

Image Credit: NVIDIA

개방형 생태계를 향한 NVIDIA의 움직임도 그에 못지않게 흥미롭습니다:

Nemotron 3와 함께, NVIDIA는 AI 기업들의 연합을 결성한다고 발표했습니다 – Cursor, LangChain, Perplexity, Reflection AI, Thinking Machines 등이 데이터, 평가, 개발 분야의 전문성을 제공하고, NVIDIA는 학습 인프라를 지원하는 구조로 보입니다. 모든 연구소가 프런티어 모델을 혼자 구축하려고 하는 대신에, 개방형의 기반을 함께 쌓고 그 위에서 각자 전문화하자는 발상입니다.

지난 2년, AI 세계를 지배해 왔던 ‘폐쇄형 연구소’ 모델과는 상당히 다른 모델이라고 할 수 있습니다. 이 주제 자체가 아주 흥미로운 주제고, 다양한 관점에서 더 깊이 들여다볼 가치가 있다고 생각해서, 별도로 Nemotron 연합에 대해서 한 번 글을 써서 공유해 볼까 합니다.

그리고 물리적 세계와 Physical AI도 빼놓을 수 없죠. 로보틱스는 역사상 가장 크고 가장 가치 있는 산업적인 혁명이 될 거라는 기대를, 특히 이 시점에, 한 몸에 받고 있는 분야니까요.

NVIDIA는 이미 직접 로봇을 만들지는 않지만 가장 큰 로보틱스 회사가 되었습니다. 머지않아 단 한 대의 차도 만들지 않으면서 가장 큰 자율주행 플랫폼이 될 수도 있습니다. 로보틱스 시뮬레이션부터 엣지 AI 네트워크, Alpamayo 같은 자율주행 모델까지, 동일한 인프라 논리가 데이터센터를 넘어서 공장, 자동차, 도시 전체로 뻗어나갑니다. Alpamayo 역시 더 깊이 다뤄서 이해해 볼 만한 가치가 있는 주제라서, 튜링 포스트에서 실제 시승을 해 보면서 살펴볼 예정이니 후속 에피소드를 기대해 주세요.

그리고 GTC에서 한 가지가 더 저희의 눈길을 사로잡았습니다. NVIDIA가 ‘지구 너머’로까지 손을 뻗고 있는 모양새로 다가왔던 건데요.

다소 초현실적인 발표 중 하나였지만, 바로 우주 기반 AI 인프라의 추진이었습니다. 우주 환경에 최적화된 Vera Rubin 모듈을 소개하고, 궤도 위 시스템을 센싱, 자율성, 의사결정을 위한 실시간 컴퓨팅 플랫폼으로 전환하는 비전을 제시했습니다. 상업적으로 의미를 가지기까지는 물론 오랜 기간이 걸릴 수 있지만, 이게 상징하는 바는 분명합니다: NVIDIA는 가능한 모든 방향으로 인프라의 뿌리를 내리고 있습니다 – 클라우드, 엣지, 데스크탑, 로보틱스, 통신, 자동차, 그리고 이제 우주까지 말이죠.

젠슨 황이 GTC 2026 사전 행사에서 했던 말처럼, ‘AI가 우리를 훨씬 더 바쁘게 만들고 있습니다.’

저도 매일 똑같이 느끼고 있는데, 아마 여러분도 마찬가지시겠죠?

상징적으로 표현한 NVIDIA의 전략

참고로, NDIVIA의 2026부터 2028년까지의 계획, 그에 대한 모든 보도자료는 여기서 확인하실 수 있습니다.

금주의 주목할 만한 업계 동향 📰

— # (#)

CoreWeave – 더 큰 두뇌, 더 차가운 서버
CoreWeave가 GTC 2026에서 NVIDIA의 HGX B300(블랙웰 울트라)를 지원한다고 공개했습니다. HBM3e 메모리 2.1TB와 더 빠른 InfiniBand를 탑재해서, 에이전트 AI의 폭발적인 연산 수요를 감당하도록 설계됐다고 합니다. 모델 학습의 시대를 넘어서, 자기 개선형 에이전트를 대규모로 실제 운영하는 시대로 이동한다는 하나의 징표일까요?
Nebius & Meta – 270억 달러짜리 신임 투표
Nebius가 Meta로부터 묵직한 지지를 얻었습니다. 최대 270억 달러 규모의 5년짜리 AI 인프라 계약이 바로 그건데요. 파트너십의 핵심은 NVIDIA의 Vera Rubin 플랫폼 초기 배포이고, Nebius는 2027년부터 전용 컴퓨팅 용량을 제공하게 됩니다.
Microsoft – AI 산업 시대의 공장
Microsoft가 AI 행보에 한층 더 가속 페달을 밟습니다. 확장된 Foundry 기능, NVIDIA와의 긴밀한 통합, 그리고 추론 집약적인 워크로드를 위한 인프라를 새롭게 선보였습니다. 차세대 Vera Rubin 칩, 에이전트 AI 툴링, 그리고 'Physical AI'로의 확장까지 — AI 경제의 핵심 생산 기지로 스스로를 자리매김하려는 모습입니다.
Runway – 아바타, 채팅창 밖으로 나오다
Runway가 'Characters'를 출시했습니다. 이미지 한 장을 실시간 대화형 아바타로 바꿔주는 영상 에이전트 API로, 자체 세계 모델 GWM-1이 그 엔진입니다.
Anthropic – 컨텍스트가 초대형 사이즈로
Anthropic이 Claude Sonnet 4의 컨텍스트 창을 100만 토큰으로 늘렸습니다. 코드베이스 전체, 방대한 연구 자료, 복잡한 에이전트 워크플로우를 한 번에 집어넣을 수 있는 규모입니다.
Google Maps – 지도가 말을 걸어오다
Google이 Maps에 수년 만에 가장 큰 변화를 가져왔습니다. Gemini 기반의 두 가지 신기능이 추가됐는데요 — 복잡한 현실 세계에 대한 질문을 자연어로 처리하는 'Ask Maps', 그리고 보다 풍부한 3D 주행 인터페이스를 제공하는 '몰입형 내비게이션'입니다.
Google – 임베딩이 보고, 듣고, 읽는다
Google이 Gemini Embedding 2를 공개했습니다. 텍스트, 이미지, 영상, 오디오, 문서를 하나의 공유 의미 공간에 매핑하는 첫 번째 네이티브 멀티모달 임베딩 모델입니다. 이제 복잡한 파이프라인을 구성하지 않아도 멀티모달 검색, 검색 증강, 분류가 깔끔하게 처리될 것 같네요.
Replit – 바이브 코딩에 프로젝트 관리 기능까지
Replit이 Agent 4를 선보였습니다. 단순한 코딩 어시스턴트가 아니라, ‘절대 지치지 않는 소규모 스튜디오 팀’에 가깝습니다. 시스템을 설계하고, 구축하고, 병렬로 작업을 처리하고, 같은 프로젝트 안에서 슬라이드 덱·애니메이션·모바일 앱까지 뚝딱 만들어냅니다.

튜링 포스트 코리아팀이 읽고 있는 것들

LLM Architecture Gallery – Sebastian Raschka

GPT-2부터 최신 모델까지, 주요 LLM의 구조를 한눈에 비교할 수 있게 정리한 갤러리입니다. 모델마다 아키텍처 다이어그램, 파라미터 수·어텐션 방식 같은 핵심 스펙, 주요 개념 해설까지 깔끔하게 담겨 있어요. 무엇보다, 어떤 설계가 살아남고 어떤 게 사라졌는지 흐름을 한눈에 볼 수 있다는 게 이 갤러리의 진짜 매력입니다.

Five categories of world models – Zhuokai Zhao

요즘 AI 업계에서 '세계 모델(World Model)'이라는 말이 전보다 엄청 많이 들리죠? 그런데 사실 이 안에 전혀 다른 다섯 가지 기술 전략이 뒤섞여 있습니다. Meta AI의 Zhuokai Zhao가 이걸 깔끔하게 정리해줬어요. ① Yann LeCun의 JEPA 잠재 예측, ② Fei-Fei Li의 3D 공간 지능, ③ Google DeepMind의 학습 기반 시뮬레이션, ④ Sora류의 비디오 기반 접근, ⑤ LLM 언어 표현 자체를 세계 모델로 보는 언어 기반 접근. 이름은 같아도 완전히 다른 게임을 하고 있다는 거, 알고 보면 꽤 흥미롭습니다.

World Models: The old, the new and the wishful – Subbarao Kambhampati

세계 모델(World Model)이 트렌드의 중심으로 떠오르는 가운데, 애리조나 주립대 AI 교수 Kambhampati가 이 열풍에 찬물을 한 바가지 끼얹었네요. Kambhampati 교수는 세계 모델을 딱 세 가지로 나눠요. 오래된 것은 기호 기반(Symbolic) 세계 모델, 새로운 것은 JEPA 같은 신경망 기반 세계 모델, 희망 사항은 LLM이 세계 모델을 저절로 품고 있다는 주장. 마지막에 대해서는 강하게 회의적이고, 지금의 열풍 상당 부분이 이 셋을 뒤죽박죽 섞은 데서 비롯된 혼란이라고 꼬집습니다.

튜링 포스트 코리아는 독자들의 응원으로 만들어집니다. 가치있는 컨텐츠를 지속적으로 여러분과
공유할 수 있도록, 커피 한 잔으로 힘을 보태주세요 ☕

‘커피 한 잔’ 응원하기

🌁FOD#144: 새로운 스케일링 법칙? NVIDIA가 GTC 2026에서 꺼낸 가장 큰 카드 — '에이전트 스케일링'

The Future of AI in Marketing. Your Shortcut to Smarter, Faster Marketing.

NVIDIA, 그 엄청난 변혁의 힘

금주의 주목할 만한 업계 동향 📰

튜링 포스트 코리아팀이 읽고 있는 것들

Reply

Keep Reading

Turing Post Korea

Home

Account