🎙️ AI의 지속적 발전을 가로막고 있는 건 뭘까?

❝

Encord는 2021년에 설립된 AI 데이터 개발 플랫폼 스타트업입니다. ‘AI 데이터 개발 플랫폼’이라고 하면, AI 모델이 실제 프로덕션 환경에서 제대로 작동하도록 데이터 레이블링·관리·오케스트레이션 도구를 제공한다는 뜻으로 이해하시면 될 것 같습니다. 초기에는 어노테이션 자동화로 출발했지만, 지금은 데이터 품질 관리, 후처리(Post-training), 정렬(Alignment) 등으로 영역을 확장했습니다. Encord의 고객사는 자율주행, 의료 AI, 로보틱스 등 고위험·고정밀을 요구하는 유즈케이스를 위한 데이터를 요구하는 산업군이 많은데, 이런 고객들에게 데이터 인프라와 툴체인을 제공해서 프로토타입에서 실제 배포 단계로 빠르게 전환할 수 있게금 돕는 역할을 하고 있습니다. YC(와이콤비네이터) 졸업 회사로, 지금까지 약 5천만 달러를 투자받았는데, "AI의 병목은 데이터"라는 비전을 바탕으로 빠르게 성장하고 있습니다.

Ulrik Stig Hansen은 Encord의 공동 창업자 겸 대표로, 덴마크 출신의 엔지니어이자 기업가입니다. 영국 임페리얼 칼리지 런던(ICL)에서 컴퓨터공학 석사를 마쳤는데, 커리어 초기에는 JP모건에서 투자은행가로 일하며 비즈니스 감각을 키웠습니다. 이후 런던에서 공동 창업자인 에릭 란다우를 만나 Encord를 함께 세웠습니다. AI 발전의 핵심적인 제약 조건은 모델이나 컴퓨트가 아닌 데이터 오케스트레이션으로 규정하고, 테슬라와 같은 사례에서 보듯 실시간 피드백 루프와 데이터 축적의 중요성을 강조합니다. 한센은 “AI 발전은 단발적 돌파구가 아니라 매일의 반복과 꾸준한 노력에서 나온다”는 철학을 바탕으로 회사를 이끌고 있습니다.

편집자 주

연산능력? 모델? AI 발전을 가로막는 진짜 장애물은 '데이터'?

AI 데이터 개발 플랫폼 엔코드의 공동 창업자 겸 대표 울릭 스티그 한센(Ulrik Stig Hansen)과의 인터뷰를 여러분과 공유합니다. 울릭은, AI 발전의 진짜 제약은 연산능력이나 모델의 크기가 아니라 데이터를 어떻게 오케스트레이션하느냐에 있다고 이야기합니다.

그 말이 맞다면, 이런 관점이 ‘AI 개발과 발전’에는 어떤 의미를 가질까요?

울릭의 말대로, 모델은 대부분 서로 필요에 따라 교체할 수 있을 만큼 ‘충분히 좋다’는 게 현실이죠. 하지만 데이터 오케스트레이션을 제대로 하지 않고는 모델의 성능을 한층 끌어올리는 데 한계가 있습니다. 울릭은 특히, 테슬라의 자율주행 기술이 웨이모를 앞서가는 이유가 모든 차량에서 쏟아지는 실시간의 휴먼 피드백이라는 압도적 데이터 우위 덕분이라고 설명하기도 하거든요. 또, 로보틱스가 순수 디지털 AI보다 더 어려운 이유는, 현실 세계에서 즉각적인 피드백 루프를 수집하기가 어렵기 때문이라는 말도 합니다.

이 외에도, 울릭과 함께 전문가 피드백이 어떻게 새로운 ‘금광’이 되고 있는지, 합성 데이터에 지나치게 의존하게 되면 모델의 성능을 거꾸로 망가뜨릴 위험은 없는지, ‘값싼 인텔리전스’(팩트와 패턴)와 ‘값비싼 인텔리전스’(창의성, 통찰력)의 분화, 그리고 기술로서의 ‘AI가 범람’하는 시대에 신뢰와 브랜드의 가치가 왜 더욱 중요해지는지 등에 대해서 많은 이야기를 나눴습니다. 또 Meta의 Scale AI 지분 인수 사례를 짚어 보면서, 향후 1년간 데이터 레이블링 기업들의 추가 인수 가능성에 대해서도 울릭의 전망을 들어봤습니다.

자, 그럼 AI 분야의 지속적인 발전을 가로막는 진짜 병목은 무엇인지, 앞으로 승자가 되기 위한 전략은 어떤 것들인지, 그리고 우리가 맞이하게 될 ‘커넥션 경제(Connection Economy)’가 무엇인지에 대한 울릭과의 대화, 한 번 같이 들어가 보시죠!

Q. 울릭, 반갑습니다. 바쁘신데 시간 내 주셔서 감사합니다. 간단하지만 아주 핵심적인 질문으로 시작해 볼께요. 인텔리전스를 ‘불확실한 상황에서 과제를 해결하는 능력’이라고 정의한다면, 현재 인텔리전스의 시대로 가는 과정을 가로막고 있는 가장 어려운 과제는 뭘까요? 모델이라고 말하는 사람도 있고, 추론 능력(Inference)이 한계라고 하는 사람도 있는데요.

불러주셔서 감사합니다. 네, 좋기도 하고 어렵기도 한 질문이네요 – 우리도 이 점을 많이 고민하고 있습니다. 저희가 200개가 넘는 최정상의 AI 팀들과 일하면서 보는 바로는, 결국 핵심은 데이터에 달려 있어요. 엔코드를 창업하게 된 이유도 바로 그거였죠. AI 발전에 있어서의 핵심적인 제약은, 모델이 실제 프로덕션 환경에서 잘 작동하도록 “올바른 데이터를 모으고 구성하는 것”에 있습니다.

모델은 나날이 좋아지면서 하나의 모델을 쓰다가 다른 모델로 교체를 해도 이상하지 않은 상황이 되었고, 우리가 지켜본 대부분의 경우 이미 충분히 똑똑해서 엄청난 가치를 만들어내고 있습니다. 더 이상의 발전을 가로막는 것은, 모델에게 충분한 맥락을 제공할 수 있도록 데이터를 풍부하게 만들어 내고 잘 조직화하는 일이에요 – 훈련 단계든 추론 단계든, 또는 모델을 둘러싼 시스템 측면에서든, 충분한 맥락(Context)를 주어야 모델이 올바른 판단을 내릴 수 있거든요. 사람도 마찬가지잖아요. 내가 좀 더 똑똑해진다고 해도, 정보가 불완전하면 내가 할 수 있는 일에 한계가 있잖아요. 결국 가장 어려운 부분은 데이터입니다.

Q. 2021년에 엔코드를 시작하셨죠. 그때와 지금은 분위기가 상당히 다른데, ChatGPT 출시 이후에는 뭐가 가장 크게 달라졌나요?

저희는 처음에 데이터 레이블링을 자동화하는 것으로 시작했어요. 그 당시 병목은 데이터의 “양”이었구요. – 베이스 모델을 훈련할 충분한 레이블링 데이터를 만들어내는 것이 관건이었거든요. 그런데 언어 모델을 비롯한 AI가 급속도로 발전하면서 문제가 바뀌었습니다. 그때는 온종일 바운딩 박스(Annotation)를 그리는 게 일이었는데, 이제는 훈련 후 후처리나 모델 정렬(Alignment) 작업이 전면에 떠오른 거죠. 스케일링 법칙을 따라서 모델 규모를 키울 수 있는 만큼 키우고 나니, 데이터의 양에서 데이터의 질로 – 즉 “올바른 데이터”를 확보하는 문제로 핵심이 바뀌었고, 최첨단 영역에서는 이제 후처리와 모델 조율 단계가 큰 비중을 차지하게 된 겁니다.

Prompt to Midjourney: photorealistic image with cars in bounding boxes

모델이 똑똑해질수록, 다음 단계로 갈수록 난이도도 기하급수적으로 올라갑니다. 이런 현상은 언어 모델과 자율주행이라는, 현재 가장 성숙한 두 분야에서 뚜렷이 나타나요. 자율주행에서는 희귀하고 예외적인 롱테일 상황(Long-tail Edge Case)이 문제이고, LLM에서는 아주 미세한 수준의 정렬(미세 조율)이 이슈죠. 로보틱스는 아직 이런 영역들보다 초기 단계인데, 마치 2017–2018년 무렵의 언어 모델과 비슷하다고 볼 수 있어요 – 베이스라인의 성능은 빠르게 올라가고 있지만, 조만간 더 어렵고 특이한 문제들로 초점이 옮겨 가겠지요. 저희는 ChatGPT 이전부터 고객사들과 함께 이런 변화를 지켜보며 대응해 왔는데, 바로 옆에서 AI의 진화를 목격하고 있다는 게 정말 흥미진진했습니다.

Q. 최근에 겪은 어려운 과제 하나만 예를 들어 주실 수 있을까요?

자율주행을 한번 생각해봅시다. 웨이모(Waymo)가 지금 샌프란시스코 시내에서 로보택시 서비스를 운영하고 있지만, 아직 SFO 공항까지는 운행하지 못하고 있어요. 왜 그럴까요? 현실 환경은 늘 역동적이라서, 차량이 마주칠 모든 예외 상황을 미리 제거하는 게 극도로 어렵기 때문입니다. 새로운 시나리오가 등장할 때, 시스템이 그것을 휴리스틱하게 처리하거나 해당 피드백을 다시 훈련 데이터로 돌려보낼 수 있도록 데이터 오케스트레이션을 설계해야 합니다.

테슬라는 운전자가 개입하는 주행(Supervised Driving)에서 큰 이점을 얻고 있습니다. 운전 중에 제가 차를 제어하면, 그 신호가 곧장 테슬라 본사로 돌아가요. 테슬라는 이렇게 촘촘한 피드백 루프를 구축해서, 주행 중 발생하는 롱테일 문제를 실시간으로 해결하는 거죠. 반면에 완전 무인운전을 목표로 하는 로보택시 업체들은 더 힘든 상황에 처합니다. 자체 차량이나 테스트 드라이버를 통해 필요한 데이터를 일일이 모아야 하니, 피드백 루프가 그만큼 느릴 수밖에 없거든요.

Q. 두 회사는 데이터 측면에서 전혀 다른 전략을 취하고 있네요. 테슬라는 거대한 데이터 축적과 러닝 스케일을 바탕으로 밀어붙이고, 웨이모는 한 단계씩 매우 신중하게 접근하고 있습니다. 울릭 님의 생각에, 어느 쪽 접근법이 승리를 거둘까요? 테슬라의 “더 많은 데이터 & 러닝” 전략일까요, 아니면 웨이모의 조심스러운 단계적 전략일까요?

제 생각에는, 테슬라 쪽에 승산이 더 큽니다. 테슬라가 정말 강력하게 쥐고 있는 한 가지는 ‘경쟁자를 압도하는 거대한 데이터 축적의 이점’이에요. 테슬라는 라이브로 축적되는 인간의 피드백을 방대한 규모로 수집하고 있죠. 모든 테슬라 운전자가 사실상 일종의 “좋아요/싫어요” 피드백을 제공하고 있는 셈인데, 그게 차 안에서 자동으로 이루어지는 거예요. 이 피드백 루프는 시간이 지날수록 기하급수적으로 힘을 발휘합니다.

반면에 웨이모는 스스로 데이터를 모아야 한다는 한계가 있습니다. 테슬라처럼 전세계에 판매된 차량이라는 이점이 없으니, 새로운 도시로 서비스를 확장하는 속도도 상대적으로 느릴 수밖에 없죠. 또 웨이모가 테슬라와 달리 RGB 카메라 외에 추가 센서들을 차량에 탑재한 전략은, 이론적으로는 안전성을 높일지 몰라도 비용과 시간 면에서 더 자원이 많이 듭니다. 개인적으로는 테슬라가 앞으로 더 앞서 나갈 것으로 보고 있어요. 테슬라는 이미 로보택시 서비스를 시범 운영하기 시작했고, 아마 빠르게 규모를 키울 수 있을 겁니다. 다만 규제 문제가 변수가 되겠죠 – 웨이모는 관련 규제 당국과의 협력을 먼저 시작해 유리한 위치에 있고, 테슬라는 그런 면에서 아직 뒤처져 있으니까요. 앞으로 3~5년 간 두 회사가 더 많은 도시에서 경쟁하게 될 텐데, 이 역학 관계의 향방은 아주 흥미롭게 전개될 것 같습니다.

Q. 로보틱스 분야도 자율주행 같은 자율 시스템과 동일한 병목을 겪으면서 성장하게 될까요, 아니면 다른 문제가 있을까요?

제약 사항들의 큰 틀은 비슷합니다. 다만 로보틱스에서는 한 가지 도전이 추가되는데, 바로 제한된 GPU를 가진 엣지 디바이스(현장 기기)에서 모델을 돌려야 한다는 점이에요. 이건 엄청난 엔지니어링의 장벽입니다. 게다가 실제 현장에서 발생하는 데이터를 다시 모델 학습으로 반복 투입하는 피드백 루프를 만들어야 하는데, 순수 디지털 도메인보다 훨씬 어렵죠.

예를 들어, 빨래를 개는 로봇을 상상해봅시다. 만약 로봇이 실패했다면, 그 데이터를 어떻게 포착해서 훈련으로 되돌릴 수 있을까요? 심지어 그 로봇이 인터넷에 연결조차 안 되어 있다면요? 이렇게 지연(Latency)이나 연결성 문제까지 생깁니다. 이런 이유로 피드백 루프가 즉각적인 언어 모델이나 코딩 AI 같은 디지털 우선 분야에서 발전 속도가 가장 빠른 겁니다. 구체적 물체를 다루는 AI(Embodied AI)에서는 피드백 수집이 느리고 힘들어요. 몇몇 회사들은 로봇이 실패할 때 원격 조작(Teleoperation)으로 사람이 개입하기도 하지만, 장기적으로 사람이 일일이 끼어드는 방식은 지속 가능하지가 않습니다. 얼마나 영리하고 확장 가능한 피드백 루프를 구축하느냐가 장기적으로 어떤 로보틱스 기업이 지속적인 우위를 점할지 결정짓는 요인이 될 거예요.

Q. 이런 피드백 루프는 앞으로 에이전트형 AI 시스템(Agentic AI)에서도 점점 더 중요해지겠죠? 이런 피드백 루프를 효과적으로 지원하려면 인프라도 어떻게 발전해야 할까요?

이 부분이 바로 저희가 요즘 집중하고 있는 질문이에요. 지난 2~3년 동안 기업들의 초점이 모델을 만드는 것에서 실제 프로덕션에 배포(Deploy)하는 것으로 옮겨갔습니다. 일단 모델을 서비스에 투입하면, 사람의 피드백을 수용하는 인프라가 필수적으로 필요해지거든요.

문제는 용도(Use Case)마다 필요한 도구들이 제각각이라는 데 있어요. LiDAR 데이터를 다룬다면 LiDAR용 도구가 필요하고, 3D 데이터나 비디오로 훈련한다면 또 그에 특화된 툴이 필요합니다. AI 툴체인(Toolchain)은 아직 아주 미성숙해서, 우리가 필요한 것 중에 상당수는 아직 세상에 만들어지지도 않았어요. 앞으로 5~10년에 걸쳐서 인터넷 업계가 30년에 걸쳐 만들어온 개발자 도구들과 생태계를 AI 업계에서 다시 구축하게 될 것으로 보입니다 – 단, 훨씬 압축된 속도로 진행되겠지요.

예를 들어, 버전 관리나 네트워킹 프로토콜 같은 기존 소프트웨어 인프라 요소들이 AI 시대에 맞게 다시 태어날 것으로 예상합니다. 단 AI 시스템은 현실 환경에서 동적으로 작동하기 때문에, 전통적인 소프트웨어에 비해 신뢰할 수 있는 툴체인을 만드는 일이 훨씬 어렵다는 점이 다르겠죠.

Q. 그러게요, 고려해야 할 불확실성이 너무 많네요.

정말 그렇습니다.

Q. 아까 어노테이션 작업이나 전문가 피드백을 위해 박사급 인재들을 계속 채용하는 추세 이야기가 잠깐 나왔는데요. 전문가 피드백이 새로운 “금맥”이 되고 있는 걸까요? 여기서 사람의 역할은 뭘까요? 우리가 AI 시스템 안에서 호출만 되는 함수 같은 존재로 전락하게 되는 건 아닐까요?

제 생각에 사람은 주로 두 가지 방식으로 관여하게 될 것 같습니다. 하나는 “선호도(Preference)” 제공, 또 하나는 “피드백” 제공이에요. 먼저 소비자 측면에서 보자면, 예를 들어 개인용 AI 비서가 있다고 하면 사용자가 제공하는 선호도를 기반으로 학습할 겁니다. 언제 일어나고 무엇을 먹고 어떻게 일하는지 같은 정보를 AI에게 주면, 그런 피드백이 모델을 더 개인화하고 유용하게 만들어주겠죠.

기업 측면에서는, 전문가들이 일상 업무를 통해 피드백을 주는 형태가 될 거예요. 예를 들어 투자은행의 애널리스트는 자신의 업무 흐름을 수행하는 것 자체로 AI에게 “이게 업무 처리 방식이다”라고 계속 보여주고 있는 셈이죠. AI가 기업 내부 깊숙이 들어올수록, 사람들이 일을 해나가는 과정 자체가 AI에 대한 지속적인 피드백으로 작용하게 될 겁니다.

그리고 최첨단 연구 영역에서는, 전문가들이나 박사급 인력이 베이스 모델의 경계를 확장하기 위한 피드백을 제공하게 되겠죠 – 나중에 개별 응용 단계에서 커스터마이징이 덜 필요하도록 말입니다. 그래서 인간의 역할을 두 가지로 요약할 수 있어요: 우리가 원하는 방식과 기준에 대한 “선호”를 알려주는 역할, 그리고 모델이 어려움을 겪는 불확실한 영역에서 “전문 지식”을 제공하는 역할입니다.

Q. 말씀을 듣고 보니, 머신러닝 패러다임이 모델 중심에서 데이터 중심으로, 그리고 이제는 태스크(Task)나 맥락(Context) 중심으로 이동한 것처럼 느껴집니다. 이런 변화에 동의하시나요?

네, 100% 동의합니다. 앞으로의 구조는 이럴 거예요: 모델이 기본적인 80% 정도를 처리하고, 사람은 예외 케이스와 정책 결정에 집중하는 방식이죠. AI가 제안하면, 사람이 검증하고 조정하거나 수정하는 식입니다. 특히 투자은행 같은 분야를 보면, 애널리스트가 특이 케이스를 처리하고 전반적 정책을 조율하잖아요. 그런 분야일수록 이런 형태가 더 두드러지겠죠.

시스템은 AI와 인간이 상호 보완적으로 일하도록 설계되어야 합니다. 예를 들어 AI가 불확실한 부분을 표면화하고, 이유를 물어보고, 사용자가 편집할 수 있게 하고, 심지어 스스로 자신의 실수를 찾도록 동기 부여하는 식입니다. 이를 제대로 구현하려면, 비용과 위험, 그리고 누적되는 피드백을 추적할 수 있는 도구와 측정 시스템이 필요합니다.

Q. 데이터 레이블링 분야에는 경쟁자가 아주 많은 걸로 아는데요. 앞으로 이 분야는 어떻게 진화할까요? 그리고 엔코드 같은 회사들은 어떤 역할을 맡게 될까요?

시장에 두 가지 부류의 접근법이 있다고 봐요. 서비스 중심 회사와 소프트웨어 중심 회사죠. 서비스 중심 기업들은 주로 전문가 인력을 공급하는 데 특화되어 있습니다. 주로 최첨단 AI 연구소나 빅테크처럼 모델 연구의 한계를 밀어붙이는 곳들과 협업하죠.

반면 소프트웨어 중심 기업들은 그 작업을 가능하게 해주는 툴과 인프라를 제공합니다. 그게 바로 저희 같은 회사들입니다. 저희는 응용 AI 팀들, 포춘 500대 기업들, 일반 기업들을 주로 돕고 있어요. 이들 기업은 보통 자체적으로 거대 모델을 처음부터 만들지 않고, 시중에 나온 오픈소스나 기성 모델을 가져다가 자신들의 선호 데이터로 파인 튜닝을 하거든요.

그러니 서비스형 회사들은 주로 하이퍼스케일러나 최첨단 연구소들을 상대하고, 저희 같은 소프트웨어형 회사들은 모델을 실제 업무에 적용하고 배포하려는 기업들을 돕는 구조예요. 전자의 USP(Unique Selling Point)는 “사람(전문 인력)”에 있고, 저희 강점은 “소프트웨어”에 있습니다.

Q. 얼마 전에 공개된 Meta의 Scale AI 지분 인수 소식은 이런 분류로 보면 어느 쪽 사례일까요?

제 생각에 Scale AI는 방금 말한 “서비스 중심” 부류에 들어갑니다. 이 회사는 하이퍼스케일러들을 고객으로 삼아 성장한 훌륭한 비즈니스이고, 그동안 Meta 같은 회사에 인간 전문가 서비스를 오랫동안 제공해 왔어요. 인수 후에도 그런 부분은 지속되겠죠. 물론 세부적인 내용은 가봐야 알겠지만요 – 말들이 좀 많더군요. 확실한 건, Scale AI가 주력해온 시장은 저희 같은 소프트웨어 중심 회사들이 타겟으로 삼는 시장과는 다르다는 겁니다.

비유를 하자면, 데이터브릭스나 스노우플레이크 같은 회사를 떠올려 보세요. 이들은 하이퍼스케일러에 직접 영업을 하기보다는 주로 엔터프라이즈 기업들을 상대로 서비스를 제공합니다. 하이퍼스케일러들은 필요한 도구를 대부분 자체적으로 만들어 쓰는 경향이 있으니까요. 결국 어느 시장을 공략하느냐의 차이예요 – 어떤 회사들은 최첨단 연구소에 인간 전문가를 공급하고, 어떤 회사들은 엔터프라이즈에 소프트웨어를 공급하는 거죠. Scale AI는 전자에 가깝고, 저희는 후자이고요.

Q. 앞으로 1년 내에 지금 같은 데이터 레이블링 기업 인수 움직임이 더 이어질 것으로 보시나요?

네, 그럴 거라고 생각합니다. AI 업계는 여전히 초기 단계이고, 시장은 빠르게 통합되고 있어요. 그리고 데이터는 모델과 연산 능력과 함께 AI의 세 가지 핵심 요소 중 하나죠. 그 중에서도 독자적인 가치와 IP(지적자산)가 실리는 부분은 데이터입니다. 모델과 연산 능력은 복제가 가능해도, 데이터야말로 각 AI 시스템을 남들과 차별화하고 방어막을 쳐 주는 요소거든요. 그렇기 때문에 주요 기업들이 데이터 관련 인수를 이어갈 것으로 봅니다 – 튼튼한 데이터 인프라를 확보하고, 데이터에 대한 접근권을 가지는 것이 전략적으로 매우 중요하기 때문이죠.

Q. 맥락(Context)은 결국 사람에게서 나온다고 말씀하셨습니다. 그렇다면 요즘 화두인 합성 데이터(Synthetic Data)는 어떻게 보시나요? 자율주행처럼 희귀한 케이스나 드문 클래스의 데이터 확보, 새로운 도메인 개척 등에 합성 데이터가 많이 쓰이고 있는데, 과연 이게 데이터 격차를 메워줄 수 있을까요? 어떤 경우에 도움이 되고, 어디에서 한계가 드러날까요?

좋은 질문이예요. 합성 데이터는 물리 기반 시뮬레이션이 가능한 영역에서 특히 효과적으로 쓰입니다. 세계를 모델링하고, 무작위성(Randomness)을 더해서 실제 환경을 흉내 낼 수 있는 분야들이죠. 자율주행이 대표적인 예인데, 현실에서는 대량 확보가 거의 불가능한 롱테일의 엣지 케이스 상황들을 시뮬레이션으로 만들어낼 수 있으니까요.

합성 데이터의 한계는, 모델이 생성한 합성 데이터를 다른 모델이 학습할 때 드러납니다. 즉 이미 모델들이 “본 적 있는” 데이터를 다시 학습하는 상황이 되면 붕괴(Collapse)가 일어날 수 있어요. 일종의 “뱀이 자기 꼬리를 먹는” 격이랄까요. 하지만 효과적인 전략도 존재합니다 – 예를 들어 더 큰 모델을 활용해 작은 모델의 훈련 데이터를 생성하는 방식이 있죠.

결국 가장 성공적인 접근법은 하이브리드(Hybrid)라고 생각합니다. 현실의 데이터나 사람이 만든 데이터에 합성 데이터를 적절히 결합하는 거예요. 실제로 저희 고객사들의 사례를 봐도 이 혼합 전략이 가장 좋은 결과를 만들어내고 있습니다.

Q. 엔코드는 의료 AI, 로보틱스, 자율주행처럼 위험도가 높은(High-Stakes) 분야의 기업들과도 협업하고 있습니다. 이들 기업이 프로토타입 단계에서 실제 제품(Production) 단계로 넘어갈 때, 데이터를 다루는 측면에서 가장 자주 저지르는 실수는 무엇인가요?

저희 고객사들처럼 똑똑한 기업들은 자신들의 부족한 부분을 이미 잘 이해하고 있고, 그 격차를 메우기 위해 부단히 노력하고 있습니다. 보통 그런 회사들이 직면한 가장 큰 어려움은 자원의 제약이에요 – 최첨단 연구소나 빅테크처럼 거대한 인프라를 갖추고 있지 못하다는 점이죠. 그래서 저희 같은 회사가 필요한 것이라고 할 수도 있죠. 저희가 적절한 도구와 인프라를 제공해서, 이 기업들이 성능 좋은 AI 시스템을 프로덕션에 투입하는 속도를 자체 역량만으로 할 때보다 훨씬 앞당길 수 있게 도와주는 거죠.

Q. 그러니까 엔코드 같은 회사들이 고객사의 가이드 역할을 해주는 셈이네요.

맞습니다. 저희 제품들은 고객사들이 직접 모든 것을 구축할 때보다 더 빨리 프로토타입에서 프로덕션으로 나아가도록 돕는 역할을 해요. 사실 많은 경우에 기업이 모든 것을 자체적으로 만들기는 쉽지 않습니다 – AI 시스템은 점점 복잡해지고 있으니까요. 기업들은 갈수록 어려운 과제를 해결하고 싶어하고, 요구사항도 계속 진화합니다.

예를 들어, 한때 모델들이 단일 모달리티(예: 텍스트만)를 다루다가 이제 멀티모달로 바뀌면서 완전히 새로운 도전과제들이 생겼어요. 이를 지원하는 건 웬만한 일반 기업들로서는 감당하기 어려운 일입니다. 마치 예전에는 기업들이 자체 데이터센터를 운영하다가 더 빠른 혁신을 위해 클라우드로 넘어간 것과 비슷하게, AI 개발 분야에서도 그런 패턴을 보게 될 거라고 생각합니다.

Q. 지금까지는 주로 실용적인 이야기를 했습니다만, 혹시 함께 일하는 기업들과 AGI(범용 인공지능) 이야기도 나누시나요? 그리고 개인적으로 AGI에 대해 어떻게 생각하시나요?

물론 AGI를 목표로 하는 회사들도 있습니다. 하지만 저희는 어디까지나 Applied AI(응용 AI) – 그러니까 실제 제품에 인텔리전스를 녹여내는 것에 집중하고 있어요. 저는 지능(Intelligence)을 하나의 단일한 개념으로 취급하는 것은 어렵다고 생각합니다. 여러 층위(Level)가 존재하거든요.

하나는 “값싼” 지능입니다 – 기본적인 지식, 사실, 패턴 인식 등으로, 흔한 업무들: 이를테면 상투적인 코드를 작성하거나 문서를 요약하거나, 흔해 보이는 디자인 시안을 뽑아내는 일 등이지요. 이런 것들은 모델이 거의 비용 없이 무한히 만들어낼 수 있는 영역입니다.

다른 하나는 “값비싼” 지능입니다 – 인간의 주체성(Agency), 창의성, 독창적 통찰, 안목, 비전 같은 것들이죠. 데이터만 가지고는 쉽게 재현하거나 역공학(Reverse-Engineer)할 수 없는 일종의 천재성에 가까운 영역입니다.

앞으로 지능의 활용도가 이처럼 두 갈래로 분화될 거라고 봅니다. 값싼 지능이 필요한 부분에서는 인간 개입이 점점 줄어들겠지만, 값비싼 지능이 요구되는 분야에서는 여전히 인간의 주체성과 판단이 핵심으로 남을 거예요.

Q. 정말 흥미로운 관점이네요. 저도 개인적으로 AGI 담론보다는 응용 AI 쪽이 훨씬 더 현실적이고 재미있다고 느낍니다.

네. 결국 대부분의 모델들은 이미 “충분히 좋다”고 볼 수 있어요. 진짜 제약은 이 모델들을 실제 문제를 해결하는 제품에 녹여내는 일이죠. 어떤 형태(Form Factor)로 적용되느냐가 매우 중요합니다. ChatGPT가 이메일 쓰는 걸 도와줄 수는 있어도, 당신의 업무 전체를 대신해주진 못하잖아요. 이런 시스템들이 점점 발전하고는 있지만, 현시점의 형태로는 당분간 인간이 맡는 수많은 작업들의 긴 꼬리를 커버하진 못할 겁니다.

Q. 엔코드는 훈련 데이터부터 훈련 후(Post-training), 컨텍스트 관리까지 데이터의 모든 단계를 다루는 회사고, 특히 데이터를 안전하게 관리하는 것이 중요한 고위험 분야 기업들과 협력하고 있습니다. 엔코드에서 만들어가는 이 AI 세상에 대해 가장 우려되는 점은 무엇이고, 반대로 가장 기대되는 점은 무엇인가요?

우려되는 부분이 분명히 있습니다. AI에는 여러 위험요소가 있고, 이미 그런 면들이 나타나고 있어요. 대량 생산되는 잘못된 정보(가짜 정보)가 그 한 예죠. 어떤 콘텐츠가 AI가 생성한 것인지, 사람이 만들어낸 것인지 신뢰성 있게 검증할 방법이 꼭 필요해질 겁니다. 이런 이유로 저는 “브랜드의 가치”가 앞으로 더 올라갈 거라고 생각해요 – 제가 파이낸셜 타임스나 이코노미스트 기사를 읽으면, 그들이 최대한 객관적인 정보를 전하려 노력하고 있다는 신뢰가 가니까요.

Q. 아무래도 책임감을 갖고 검증하는 곳이니까요.

맞습니다. 앞으로는 신뢰에 투자하는 것이 경제 전반에서 더욱 중요해질 거예요.

한편으로 흥미로운 점(기대되는 부분)은 어마어마하게 큽니다. 앞으로 10년 동안 일어날 변화가 지난 50년 동안의 변화보다 더 클 것으로 보거든요. 인간과 함께 일하는 모델들이 새로운 신약을 발굴하고, 전에 없던 치료법을 만들어내고, 로봇이 가정에 들어와 집안일을 맡아주는 시대가 올 겁니다. 그렇게 되면 사람들이 보다 인간적인 일 – 가족이나 친구들과 보내는 시간, 의미 있는 일, 창조적인 활동 – 에 집중할 수 있게 되겠지요.

저는 우리가 지금까지 “인텔리전스 경제”, 즉 가치가 지식 노동에 묶여 있던 경제에서 “커넥션 경제(Connection Economy)”로 넘어가는 과정에 있다고 생각해요. 150년 전에는 소프트웨어 엔지니어 같은 직업을 상상조차 못 했듯이, 앞으로는 지금은 존재도 모르는 새로운 직업들과 역할들이 나타날 거예요. 정말 엄청나게 흥미로운 시대를 살고 있습니다.

Q. 저도 그런 미래가 너무 기다려지네요. 마지막 질문인데요 – 책에 대한 질문이예요. 저는 사람이 어떤 책을 읽었느냐가 그 사람의 생각을 만든다고 믿기 때문에 인터뷰마다 꼭 여쭤보고 있어요. 울릭 님의 사고 형성에 영향을 준 책이나 아이디어가 있다면 한 가지 추천해주시겠어요? AI나 머신러닝 관련이어도 좋고, 완전히 다른 분야여도 괜찮습니다.

좋은 책을 너무 많이 읽어서 하나만 꼽기가 어려운데…^.^ 그래도 최근에 제 삶과 커리어를 돌아보게 만든 책이 하나 있습니다. Mason Currey의 『Daily Rituals: How Artists Work』라는 책이에요. 원래는 유명 예술가들의 일과(日課)를 소개하는 신문 칼럼으로 시작했다가, 확장되어 책으로 나온 건데요. 마크 트웨인, 아이작 뉴턴, 아인 랜드 등 약 150명의 예술가와 사상가들의 일상 루틴을 다루고 있습니다.

저는 이 책에서 큰 깨달음을 얻었어요. 새로운 물리 법칙이나 훌륭한 소설, 명작 예술품 같은 위대한 성취는 한순간 번뜩이는 영감에서 나온 것이 아니라, 수년에 걸친 매일의 꾸준한 노력에서 나왔다는 점이에요. 스타트업을 만들고 성장시키는 일도 똑같다고 느꼈습니다. 사람들은 스타트업이 마치 하룻밤에 성공한 것처럼 생각하지만, 실제로는 수년에 걸쳐 축적된 노력의 결과인 경우가 대부분이거든요.

이 책을 읽으면서 아리스토텔레스의 명언이 떠올랐습니다: “우리는 반복적으로 행하는 것의 결과물이다. 그러므로 탁월함은 행동이 아니라 습관이다.” 회사 경영에도, 연구에도, AI 발전에도 똑같이 적용되는 말이라고 생각해요. AI 분야의 큰 돌파구들 역시 – 역사 속 모든 돌파구와 마찬가지로 – 지속적인 노력과 반복된 실천에서 나올 겁니다.

Q. 인터뷰를 멋지게 마무리하는, 아주 훌륭한 가르침이네요. 오늘 인터뷰 다시 한 번 감사합니다.

감사합니다. 즐거운 시간이었습니다.

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

🎙️ AI의 지속적 발전을 가로막고 있는 건 뭘까?

연산능력? 모델? AI 발전을 가로막는 진짜 장애물은 '데이터'?

Reply

Keep Reading

Turing Post Korea

Home

Account