- Turing Post Korea
- Posts
- 스노우플레이크: 기업의 AI 확산을 가로막는 '데이터'의 벽을 부순다
스노우플레이크: 기업의 AI 확산을 가로막는 '데이터'의 벽을 부순다
'흩어진 데이터'를 눈이 녹듯이 자연스럽게 묶어내게 해 주는 AI 인프라 회사

들어가며
기업 내에 있는 다양한 유형의 데이터를 손쉽게 통합하게 해 주는, ‘클라우드 기반의 데이터 웨어하우스’로 출발한 스노우플레이크 (Snowflake, NYSE: SNOW). AI 시대에 대응해서, 스노우플레이크는 엔터프라이즈급 LLM 모델 제품군인 ‘Arctic’, 그리고 AI 기반 어플리케이션을 개발하는 플랫폼 ‘Cortex AI’를 양 손에 쥐고 기업용 시장을 공략하고 있습니다.
스노우플레이크의 Arctic은 480B 파라미터 중 17B 파라미터를 활성화해서 사용하는 Dense-MoE 하이브리드 아키텍처를 가진 거대 언어모델로, 다른 대안들 대비 높은 비용 효율성과 최고 수준의 성능으로 기업 시장을 공략하는 스노우플레이크 AI 전략의 핵심 요소인데, 완전한 아파치 2.0 라이센스로 공개되어 있습니다.
2022년에 IPO를 했기 때문에, 스노우플레이크를 ‘유니콘’이라고 부르기는 어렵겠지만, 기업의 AI 인프라를 구성하는 중요 요소를 제공하는 스노우플레이크, 우리나라에도 비교적 잘 알려져 있는 ‘데이터브릭스’의 중요 경쟁자 중 하나인 이 회사에 대해 알아보는 건 그 자체로 큰 의미가 있다고 생각해서 이 글을 쓰게 되었습니다.
스노우플레이크의 역사, IPO 이후의 어려움과 극복하기 위한 노력 - ‘CEO-for-the-Task 전략’, 그리고 Arctic 및 Cortex AI 플랫폼에 대해서 한 번 알아보겠습니다.
오늘은 다음과 같은 내용을 다룹니다:
스노우플레이크의 시작 - 두 명의 아키텍트, 한 명의 창업자
스노우플레이크는, 전통적인 데이터 웨어하우스 솔루션에 대한 불만을 해결하고 ‘데이터 분석’이라는 작업을 재정의하겠다는 비전을 바탕으로 2021에 탄생한 회사입니다. 스노우플레이크의 목표는, 단일한 클라우드 서비스에서 모든 사용자, 데이터, 워크로드를 통합할 수 있는 새로운 데이터 웨어하우스를 만드는 것이었구요.
Benoit Dageville, Thierry Cruanes, 그리고 Marcin Żukowski는 데이터 웨어하우스 분야에서 아주 높은 전문성을 가지고 있는 사람들인데, Dageville과 Cruanes는 10년 이상 오라클의 설계자로 일했고, Żukowski는 셋 중에 유일하게 창업자로서의 경험을 가지고 있는 사람으로, 2010년 12월 Vectorwise를 Ingres에 매각하기도 했습니다. 특이하게도, 이 공동 창업자들은 셋 중 누구도 CEO로 임명하지 않기로 했다고 하는데요. 대신 Sutter Hill에서 시드 및 시리즈 A 라운드 자금을 유치하고 2년간의 스텔스 모드 기간을 거친 다음, 2014년에 첫 번째 제품을 출시하고, 시리즈 B 라운드 자금 유치도 하면서, 마이크로소프트 및 주니퍼 네트웍스에서 일했던 Bob Muglia를 첫 번째 CEO로 임명하면서 2014년에 공식적으로 출범했습니다. 이 ‘CEO-for-the-Task’ 접근 방식은 이후 스노우플레이크의 특징 중 하나가 되기도 했죠.
첫 번째 제품, AWS 기반으로 출시한 ‘Elastic Data Warehouse’를 통해서 스노우프레이크는 회사의 빠른 발전과 확장을 위한 발판을 마련했어요. 2015년까지 스노우플레이크는 4,500만 달러 규모의 시리즈 C 라운드를 했고, Strata + Hadoop World Startup Showcase에서 당당히 1위를 차지하면서 탄력을 받았죠.
이런 기세, 바로 지속적으로 데이터를 수집하는 도구인 Snowpipe, 그리고 혁신적인 데이터 공유 기능 등 새로운 기능의 도입으로 이어지면서, 스노우플레이크가 고객과 투자자의 신뢰를 강화하는데 기여했습니다. 스노우플레이크 플랫폼은 AWS를 넘어서 마이크로소프트 Azure까지 확장하면서 시장 점유율을 확대했습니다.
2019년, IPO를 검토할 때가 되었죠. 세 명의 창업자들은 Data Domain과 ServiceNow 두 회사를 성공적으로 IPO 시킨 경험이 있는 Frank Slootman을 CEO로 영입하기로 했습니다. Slootman의 리더십 아래서 스노우플레이크는 구글 클라우드로 플랫폼을 추가로 확대하고, Snowflake Data Marketplace, Snowgrid를 출시했습니다.
2020년, 스노우플레이크는 IPO에 성공했죠. 34억 달러를 조달하면서 스노우플레이크의 기업 가치가 330억 달러로 평가받은, 그야말로 기념비적인 IPO였고, 당시 소프트웨어 회사로서는 사상 최대 규모의 IPO이기도 했습니다. 주식은 첫 거래일 주당 120달러에서 250달러 이상으로 마감했구요.
…그렇지만 2022년 3월부터 초기에 투자한 투자자들에게 주당 가격이 마이너스로 돌아서기 시작했어요. 어쩌면 처음에 주가가 비이성적으로 높았다고 할 수도 있겠죠, 그게 하락 추세에 기여도 했겠구요.

Image Credit: Motley Fool
지금도, 스노우플레이크가 장기적인 매출과 성장 목표를 달성할 수 있을 거냐 하는 회의적인 시각이 있습니다. 특히 최근의 발표 자료에서 2029년 회계년도 목표에 대한 언급이 삭제되었는데, 이게 이전같이 빠른 성장세를 유지하는게 곤란해서 그런 거 아니냐는 의심을 사기도 했구요.
과연, 스노우플레이크는 앞으로 어떤 전략으로 이 상황을 돌파할 수 있을까요?
마법의 가루, AI를 더하다
2023년 5월, 스노우플레이크는 (비교적 조용히) AI 기술로 검색 산업에 혁신을 일으키려던 회사인 Neeva를 인수 (사실은 Acqui-hire에 가까워 보입니다만) 했습니다. 이 때, 스노우플레이크는 Neeva의 기술로 데이터 클라우드 검색 기능을 강화해서 생성형 AI를 통합, 기업이 데이터를 사용하는 방식을 혁신하고 더욱 직관적인, 대화형 데이터 쿼리를 가능하게 할 계획이라고 발표했습니다.
결과적으로 구글의 검색 광고 및 유튜브 수익 창출에 참여했던 사람들을 포함, 검색 분야의 가장 뛰어난 인재들이 스노우플레이크 팀에 합류했습니다. Neeva의 설립자이자 전 구글 직원인 Sridhar Ramaswamy는 스노우플레이크의 AI 담당 수석 부사장으로 합류했구요.
처음 9개월 동안에는 Sridhar의 링크드인 프로필에 "스노우플레이크 배우는 중"이라고 적혀 있었는데, 얼마 지나지 않은 2024년 2월, Sridhar Ramaswamy는 스노우플레이크의 CEO로 임명되었습니다. ^.^ 흥미로운 건, 2024년 2월은 Marcin Żukowski의 링크드인 프로필에서 '“스노우플레이크의 공동 창업자”라는 표현을 볼 수 있었던 마지막 달이기도 합니다 - 현재는 회사 웹사이트와 "How It All Started"라는 비디오 어디에서든, 마치 이 회사가 Marcin을 뺀 두 사람에 의해 시작된 것처럼 되어 있어요.
이런 변화가 상당히 ‘조용하게’ 진행되기는 했지만, 어쨌든 스노우플레이크 정도의 회사에서 CEO가 바뀌는 건 시장에서 주목을 받기 마련이죠. 그런데, 시장에서는, 이걸 달가와하지 않았어요. 이사회 의장으로 남기로 한 Frank Slootman이 사임했을 때, 스노우플레이크 주가는 시간 외 거래에서 발표 직후 20% 이상 폭락했습니다. 보통, 경영진의 변화는 그게 긍정적인 결과로 돌아오는데 시간이 걸리기 마련이죠.
어쨌든, 스노우플레이크의 전략적 초점이 ‘엔터프라이즈 AI’에 있다는 게 명확해진 순간이었습니다.
이런 전략적 방향에 따라서, 스노우플레이크는 Ramaswamy가 합류한 이후에 리드해 온 Cortex AI 플랫폼을 발표했습니다.

스노우플레이크 Cortex AI 사이트. Image Credit: 스노우플레이크
Cortex AI는 고가의 GPU 인프라에 의존하지 않고서도 LLM을 포함한 ML 및 생성형 AI 어플리케이션을 위한 서버리스 함수 (Serverless Functions)를 편하게 사용하도록 설계된 플랫폼입니다. 여기에는 데이터 탐색 및 처리 기능을 향상시켜주는 생성형 AI 코파일럿, Document AI 등이 포함되어 있구요.
스노우플레이크는 이 Cortex AI의 기능을 계속해서 확장하고 있는데요.
곧 퍼블릭 프리뷰로 제공될 Cortex Chat 기능은 사용자가 스노우플레이크 데이터를 갖고 챗봇을 몇 분만에 생성해서 자연어로 된 질문 답변을 구현할 수 있게 해 줍니다. 예를 들어서, 기업의 구조화된 데이터베이스나 비정형 문서를 LLM 기반 챗봇이 이해하고 답변하도록 해 주는 거죠.
Cortex Analyst는 메타의 Llama 3 및 Mistral 등 거대 언어모델을 활용해서 기업 내부 분석에 특화된 챗봇을 손쉽게 만들도록 지원합니다.
Cortex Search는 Neeva의 검색·랭킹 기술과 스노우플레이크의 벡터 임베딩 엔진 (Arctic)을 결합해서 하이브리드 검색 (텍스트+벡터)을 구현해 주기도 합니다.
이 외에도 다양한 개발자 도구, 모니터링 툴 등을 계속해서 추가하고 있는데, 스노우플레이크에 따르면, 이미 750여개의 고객사가 Cortex AI를 도입해서 사용하고 있고, 앞에서 본 여러 가지의 기능 강화 로드맵을 통해서 기업들이 데이터 클라우드 상에서 곧바로 AI 어플리케이션을 구축할 수 있게 하겠다고 합니다 - ‘데이터’와 ‘AI’를 결합하는 ‘종합 데이터 클라우드’로의 길을 가고 있는 게 아닌가 싶네요.
다시 돌아가서, CEO로 임명된 지 두 달만에 Ramaswamy는 스노우플레이크의 자체 LLM, Arctic을 발표했습니다. 이 LLM은 단 몇 달만에 3백만 달러를 써서 만들었다고 하는데요 - 비슷한 기업용 LLM인 DBRX에 1천만 달러를 들였다는 데이터브릭스와 비교하면 턱없이 작은 금액이죠.

스노우플레이크 Arctic 사이트. Image Credit: 스노우플레이크
데이터 클라우드 회사의 입장에서 주요 수익원은 ‘데이터 사이언스 도구’, 그리고 ‘데이터베이스’겠죠. LLM을 고객들이 더 적은 비용으로 사용할 수 있다면, 더 광범위한 유즈케이스를 구현하게 될 테고, 데이터 사용량과 함께 데이터 클라우드 회사의 수익도 올라가겠죠. 스노우플레이크, 데이터브릭스 두 회사 모두 자사의 오픈소스 LLM이 메타의 LLM을 사용하는 것보다 저렴하다고 주장하고 있어요. Sridhar Ramaswamy는, 스노우플레이크의 새로운 모델, Arctic을 사용해서 기업이 AI 어플리케이션을 적절한 가격에 만들 수 있다는 걸 보여준다면, 장기적으로 상당한 수익을 창출할 수 있다고 믿습니다.
Arctic – 특별한 점이 뭔가?
오픈소스는 소프트웨어 업계 뿐 아니라 AI 학계와 업계에서도 강력한 트렌드 중 하나죠. 특히 최근 DeepSeek 사태 이후 더 뜨거운 관심이 이어지고 있는데요, Arctic은 ‘가장 개방적인’ 거대 언어모델이라고 불립니다. 또 한 가지 주목할 점은, 그 자체로 꽤 오래 된 아키텍처이긴 하지만 DeepSeek 때문에 더 사람들에게 익숙해진 MoE (Mixture-of-Experts) 아키텍처를 사용하는 모델입니다.

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!
무료 구독자들께서 보실 수 있는 내용은 여기까지입니다. 프리미엄 플랜으로 업그레이드하시면 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다.
프리미엄 구독자가 되어 주시면 튜링 포스트 코리아의 컨텐츠 제작에 큰 도움이 됩니다. 감사합니다!
주간 AI 뉴스레터
AI 유니콘 기업들에 대한 심층 분석 기사
AI 기술, 산업, 정책 전문가 인터뷰
AI 기술 및 산업에 대한 심층 분석 시리즈
분석 기사 요청 및 튜링 포스트 코리아 기고
글에 대한 리뷰를 남겨주세요! |
읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요.
Reply