AI 업계에 중대한 판가름이 나게 될 2025년

AI 업계는 곧 아주 중요한 전환점을 맞이하게 될 겁니다.

한 쪽에서는 미래에 대한 장밋빛 전망과 그럴 듯한 데모들이 제대로 된, 의미있는 혁신적인 제품과 서비스로 현실화하고 있죠 - 자율적 워크플로우, 버티칼의 AI 서비스, 에이전트 등 말이죠. AI 산업의 폭발적인 성장을 위해 필요한 기초 작업이 마무리되는 단계에 들어서면서, 이제 본격적인 ‘구축’과 ‘확산’의 시기가 오고 있는 것 같습니다. 이 시기를 맞으면서 AI를 둘러싼, 더 광범위한 윤리적인 문제라든가 통제의 문제 등을 잘 정리해 가면서, 그 동안 이 혁신적인 기술에 쏟아 온 투자를 회수하기 시작해야 할 시기이기도 합니다.

반면에 다른 한 편으로는, AI는 본질적으로 여전히 예측이 불가능한 기술이고, 그에 대한 근본적인 논쟁들이 계속되고 있습니다 - AGI란게 정말 뭔가? 에이전트가 정말 그 약속대로 기능할 수 있나? 지금까지 발전을 이끌어 온 ‘스케일링의 법칙’은 어떤 방향으로 전환될 건가? 하는 질문들은, 그 답을 아직 명확히 찾지 못한 상태죠.

사실 미래를 정확히 안다는 건, 타임머신을 타고 온 사람이 아닌 한 불가능하겠죠. ^.^ ‘예측’이라는 행위는 항상 상당한 수준의 ‘오류’ 가능성을 인정하고 시작하는 것이구요.

2024년 연말의 FOD 에피소드로 ,튜링 포스트 코리아에서는 ‘2025년 AI 씬 (Scene)에 대해 8명의 전문가들과 나눈 이야기’를 기반으로 몇 가지 흥미로운 예측을 여러분과 공유하고자 합니다. 말씀드리기 전에, 한 가지는 확실합니다: 2025년에 AI의 겨울은 오지 않을 겁니다. 아직도 AI 영역은 너무나도 뜨겁습니다.

튜링 포스트와 대담을 나눈 8명의 전문가들. Image Credit: 튜링 포스트 코리아

‘추론 시간 검색 (Inference-Time Search)’, 그리고 AGI

케라스 (Keras) 개발자이자 AI의 지능을 ‘새로운 기술 습득의 효율성’ 관점에서 새롭게 평가하는 ‘ARC-AGI 프로젝트’의 주역인 Francois Chollet는, 2025년에 AI가 가진 능력의 혁신은 ‘추론 시간 검색’이 주도할 거라고 예측합니다.

Francois는 이렇게 말합니다:

"‘추론 시간 검색’이 앞으로 몇 년간 AI 능력의 발전을 이끌고 가는 큰 동력이 될 겁니다. AI를 훨씬 더 유용하게 만들어 줘서 AI에 대한 수요를 늘릴 뿐 아니라, AI 서비스 제공의 가치를 높여서 더 높은 비용을 받을 수 있게 할 거라고 생각합니다. 이와 관련해서, 추론 하드웨어 제조업체 - 엔비디아, AMD 등 - 들이 혜택을 볼 겁니다”

튜링 포스트와의 독점 인터뷰에서 좀 더 자세한 이야기를 했는데요:

“2025년은 ‘추론 시간 검색’의 해가 될 거예요. 오픈소스 진영에서는 오픈AI가 내놓은 o1과 비슷한 카피캣 서비스를 만들기 위해서 많은 자원을 투자할 것으로 보이고, ARC-AGI에도 큰 진전이 있으리라 기대합니다.”

세계적인 회계법인이자 컨설팅 회사인 EY의 글로벌 AI 리더, 그리고 AI, Data, Analytics 관련한 4권의 서적을 집필한 John K. ThompsonAGI에 대해서 회의적인 입장을 유지하고 있습니다:

“2025년에 AGI가 달성되지는 않을 겁니다. 굳이 현실적으로 이야기를 해 보자면, 2250년경이 AGI에 도달하는 해가 되지 않을까 하구요. 물론 여기서 AGI가 온다는게 AGI가 달성될 희미한 조짐이 보인다는게 아니라 진정한 비(非) 인간 형태의 지능이 만들어지는 걸 말하는 거구요. 앞으로 100년 내지 200년은 더 걸릴 거라고 봐요."

…아무래도 ‘AGI의 의미가 무엇인지’에 대한 논쟁은 2025년에도 계속 이어질 것 같네요.

‘AI 엔지니어’라는 용어를 만들어낸 swyx, Shawn Wang내년의 AI를 좀 더 실용적인, 즉 현실의 어플리케이션이 어떻게 만들어질 지의 관점에서 예측합니다:

“오픈AI가 발표한 o1 모델처럼 모델 자체가 추론 능력을 갖춘 경우보다는, Flow Engineering이나 CoT (Chain-of-Thought) 방법론을 적용해서 모델이 적정한 답변을 하도록 하는 구조의 어플리케이션이 실제 환경에 훨씬 더 많이 배포, 운영될 걸로 봅니다.”

저희 튜링 포스트는, 2025년, AI 발전의 초점은 ‘말하기 전에 생각하기’에 두게 될 것이다 - 즉, ‘추론’이 기계 기능 (Machine Intelligence)의 핵심 의제가 될 거라고 봅니다. ‘Test-Time Computing으로의 전환’이라고도 볼 수 있는 이런 방향의 전환 때문에, 상징적 추론 (Symbolic Reasoning), 적응형 스케일링 (Adaptive Scaling), 시스템 2 러닝 (System 2 Learning), 그리고 문제 해결 능력이 뛰어난 더 작은 모델들에 많은 관심이 가게 될 겁니다. 사이즈 (Size)의 우위는 그 경쟁력을 점점 잃게 되는데, 이러 변화가 일정 부분 엔비디아가 현재 가지고 있는 하드웨어 지배력에 균열을 낼 수 있을지, 그 과정에서 또 다른 하드웨어 차원의 혁신 시장을 만들어낼지 주목합니다. 더 똑똑하고, 더 가벼운 AI의 시대, 그 초입에 들어서고 있습니다.

‘소규모 모델’이 주류의 자리로

더 작은 모델들이 많은 사람들의 상상력을 사로잡고 있죠. 마이크로소프트 리서치의 Ronen Eldan (Phi 모델 제품군의 공동 개발자)은 2025년이 ‘AI 기반 수학 문제 해결’의 전환점이 될 거라고 예상합니다. 튜링 포스트와의 인터뷰에서 이렇게 이야기했습니다:

"2025년은 언어 모델이 처음으로 수학자들을 의미 있는 방식으로 돕기 시작하는 해가 될 거라고 믿습니다. 이 모델들은 가이드를 최소한으로 주더라도 자기 완결적으로 논문을 정리하는 보조의 역할, 그리고 중간 결과에 대한 증명 등을 만들어 줄 수 있을 겁니다. 모든 단계에서 완벽하게 작동하지는 않더라도, 단순한 글쓰기나 스타일 개선을 넘어선 의미있는 기여를 할 수 있는 정도는 될 거라고 봐요."

Focus.ai의 창업자이자 AI Practitioner인 Will Schenk‘더 작은, 목표 지향적인 모델들의 실용성’을 강조하면서 그런 방향으로의 전환을 기대한다고 합니다:

"더 작고 더 치밀하게 만들어진 모델들이 나올 겁니다. 불필요한 지식은 줄이고, 추론에 집중하는 훈련 방식이 더 각광받을 걸로 보구요. 응용의 관점에서도, 사람들이 더 작은 모델을 어떻게 활용할 수 있는지, 어떻게 더 목표 지향적으로 AI를 활용할 건지에 대해서 감을 잡기 시작할 거예요. 이러다 보면 자연스럽게 다양한 장치 위에서 비용 효율적으로 운영할 수 있는 방법들이 등장할 겁니다.”

Liquid AI의 Head of Post-Training인 Maxime Labonne 역시 소형 언어모델이 더 대중화될 한 해로 2025년을 전망합니다:

“‘엣지 (Edge) LLM’ 영역이 소형 언어모델, 그리고 그에 맞춰 최적화된 추론 기능의 발전으로 인해서 쓸만해지고, 점점 더 대중적인 수준으로 발전할 것입니다.”

‘멀티 모달리티’, 그리고 새로운 역할의 탄생

Maxime은 “2025년 중반 쯤에는, ‘멀티 모달리티 모델’이 사실상 새로운 흐름의 표준이 될 것이고, 여러 가지 모달리티 중에 음성과 오디오 형태도 더 많이 활용하게 될 겁니다.”라고 강조합니다.

swyx는 다시 한번 더 실용적인 관점에서 이야기합니다: "2025년에는 모든 챗봇이 사용자의 실시간 음성을 입력 모달리티의 하나로 처리하도록 변화할 겁니다. 미래에는, 챗봇과의 대화 입력창에 즉시 사용할 수 있는 ‘음성 입력 옵션’이 없다는 건 상상할 수 없는 일이 될 거예요."

Will Schenk는 "더 긴 시간을 비디오와 상호작용하고 조작할 수 있게 해주는, 진정한 멀티모달 모델이 등장할 것"이라고 덧붙이네요.

저희는, 2025년에 AI 영역에서 언어와 멀티 모달리티의 추가적인 발전이 이어지는 것은 당연할 텐데, 결국 그런 발전이 현재의 텍스트 기반 프롬프트를 넘어선 소통으로 이어질 거라고 생각합니다.

우리가 현재 알고 있는 ‘프롬프팅’은 이미 그 의미가 퇴색되고 있고, 사람이 AI와 더 편하게, 더 직관적으로 소통하기 위한 다양한 방책이 시험대에 오를 겁니다. 우리가 한 때 구글 검색에 대해서 배우면서 익숙해졌듯이, 2025년에는 많은 사람들이 AI와 텍스트, 오디오, 이미지, 제스처 등 다양한 방법으로 소통하는 법을 경험하는 원년이 될 겁니다.

이런 발전의 결과로, 현재 각광받고 있는 ‘프롬프트 엔지니어’라는 역할의 필요성은 줄어들고 ‘AI 관리자’, ‘AI 큐레이터’ 같은 좀 더 넓은 역할을 많이 만들어질 거라고 봅니다 - 이 역할들의 본질은, AI가 정확하고 윤리적으로, 효과적으로 유지될 수 있도록 워크플로우와 AI 기능을 통합, 개선하는 전문가라고 보면 되겠습니다. 최고 AI 책임자 (Chief AI Officer)는 기업, 기관에서 전략적으로 AI 과제를 이끌면서 더욱 중요한 위치를 차지하게 될 겁니다.

에이전트, 에이전트, 에이전트

John K. Thompson은 “2025년이 AI 에이전트의 해가 될 거라는 건, 이미 너무 많은 사람들이 이야기하고 있죠. 아마 수백만 개의 에이전트가 배포될 지도 모릅니다. 단순 에이전트, 지능형 에이전트, 그리고 2025년 말에는 다형성 에이전트(Polymorphic Agents)도 등장하면서 본격적으로 에이전트가 에이전트를 만드는 모습을 보게 될 겁니다."라고 힘주어 이야기하네요.

여러분도 느끼시겠지만, 2025년에도 에이전트와 에이전틱 워크플로우가 계속해서, 더 많이 모두의 관심을 사로잡을 거라는 건, 거의 보편적인 합의라고 봐도 될 듯 합니다. 그렇지만 그 이면에서는, 여전히 ‘에이전트’가 정말로 무엇을 의미하는 건지, 그리고 ‘에이전트’의 실제 배포와 운영에서는 또 어떤 새로운 이슈들이 생겨날지에 대해서는 아직 구체적이고 명확한 논의가 되고 있지 않습니다. 이 문제는 2025년에도 말끔하게 해결되지는 않을 거라고 생각합니다.

산업에 큰 변화와 파괴적 혁신이 일어날 한 해

Adarga의 Product Manager인 Ollie Carmichael은, "2025년, AI 기술의 발전이 의료 분야, 특히 개인 맞춤형 의료 영역에 가장 큰 변화를 일으킬 겁니다. 공공 의료 서비스 Provider (예: 영국 NHS)가 계속해서 증가하는 비용과 환자의 적체 등 문제로 어려움을 겪는 가운데, 유전자 정보, 생활 방식, 임상 데이터 등을 통합해서 개인별로 맞춤화된 치료 계획을 제공하는 서비스의 비용, 그리고 진입 장벽이 낮아질 겁니다. 여기에 실시간 피드백 기능을 통합한다면, AI 기반의 맞춤화된 의료 서비스가 주류가 될 수 있습니다.”라고 이야기했습니다.

Maxime은 “AI 산업이 초기 단계를 벗어나면서, 오픈AI가 앤쓰로픽, 그리고 구글과의 심화하는 경쟁에 밀리기 시작하면서 ‘최첨단 모델의 리더’로서의 지위를 잃게 될 겁니다.”라고 이야기합니다.

여러분은 어떻게 생각하세요? 저도 개인적으로 베팅을 해야 한다면, ‘구글’에다가 할 것 같습니다.

기술을 넘어선, 복잡한 숙제와 맞닥뜨릴 한 해

Maxime은 "기존 기업들이 초기의 전면적인 오픈소스 정책으로부터 전환, 모델의 계층을 구분해서 접근을 허용하거나, 허용 범위가 줄어든 라이센스로 모델을 제공하는 전략을 구사하게 되면서, 오픈소스 환경에 대대적인 변화가 나타날 것”이라고 경고하기도 했습니다.

Ollie는 특히 전략적 기술로서 AI를 둘러싼 지정학적 충돌과 그 영향에 대해 주목합니다:

"미국과 중국의 AI 경쟁에 대한 인식이, 2025년에는 전혀 새로운 수준에 도달하게 될 겁니다. 결과적으로, 최첨단의 AI 연구는 점점 더 국가적인 안보 관점에서 생각할 수 밖에 없게 될 겁니다. 최첨단의 연구가 제공하게 될 기회와 위험에 대한 이런 ‘현실적’인 고려 사항 때문에, 국제적인 협력을 중시하고 자유주의적 특성을 보이는 미국의 연구 커뮤니티 내에 마찰과 충돌이 일어날 겁니다. 이건 아마도 커뮤니티의 분열로 이어지겠죠. 독점 모델과 오픈소스 모델 사이의 경계 - 인식의 경계 뿐 아니라 커뮤니티 관점의 경계 - 도 더 명확해지고, 국가 안보의 관점을 수용하는 사람들은 전자의 진영으로, 그렇지 않은 사람들은 후자의 진영으로 이동하겠죠. 구글에서 있었던, 2018년 프로젝트 메이븐 스캔들 비슷한 일들이 일어날 수 있고, 투자의 주기에도 영향을 주게 될 겁니다.”

AI 모델을 훈련하는 데이터와 관련한 법적인 분쟁도 빼놓을 수 없죠. swyx는 "미디어와 AI 기업 간 벌어지고 있는 소송에 대해서 법원의 중요한 판결들이 나오게 될 것이고, 그 방향은 아마도 ‘공개된 컨텐츠에 대한 AI 모델 학습’은 인정하되 ‘아주 정확하게 그대로 복제하는 것에 대해서는 제한을 두는’ 방향이 될 것이다. 그렇게 되길 희망한다.”고 의견을 표명했습니다.

저희는, 산업의 관점에서, 초반의 ‘AI 골드러시’ 상태 - 즉, 수없이 많은 스타트업들이 각자 괭이를 들고 AI라는 금광을 파서 일확천금을 노리던 상태 - 에서, ‘Consolidation (통합과 합병)’의 구조로 전환될 거라고 생각합니다.

2025년부터, 빅테크를 포함한 강한 기업들이 더 작은 혁신 기업을 사들이고 기술을 흡수하는 걸 훨씬 많이 보게 될 것이고, 그 반면에 약한 기업들, 자신만의 해자가 없는 기업들을 힘없이 도태되는 모습도 보게 될 겁니다. 혁신의 물결이 몇 가지의 방향으로 모여들면서 더 단순화되고 거세질 수 있지만, 다양성이나 경쟁의 측면에서는 부정적인 측면도 있는 환경이 될 거라고 봅니다. 우리 - 그리고 사회 - 에게 주어진 질문은, 그렇다면 이 큰 기업들이 더 AI가 확산되면서 큰 혜택을 주도록 하는 방향으로 움직이도록 할 건가, 아니면 자기 품에 혁신적인 기술을 끼고 앉아서 다른 사람들이 접근하지 못하도록 하는 담장을 쳐도 손 놓고 있을 건가 하는 거겠죠. 오픈소스의 역할이 한층 중요해지는 이유입니다.

투자자의 관점

저도 개인적으로 AI 스타트업들에 다양한 Vehicle을 통해서 투자를 검토, 실행하고 있기도 합니다. 앞서 언급했다시피, 2025년은 AI가 제대로 돈을 벌기 시작하는 한 해가 될 거라고 보는데요. 물론 여전히 전체 시장 관점에서는 투자자들로부터 엄청난 자금이 필요한 시기가 계속될 겁니다.

그런 관점에서, Stripe와 Airbnb의 투자자이자 전 트위터 부사장을 역임했고, 실리콘 밸리의 거물이라고 알려진, High Growth Handbook의 저자 Elad Gil의 생각이 흥미로웠는데요:

Elad Gil의 생각을 정리해 보면:

  • 파운데이션 모델의 가치 증명
    LLM 외의 다른 영역에서도 다양한 파운데이션 모델들이 등장하고 확산될 텐데, 그 중 일부는 실제 현장에서 활용되는 모습도 보게 될 겁니다. 로봇 공학 등 이미 올해부터 모멘텀을 확인한 영역 뿐 아니라 물리학, 날씨, 소재 등 다른 도메인에서도 현실 어플리케이션이 나타날 것으로 예상하고 있고, LLM의 사후 훈련에 통합해서 파운데이션 모델을 활용하는 방향도 유망합니다.

  • 불확실성과 격동의 시기
    AI 시장에서 가장 확실한 것은, 모든 것이 너무 빠르게 움직이고 있다는 것 뿐인데요. 내년에도 AI 인프라와 GPU 클라우드, 최신 모델의 성능, 그리고 코드 생성이라든가 고객 서비스 등 핵심 어플리케이션 분야에서 계속해서 선두주자의 자리를 놓고 엎치락 뒤치락하는 모습을 보게 될 겁니다. 물론 버티컬 영역 중 일부에서는, 장기적으로 승자의 자리를 차지할 사업자가 ‘고착화’되는 것처럼 보일 수 있지만, AI는 아직도 변화의 격동의 초기 단계에 있을 뿐입니다.

  • 에이전트의 원년 - 그러나 Hype에 주의
    추론, 모델 체이닝 (Model Chaining), 에이전트에 기반한 미래를 구축하기 위한 많은 준비 작업이 계속될 겁니다. 아직 기술적으로도 초기 단계라는 사실은 부정할 수 없지만, 일부 영역에서는 스케일링이 시작되는 걸 보게 될 겁니다. 다만, 수많은 기업들이 실질과는 상관없이 ‘에이전트’라는 슬로건을 채택할 테니, 주의해야 합니다 - ‘에이전트’는 2025년 가장 주의해야 할 과대 선전 문구입니다.

Elad Gil의 ‘불확실성’에 대한 의견에는 공감하지 않을 수 없네요.

여러분은 어떤 생각을 가지고 계신가요? 혹시 빠진 게 있을까요?

트위터 라이브러리 (Twitter Library) 🐦

AI와 관련된 수많은 컨퍼런스들 중 전세계적으로 주목받는 아주 중요한 컨퍼런스, NeurIPS가 12월 10일 ~ 15일까지 열렸는데요.

금년에 채택된 많은 연구 논문들 가운데, NeurIPS에서 수상을 한 6개의 논문, 그리고 그 외 흥미로운 논문 6개를 소개합니다:

*아직 튜링 포스트 코리아 구독 안 하셨나요? 구독해 주시면 매주 중요한 AI 뉴스를 정리한 다이제스트를 받으실 수 있습니다!

튜링 포스트 팀이 읽고 있는 것들 📝

  • Beyond Fairness in Computer Vision: A Holistic Approach to Mitigating Harms and Fostering Community-Rooted Computer Vision Research
    흔히 Fairness를 자연스럽게 이야기하는 ‘언어’의 맥락을 벗어나서, ‘컴퓨터 비전’ 영역의 관점에서 Fairness와 관련된 어떤 리스크들이 있는지, 책임있게 데이터를 수집하고 모델을 개발하고 평가하기 위한 종합적인 프레임웍은 어떻게 구성해야 하는지, 향후에 컴퓨터 비전 모델 개발의 구조나 방향은 어떻게 변화해야 하는지 등에 대해 다룬 종합적이고도 상세한 보고서입니다. 구글에 있었던 Timnit Gebru와 Remi Denton이 썼네요.

  • 일리야 수츠케버의 NeurIPS 2024 발표 : ‘Sequence to Sequence Learning with Neural Networks’ 논문 등
    ‘Sequence to Sequence Learning with Neural Networks’는 2014년 일리야 수츠케버와 다른 연구자들이 함께 쓴 아주 중요한 논문이죠. 금년 NeurIPS 2024에서 일리야가 이 논문을 비롯한 본인의 AI 연구에 대한 생각을 이야기하는 자리가 있었는데요. 이 내용을 보고 튜링 포스트 팀이 X에 간단히 정리해 봤습니다:

  • 제프 딘의 NeurIPS 2024 발표 : ‘Advances in Machine Learning for Systems’
    구글에서 AI를 총괄하는 시니어 펠로우, 제프 딘이 NeurIPS 2024에서 ‘현재 머신 러닝 시스템의 개발과 관련된 주요 논점, 그리고 구글의 접근 방법’에 대한 Full Talk를 했습니다. 관심있으시면 분은 X에 올라온 영상을 한 번 보시면 좋을 것 같네요.

  • Elon Musk wanted an OpenAI for-profit
    오픈AI에서 일론 머스크와 주고받은 이메일을 추가로 공개했는데요. 일론 머스크가 지금 주장하는 것과는 달리, 영리 목적의 오픈AI를 만들고 싶어했고 시도했다는 이야기를 하고 있습니다. 본인들에게는 심각한지 몰라도, 저는 좀 이제 이런 이야기는 그만했으면 좋겠네요. ^.^;

  • Why CEO Sundar Pichai never panicked - Semafor 인터뷰
    Semafor와의 독점 인터뷰에서, 구글의 CEO인 순다 피차이는 'AI 우선' 전략 아래 꾸준히 연구와 인프라를 강화하며 경쟁 우위를 확보해 왔고, 최신 AI 모델 Gemini 2.0으로 주요 벤치마크에서 경쟁사를 앞선 성과를 이야기하고 있습니다. 챗GPT의 등장에도 패닉에 빠지거나 흔들리지 않았고, 앞으로도 초기 성과에 안주하지 않고, 앞으로 닥칠 AI 발전의 진짜 어려운 다음 단계를 준비할 의지, 그리고 대규모 인프라와 국가적 협력을 통해 혁신을 가속화하겠다는 비전을 제시하고 있습니다. 구글의, 그리고 순다 피차이의 자신감이 엿보입니다.

금주의 주목할 만한 업계 동향 📰

금주는 업계 동향도 ‘모델’ 이야기로 가득 차 있네요 - 연말에 이거 너무 정신없이 몰아치는게 아닌가 싶기는 하지만, 그래도 그 중 우리나라의 LG 엑사원 모델 출시 소식도 포함되어 있으니 그나마 위안이 됩니다 ^.^

구글, 스포트라이트의 중심에 서다

지난 한두달간의 흐름을 뒤돌아 보면, 오픈AI를 비롯한 선두 주자에 밀리는 듯했던 구글이 전반적으로 전열 정비를 마치고 달려나가기 시작하는 모습입니다. 저력을 보여주고 있는데요.

  • 구글의 Veo 2, 비디오 생성 영역에서 혁신의 선두로 나서고 있습니다. 오픈AI의 Sora를 능가하는 8초 길이의 4K 시네마틱 클립을 제공하고, 더 우수한 물리적 효과, 선명도, 카메라 제어 효과를 통해서 Veo 2는 창의적인 스토리텔링을 지원하는 한층 더 높은 기술을 선보입니다. 구글 랩스의 VideoFX에서 사용할 수 있을 텐데, 앞으로 AI 기반의 영상 등 미디어 제작이 급격하게 발전하지 않을까 싶네요.

  • 구글의 Gemini 2.0, ‘에이전틱’ AI의 영역으로 우리를 안내합니다. 멀티모달 및 도구의 통합 능력을 결합해서 더 스마트한, 우리를 위해 실제 ‘액션’을 할 수 있는 시스템의 기반이 되어 줍니다. 안전성과 책임성도 잊지 않고 있는 이 새로운 모델은, 지능적이고 행동 지향적인 AI의 미래가 어떤 모습인지를 보여줄 구글의 무기인 것 같습니다.

  • 모델은 아니지만, 구글이 Gemini API를 통해서 머신러닝 연구자들을 위한 새로운 문을 열어줍니다. 멀티모달 파인튜닝을 지원한다든가 2백만 토큰 컨텍스트 윈도우를 제공한다든가 하면서, 실제 생태계에 영향력을 미칠 수 있는 혁신을 가속화할 하나의 도구가 되리라 생각합니다. Gemini Academic Program을 통한 크레딧 신청이 지금 진행 중이네요.

코히어 (Cohere)의 멋진 업데이트

  • 캐나다의 AI 스타트업 Cohere for AI가 Maya를 소개했는데요. 이건 ‘문화적인 격차’를 해소하도록 만들어진 다국의 비전-언어 모델이라고 합니다. 440만 개의 샘플 데이터셋을 통해 훈련된 모델로 우수한 VQA 성능을 나타내고, 윤리적인 문제를 잘 대응하면서도 뛰어난 성능을 보인다고 하네요. ‘포용적 (Inclusive)’ AI라는 차원에서 새로운 기준을 제시하려고 하는 것 같습니다.

  • 코히어의 또 다른 모델, 소형 모델 Command R7B가 ‘작은 고추가 맵다’는 걸 보여줬네요. 엣지 디바이스용으로 설계되어서 속도 vs. 성능 균형을 잘 맞췄다는 평가를 받고 있는데, 비용 효율적으로 더 많은 사람과 기업이 AI를 쉽게 사용할 수 있게 해 주는 또 하나의 도구가 될 것 같습니다.

허깅페이스 리더보드. Image Credit: 허깅페이스

LG의 엑사원 (EXAONE) 3.5: 실제 적용에 초점을 맞춘 AI

  • LG AI 연구원에서 EXAONE 3.5를 공개했습니다. 실제 환경에서의 작업과 긴 문맥 이해에서 좋은 성능을 보여주는, Instruction-Tuned LLM 제품군인데요. 11개의 벤치마크에서 최고 수준의 결과를 보여주고, 효율적으로 확장할 수 있는 EXAONE 3.5는 현재까지는 비상업적 연구 목적으로 허깅페이스에서 접근할 수 있게 되어 있습니다. 상업적 목적으로 활용할 때도 접근할 수 있도록 되면 좋겠네요.

Phi-4: 마이크로소프트의 경이로운 소형 모델

  • 마이크로소프트의 컴팩트 SLM (Small Language Model)인 Phi-4가 고급 추론 작업을 쉽게 처리할 수 있도록 도와줍니다. Azure 환경에서 쉽고 빠르게 사용할 수 있도록 통합된 이 모델은 정밀도와 효율성의 밸런스를 잘 맞추고 있는데, 소형 모델이라 하더라도 시장에 큰 임팩트를 줄 수 있다는 걸 계속해서 보여주네요.

  • Phi-4에 대한 분석을 튜링 포스트에서 X에 포스팅했으니, 관심있으신 분은 확인해 보시면 되겠습니다.

금주는 추가적인 연구 논문에 대해서는 포스팅하지 않겠습니다 - NeurIPS 2024 관련한 트위터 라이브러리에서 커버한 연구 논문들, 그리고 구글, 코히어 등의 새로운 모델 소식만으로도 이미 연말 읽을거리로는 충분한 것 같아요 ^.^;

*리뷰를 남기시려면 로그인하시거나 구독해 주세요. 감사합니다!

읽어주셔서 감사합니다. 프리미엄 구독자가 되어주시면 튜링 포스트 코리아의 제작에 큰 도움이 됩니다!

Reply

Avatar

or to participate

Keep Reading