Turing Post Korea
Posts
에이전틱 시스템과 프레임웍 15選

에이전틱 시스템과 프레임웍 15選

Ben Eum & Ksenia Se
December 28, 2024

올해 튜링 포스트 코리아는 ‘AI 에이전트’ 시리즈를 시작해서 AI 에이전트에 대한 모든 것을 단계별로 살펴보는 작업을 진행하고 있습니다. 많은 분들이 이 시리즈에 관심을 가져주시기도 하고, 또 이 영역에서 엄청나게 많은 연구 논문들이 나오고 있는 걸 보면, 올해, 그리고 앞으로 가장 인기있고 중요한 주제 중 하나라는 건 분명한 것 같습니다.

2025년에는 몇 가지 종류의 에이전트가 새로운 전환점을 맞이할 거라고 생각하고, 계속해서 학계와 업계를 주시할 생각인데요.

이 글에서는 올해 등장한 에이전틱 시스템과 프레임웍 15가지를 살펴볼까 합니다:

GUI Agents: A Survey
GUI 에이전트는 클릭, 타이핑, 화면 탐색 등과 같이 사람이 소프트웨어와 상호작용하는 방식을 모방합니다. 이 서베이는 에이전트가 어떻게 보고, 생각하고, 계획하고, 행동하는지 등의 주요 특징들을 체계적으로 정리하고, 현재 맞닥뜨리고 있는 도전 과제들과 향후의 개선 방향, 그리고 연구자들을 위한 필수 도구들을 살펴봅니다. —> [더 보기]
Agent K v1.0
‘데이터 사이언스’ 업무의 전체 라이프사이클을 관리하는 자율 에이전트입니다. 유연한 추론 프레임웍을 기반으로, 경험 기반의 학습을 하고 다양한 작업을 처리합니다. 사람의 개입이 없이도 데이터 처리, Feature Engineering, 모델 튜닝을 최적화해 주는데, 자연어 처리라든가 컴퓨터 비전 등 영역에서 92.5% 수준의 성공률을 나타낸다고 합니다. —> [더 보기]
The AI Scientist
AI가 독립적으로 과학 연구를 수행할 수 있게 하는 프레임웍입니다. 아이디어를 생성하고, 코드를 작성하고, 실험을 하고 그 결과를 시각화하고, 피어 리뷰까지 시뮬레이션해서 완전한 연구 논문을 만들어 냅니다. 머신러닝 주제에 적용했을 때를 예로 들면, 논문 한 편당 15달러 미만의 비용으로 논문을 만들어 냅니다. —> [더 보기]
MALT
멀티 에이전트 LLM 트레이닝으로 추론 능력을 향상시켜 줍니다. 여러 개의 LLM이 복잡한 문제를 해결하기 위해 협력하도록 해 주고, Generator, Verifier, Refiner 등 서로 다른 역할을 맡아서 단계적으로, 반복적으로 각자의 출력값을 개선합니다. —> [더 보기]
Agent S
AI가 GUI로 컴퓨터와 상호작용하면서 실제 사용자처럼 복잡한 작업을 자동화할 수 있게 해주는 개방형 에이전트 프레임웍입니다. 새로운 시스템을 학습하고, 장기적인 작업을 계획하고, 변화하는 인터페이스에 적응하면서 스마트한 계획 도구 및 멀티모달 AI 모델로 작업의 실행 능력, 추론 능력을 향상시켜 줍니다. —> [더 보기]
Automated Design of Agentic Systems (ADAS)
‘메타 에이전트가 코드를 사용해서 에이전트를 만들고 개선할 수 있게 해 줍니다. 이렇게 만들어진 에이전트들은 기존에 설계된 것보다 더 성능이 뛰어날 뿐 아니라 다양한 작업에서 고르게 잘 작동해서, 더 스마트하고 적응력있는 AI 시스템의 가능성을 보여준 사례입니다.
—> [더 보기]
AgentInstruct
마이크로소프트 리서치의 프레임웍으로, 텍스트나 코드 등 간단한 입력값으로 고품질의 합성 데이터를 자동으로 생성합니다. 이 프레임웍으로 실제로 글쓰기, 코딩, 이해력 등을 모델에게 가르칠 때 사용할 데이터셋을 만들었다고 하고, 여러 가지 벤치마크에서도 큰 성능 향상치를 보여줍니다. —> [더 보기]
AgentStore
앱스토어와 비슷한 형태로, 다양한 디지털 에이전트들을 결합해서 복잡한 작업을 자동화할 수 있도록 설계한 플랫폼입니다. 앱 추가하듯이 사용자들이 3rd Party 에이전트를 추가할 수 있고, ‘TokenAgent’ 전략을 가진 ‘MetaAgent’로 다른 에이전트들을 관리하면서 각각의 작업에 맞게 전문적 기술과 일반적 기술 간 균형을 맞춰줍니다. —> [더 보기]
WALL-E
LLM과 학습된 규칙을 결합, 주변 환경을 이해하고 탐색하는 에이전트 시스템입니다. LLM의 예측을 실세계 다이나믹스와 합치, 조정하고, MPC (Model-Predictive Control)을 사용해서 효율적으로 행동을 계획합니다. —> [더 보기]
“Generative Agent Simulations of 1,000 People”
1,052명의 실제 사람들의 태도와 행동을 모델링해서 인간의 행동을 시뮬레이션하는 새로운 에이전트 아키텍처를 제안합니다. LLM과 인터뷰 데이터를 사용해서, 이 에이전트들은 85%의 정확도로 인간의 반응을 재현한다고 하는데, 이건 시간이 지나도 사람들이 자신의 이전 답변과 일관성을 유지하는 정도와 비슷한 수준입니다. —> [더 보기]
DynaSaur
에이전트들이 범용의 프로그래밍 언어로 다이나믹하게 액션을 만들어서 실행하는 에이전트 프레임웍입니다. 한 번 만들어진 액션은 나중에 재사용할 수 있어서 시스템의 적응성, 유연성을 높여줍니다. 또, DynaSaur는 예상하기 어려운 상황을 효과적으로 처리할 수 있고 GAIA 리더보드에서 최고 성능을 달성했습니다. —> [더 보기]
PRefLexOR
AI 모델이 단계를 반복하면서 사고를 개선해 가서, 결국 스스로 더 나은 추론을 하도록 돕는 방법입니다. Preference Optimization (선호도 최적화)와 강화 학습의 아이디어를 결합해서, 다이나믹한 지식 그래프라든가 샘플링과 같은 도구를 사용해서 깊이있는 추론을 위한 답변을 할 수 있을 때까지 개선을 계속합니다. 이 기법은 과학 연구라든가 Cross-Domain 어플리케이션 같은 영역에서 유용하게 쓸 수 있습니다. —> [더 보기]
Generative World Explorer (Genex)
AI 에이전트가 도시 풍경과 같은 3D 환경을 ‘머리 속으로’ 탐색할 수 있게 하는 프레임웍으로, 사람이 세상의 보이지 않는 부분을 상상하는 것처럼 ‘계속해서 물리적으로 탐색을 않아도’ 스스로 이해한 내용을 업데이트할 수 있습니다. —> [더 보기]
Bel Esprit
복잡한 작업을 처리하기 위해서 여러 개의 모델을 결합, AI 파이프라인 만드는 것을 도와주는 대화형 에이전트입니다. 작은 에이전트들이 협력해서 사용자의 요구를 이해하고, 적절한 모델을 선택하고, 파이프라인을 구축하는 멀티 에이전트 시스템을 사용합니다. —> [더 보기]
AutoKaggle
멀티 에이전트 시스템을 사용, 표 형식의 데이터 작업으로부터 코딩, 디버깅, 테스트와 같은 프로세스를 자동화하면서도 모든 단계에서 사용자가 입력을 할 수 있도록 허용하는 프레임웍입니다. 데이터 정제, Feature Engineering, 모델링을 위한 도구들로 작업의 흐름을 간소화합니다. —> [더 보기]

*읽어주셔서 감사합니다. 재미있게 보셨다면 친구와 동료 분들에게도 뉴스레터를 추천해 주세요.

Reply

or to participate.