들어가며

여섯 번째 ‘AI 에이전트’ 에피소드를 봐 주시는 여러분, 감사합니다!

다이나믹하게 작동하는 AI 에이전트의 세계, 이 틀 안에서 프로파일링, 지식, 그리고 메모리는 서로 밀접하게 연결되어 있는 요소들입니다. 이 핵심적인 구성 요소들이 바로 AI 에이전트 시스템이 환경, 그리고 작업을 인식하고, 적응하고, 반응하는 방식을 결정하게 되죠.

지난 번 다섯 번째 에피소드에서 ‘에이전트의 6대 핵심 구성요소’ 중 하나로 ‘프로파일링’을 다루기는 했지만, 사실 ‘프로파일링’이 AI 에이전트의 설계 작업에서 독자적인 카테고리로 잘 다루는 영역이 아니기는 합니다. 그렇지만 프로그래밍된 지식, 그리고 메모리 시스템을 기반으로 해서 에이전트가 가지는 ‘정적인 능력’, 그리고 ‘동적인 적응성’을 연결하는 일종의 ‘다리’ 역할을 하는 프로파일링은, 그 중요성 측면에서는 결코 가벼운 요소가 아닙니다.

‘프로파일링’은 지능형 에이전트가 상호작용하게 되는 주변 환경, 사용자, 그리고 작업에 대한 구체적인 ‘초상화’를 만들 수 있게 하는 메커니즘입니다. 에이전트가 ‘알고 있는 것 (기존 지식)’, ‘기억하는 것 (과거 그리고 현재의 실시간 데이터)’를 종합해서, 의사결정을 섬세하게 하고, 상호작용을 더 개인화하고, 작업 수행 자체를 원활하게 하는 근간이 됩니다. 여기에 추론과 계획, 성찰, 행동, 그리고 의사소통을 더하면, 짜잔!, 전체의 ‘에이전트 워크플로우 (Agentic Workflow)’가 완성되는 거죠.

이번 에피소드에서는, 에이전트의 ‘프로파일링‘ 개념에 대해서 흥미로운 관점을 제공하는 최근, 그리고 과거의 연구 논문들을 간단히 살펴볼까 합니다. 한 번, 과거의 중요한 연구들을 재조명하고, 이것들이 현대적인 에이전트의 접근 방식에 어떤 영향을 미치는지 살펴보면 재미있지 않을까요?

오늘은 다음과 같은 내용을 다룹니다:

이 글에서 AI를 ‘의인화’하는 표현이 광범위하게 사용되는 걸 양해 부탁드립니다. 실제로 AI가 사람처럼 생각하거나, 이해하거나, 결정하거나 하는 건 물론 아니죠. 다만, 사람의 특성을 빌려 설명하는게 이해하기 쉽게 도와주는 측면이 있어서 부득이하게 에이전트와 관련된 글에서는 그런 방식을 차용하게 되는 것 같습니다.

편집자 주

프로파일링: 주변의 세계, 그리고 내가 취해야 할 행동 방식을 이해한다

프로파일링, 이 용어가 그리 흔한 용어는 아닌 것 같다가도, ‘프로파일러’라는 용어는 또 많이들 알고 계실테니, 여러분은 어떻게 생각하시는지 궁금하네요.

대한민국 1호 프로파일러시라는 권일용 선생님… ^.^

어쨌든, 저는 이 ‘프로파일링’이라는 용어가, ‘에이전트가 스스로 속한 환경과 그 안에서의 역할을 인식하는데 필요한 모든 걸을 담고 있는 용어’라고 생각하고, 그래서 이 용어가 아주 중요하다고 봅니다. 프로파일링은 에이전트가 작동하는 맥락을 관찰하고, 분석하고, 해석하는 과정이기도 합니다. 단순히 물리적이거나 디지털의 환경을 식별하는 것에 그치지 않고, 성능 지표를 평가하고 행동 패턴을 이해하는 것도 포함하구요. 에이전트가 지능적으로 행동할 수 있도록 가이드하는, ‘다차원적인 인식’을 만들어냅니다. 결국, ‘프로파일링은 에이전트의 인식에 관한 모든 것’이예요. 그렇다면, 이런 인식을 어떻게 풀어낼 수 있을까요? 답은, ‘인식의 차원을 망라하는, 올바른 질문을 하면 알 수 있다’는 겁니다.

1. 나는 누구인가? 에이전트의 아바타

스탠포드 대학교와 구글 연구자들이 쓴 훌륭한 논문이 하나 있습니다: ‘Generative Agents: Interactive Simulacra of Human Behavior’라는 논문인데요. 여기서 ‘에이전트 아바타’라는 용어를 사용해요.

이 논문에서는, 가상의 샌드박스 세계에서 생성형 에이전트를 시각적으로, 그리고 상호작용 가능한 형태로 구현했는데, 시뮬레이션된 에이전트의 행동을 관찰할 수 있는 행동, 그리고 대화로 연결합니다:

이런 프로파일, 즉 ‘아바타’는 에이전트에 ‘캐릭터’를 부여하고 ‘역할’을 정의하는데, 이걸 통해서 에이전트의 행동 반경을 정의합니다.

2. 난 뭘 하는가? 에이전트의 행동 (BDI 모델)

에이전트의 행동을 이해하고 설계하는 것은, “과연 이 지능형 시스템이 ‘상황에 대한 즉각적인 반응’, 그리고 ‘장기적으로 주어진 목표’ 간의 조화를 어떻게 만들어가는가?”를 검토하는데서 시작합니다. 여기서 BDI (Belief-Desire-Intention) 모델이 등장하는데요. 이 모델은 깊이 고민하고, 계획하고, 적응할 수 있는 에이전트를 설계하는데 있어서 아주 중요한 프레임웍입니다. BDI 모델에서는, 에이전트가 하는 의사 결정을 세 가지의 핵심적인 정신적 태도로 구성합니다:

  • 신념 (Beliefs): 에이전트가 세상에 대해서 알고 있거나 가정하는 것

  • 욕구 (Desires): 에이전트가 달성하고자 하는 목표나 결과

  • 의도 (Intentions): 에이전트가 ‘욕구’를 추구하기 위해서 실행하기로 결심한 계획

BDI 모델의 철학적인 뿌리는 마이클 브랫맨 (Michael Bratman), 그리고 그가 쓴 1987년 저서 ‘Intention, Plans, and Practical Reason’으로 거슬러 올라가요. 브랫맨은, ‘신념’, 그리고 ‘욕구’를 연결하는 중요한 고리로서 ‘의도’를 설명하고 있는데요, 합리적인 에이전트가 새로운 정보와 상황에 적응하면서 시간에 따라 어떻게 행동을 조율하게 되는지 설명했습니다.

‘철학’에서 ‘실제 세계’로

브랫맨이 구축한 이론적인 통찰 위에서, 1990년대 초에 아난드 라오 (Anand Rao), 마이클 조지프 (Michael Georgeff)가 추가적인 발전을 이끌어냈습니다. 이 둘은, ‘A Model-Theoretic Approach to the Verification of Situated Reasoning Systems’라는 연구를 통해서 BDI 모델을 컴퓨팅 프레임웍의 형식으로 구조화함으로써, 다이나믹한 환경에서 작동하는 합리적 에이전트를 구축하기 위한 기반을 만들어냈습니다. 이들의 연구 목표는 다음과 같습니다:

  • 불확실한 환경 하에서의 의사결정 모델링

  • 반응성(Reactivity; 즉각적인 변화에 대응하는 것)과 숙고(Deliberation; 장기적 목표 추구) 사이의 균형

  • 행동의 논리적 일관성을 유지하면서도 적응성 확보

BDI 모델이 지능형 에이전트를 위한 유일한 프레임웍는 아니지만, 에이전트의 상태를 표현하고 합리적인 의사결정 과정을 구조화하는 데 중점을 둔 이 모델은 학술 연구와 실용적 응용이라는 양쪽 모두에 큰 영향을 미쳤습니다.

상황적 추론 (Situated Reasoning), 그리고 실천 의지 (Commitment)

라오와 조지프는, 에이전트가 ‘계속해서 변화하고 예측할 수 없는 환경 속에서 작동’하는 상황적 추론의 복잡성을 다루기 위해서 이 모델을 확장했습니다. 이 과정에서, 에이전트가 자신의 신념, 행동, 환경의 불확실성에 의해 형성되는 선택지들을 포함하는, 여러 개의 ‘가능한 세계 (Possible Worlds; 마치 멀티버스처럼 들리죠?)’들의 가지 (Branch)들을 탐색한다는 개념을 도입했습니다.

이 연구에서의 핵심은, 에이전트가 목표를 얼마나 지속적으로 추구할지를 결정하는 실천 의지 (Commitment)의 개념입니다:

  • 맹목적 실천 의지 (Blind Commitment)
    성공 또는 실패가 확실해 질 때까지는 무조건 지속적으로 목표를 추구

  • 단순한 실천 의지 (Single-minded Commitment)
    목표 달성이 불가능하지는 않다면, 계속해서 목표를 추구

  • 열린 마음의 실천 의지 (Open-minded Commitment)
    변화하는 욕구나 신념에 적응해서 목표를 추구하는 걸 조정

이런 구분 자체가, 에이전트로 하여금 ‘결단력’과 ‘유연성’ 사이에 다양한 관점의 균형을 맞추고 선택을 할 수 있다는 개념을 실현하는데요, 당연하게도 에이전트가 실제 세계의 시나리오에서 효과적으로 작동하려면 이런 측면에 아주 중요하겠죠.

검증, 그리고 멀티 에이전트 시스템

지능형 에이전트가 ‘안전이 중요’한 어플리케이션에서 사용된다면, 이 에이전트의 행동을 검증하는 능력이 아주 중요할 겁니다. 라오, 조지프 두 사람은 에이전트가 ‘목표 달성’이나 ‘위험한 결과 회피’ 등의 특정한 기준에 맞춰 활동하도록 보장하는 보조적 장치로 ’분기 시간 BDI 로직 (Branching-time BDI Logic)’이라는 개념을 도입했습니다.

Branching-time BDI Logic을 끌로드에게 다이어그램으로 그리라고 해 봤습니다.

위 그림에서:

  • 최상위 노드는 현재의 상태를 나타내는데, 에이전트의 현재 BDI 상태를 포함합니다.

  • 각 분기는 가능한 미래의 상태를 나타냅니다.

  • 각 노드는 해당 시점에서의 Beliefs(신념), Desires(욕구), Intentions(의도)를 포함합니다.

  • 시간이 진행됨에 따라 새로운 분기가 생성되는데, 각 분기는 다른 가능성을 나타냅니다.

이 구조를 통해서 에이전트를 검증하는데 선형 (Linear) 또는 다항식 (Polynomial) 시간 복잡도 (Time Complexity) 등의 기법을 적용해서 효율적으로 모델을 검증할 수 있었습니다.

이런 연구에 이어서, 울드리지 (Wooldridge)제닝스 (Jennings)‘Intelligent Agents: Theory and Practice’라는 선구적인 연구를 통해서 ‘BDI 프레임웍을 멀티 에이전트 시스템을 대상으로 확장’하면서, 조정, 협상, 협력 같은 사회적인 능력을 강조하기도 했어요. 이렇게 계속 진화하는 연구는, 에이전트 대 환경 뿐 아니라 에이전트 간의 상호작용 - 때로는 신념을 공유하고 비슷하거나 같은 목표를 달성하기 위해 협력하는 - 의 복잡성을 반영하는 흐름이라고 하겠습니다.

BDI 모델은 에이전트의 행동을 설계하는 여러 가지 접근 방식 중에 하나일 뿐이지만, ‘합리성, 그리고 의사결정에 대한 강조’는 지능형 에이전트의 행동을 바라보는 귀중한 관점을 제공했습니다 - 바로 에이전트가 단순히 ‘행동’하는게 아니라, 의미있는 목표를 추구하면서 스스로의 행동에 대해서 추론할 수 있는 방법을 보여주고 있으니까요.

‘행동’에 대한 프로파일링은, 과거의 데이터와 관찰된 패턴을 기반으로 행동을 이해하고 예측하는 데 중점을 둡니다. 이건 에이전트가 하는 모든 상호작용에서 지나치게 기계적이지 않고 더 직관적으로 행동하는 것으로 느껴지도록 만드는 중요한 단계예요. 예를 들어, 추천 엔진은 사용자가 좋아할 만한 제품을 제안하기 위해 사용자의 탐색 기록을 프로파일링합니다. 마찬가지로, 가상 비서는 사용자 입력을 기반으로 다단계 작업의 다음 단계를 예상하겠죠.

이 ‘행동 프로파일링 (Behavioral Profiling)’은, AutoGPT라든가 BabyAGI 같은 현대 시스템에서 실제로 구현되는데, 이런 플랫폼들은 더 잘 적응하고 반응하는 에이전트를 만들기 위해서 과거의 데이터와 고급 알고리즘을 활용합니다. 예를 들면:

  • AutoGPT: 사용자가 제공한 목표를 프로파일링하고 반복적으로 행동을 개선합니다.

  • BabyAGI: 이전 작업의 완료 과정을 통해 학습하면서 향후의 작업 실행을 최적화합니다.

*무료 구독자들께서 보실 수 있는 내용은 여기까지입니다. AI 에이전트의 에피소드는 프리미엄 구독자들께 전체 내용이 공개됩니다. 프리미엄 플랜으로 업그레이드하시면 이 에피소드 전체를 포함해서 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다!

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

프리미엄 플랜으로 업그레이드하시면 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다. 프리미엄 구독자가 되어 주시면 튜링 포스트 코리아의 컨텐츠 제작에 큰 도움이 됩니다. 감사합니다!

  • 주간 AI 뉴스레터

  • AI 유니콘 기업들에 대한 심층 분석 기사

  • AI 기술, 산업, 정책 전문가 인터뷰

  • AI 기술 및 산업에 대한 심층 분석 시리즈

  • 분석 기사 요청 및 튜링 포스트 코리아 기고

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

Reply

Avatar

or to participate

Keep Reading