🦸🏻#10: 최신의 AI 모델들은 진짜로 '추론'을 하는 걸까요?

들어가며

최근 AI 모델의 발전 방향 중 가장 중요한 게 아마 ‘추론 (Reasoning)’할 수 있는 모델을 만드는 것일 겁니다. 오픈AI의 o1과 o3, DeepSeek의 R1, 구글의 Gemini 2.0 등, 지난 3개월 간 계속해서 등장한 모델들은 계속해서 연구자와 일반인들에게 생각할 거리를 던져주고 있고, 논쟁거리가 되고 있습니다: “이런 AI 모델, 그리고 서비스는 진짜 추론을 하는 능력을 가지고 있는 건가?” 하는 거죠.

오늘 ‘AI 에이전트’ 시리즈의 에피소드는, 튜링 포스트 독자들인 Charles Fadel (Center for Curriculum Redesign의 설립자이자 President), 그리고 John Thompson (Causal AI의 저자, 그리고 곧 출간될 Path to AGI의 저자)의 가상 대화 형식으로 전해드립니다. 토론 주제가 꽤 광범위하고 복잡하지만, 일단 모델, 그리고 에이전틱 시스템에서의 ‘추론’, ‘계획’에 대한 기술적인 세부 사항은 다음 에피소드에서 커버하기로 하고, 오늘은 우리가 ‘추론’이라고 할 때 그게 뭘 의미하는 건지, 다양한 유형의 추론, 그리고 우리가 생각하고 정보를 처리하는 여러 가지 방식에 대해서 한 번 탐구해 보겠습니다. 이 두 사람, 특히 Charles Fadel의 의견들 중 어떤 것들에는 확정적으로 동의하기는 어렵지만, ‘추론’이라는 게 무엇인지, 그리고 추론 능력과 관련해서 ‘LLM’의 성능을 어떻게 바라봐야 할지라는 관점에서 하나의 생각의 틀이 될 수 있는, 좋은 틀이라고 생각합니다.

오늘의 질문에 답을 하려면, 먼저 사용하는 용어를 명확하게 정의할 필요가 있습니다. 머신러닝, 철학, 심리학 등에서의 가르침과 통찰력을 끌어와서, AI 모델의 ‘사고’가 인간의 ‘사고’와 어떻게 비교되는지 살펴보기 전에 먼저 ‘추론’이라는게 뭔지 - 그리고 뭐가 아닌지 - 명확히 해 봅시다.

이 모든 것의 시작은, Charles Fadel이 튜링 포스트에 글을 보내면서 시작되었습니다. Charles는 저희에게, 튜링 포스트에서 자신이 쓴 논문 ‘Does Present Day GenAI Actually Reason?’을 기반으로 해서 글을 쓸 의향이 있는지 물었습니다.

이 논문에서 Charles는 두 가지 근본적인 질문을 명확하게 하고자 했는데요. 그 두 가지는:

인간의 추론에 관련된 인지 과정은 어떤 건가?
GenAI가 이런 과정을 어느 정도까지 복제하거나 모방할 수 있나?

였습니다.

저희는 한 번 살펴보기로 했고, 그 과정에서 John Thompson의 아주 통찰력있는 커멘트를 발견했어요:

❝

“AI에 대해 이야기할 때 용어 사용에 주의해야 합니다. 많은 사람들이 모델이 추론한다고 말합니다. 추론 - 적어도 제게는 - 은 어느 정도의 독창적인 생각이나 사고를 내포합니다. LLM은 추론하지 않습니다. LLM은 놀라울 정도로 빠른 속도로 ‘계산 (Inference)’하지만, 실제로 ‘추론 (Reasoning)’을 하지는 않습니다.

요즘은 모델이 ‘생각’할 시간이 더 있을 때 더 나은 성능을 보여준다는 이야기들을 듣게 되는데요. 이건 ‘생각’이 아닙니다. 이건 조건이 충족될 때까지 반복되는 연산입니다. ‘사고’가 아니라 ‘목표의 추구’입니다.”

John Thompson

John의 관점에 동의할 수도 있고 아닐 수도 있지만, 어쨌든 ‘핵심적인 문제’를 잘 드러냅니다 - 바로, 우리가 ‘추론’이라는 말을 할 때 정확히 그게 무슨 의미인가 하는 거죠.

Charles도 논문에서 이 ‘정의의 어려움’을 이야기합니다:

❝

“이런 질문을 다루는데 있어서 일차적인 어려움은, 어떤 문헌에도 ‘추론’, 또는 ‘사고 방식’이라는 표현이 뭘 의미하는지에 대해서 하나의, 보편적으로 받아들여지는 정의가 없다는 겁니다. 인지 과학에서는, 분석적이고 연역적인 추론부터 창의적이고 직관적인 과정까지 수없이 다양한 형태의 ‘사고’를 인정하지만, 이런 여러 방식들 사이의 정의, 그 경계는 아주 모호합니다.”

Charles Fadel

Charles는 아래와 같이 ‘추론의 정의’를 제안했습니다:

의식적인 인지 과정 (A Conscious Cognitive Process).
전제, 사실, 또는 증거를 바탕으로 결론을 형성하고, 유추 (Inference)를 하거나, 설명을 만들어내는 능력.
많은 경우에 구조화된 논리적 원칙을 따르지만, 반드시 형식 논리에만 국한되지는 않음.

여러 가지 참고 자료들과 연구 내용을 검토한 뒤에, Charles는 ‘추론’이 무엇인지를 간결한 설명으로 종합해 냈습니다:

“추론 (Reasoning)이란, 설명을 형성하고, 유추를 하거나, 결정을 내리기 위해서 사실, 전제를 통해서 생각하는 과정이다.”

‘추론’은, 모든 에이전틱 시스템의 핵심적인 구성 요소 중 하나입니다.

생각의 모드 (Modes of Thinking)

Charles는 논문의 공동 저자인 Alexis Black 박사와 같이 아주 방대한 작업을 통해서 ‘인간의 추론, 그리고 사고 방식을 정교하게 분류’했습니다. 분류한 이 정보를 ‘AI의 추론 능력’을 평가하는 기본 자료로 사용하는데요:

“우리 논문의 핵심 중 하나가 바로 ‘사람의 사고 방식을 분류’한 것으로, AI 추론 능력을 평가하는 기초가 됩니다. 인지 과학, 심리학, 그리고 AI 분야의 광범위한 문헌을 바탕으로 여러 가지 사고의 방식을 정의하고 분류했는데, 연역적 추론이나 귀납적 추론처럼 ‘구조화된 추론 방법’에서부터, 창의적이고 직관적인 과정, 그리고 사람이 의사 결정과 문제 해결에 사용하는 인지 전략이 포함됩니다.”

아래는 전체 사고 방식의 목록입니다:

*무료 구독자들께서 보실 수 있는 내용은 여기까지입니다. AI 에이전트의 에피소드는 프리미엄 구독자들께 전체 내용이 공개됩니다. 프리미엄 플랜으로 업그레이드하시면 이 에피소드 전체를 포함해서 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다!

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

프리미엄 플랜으로 업그레이드하시면 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다. 프리미엄 구독자가 되어 주시면 튜링 포스트 코리아의 컨텐츠 제작에 큰 도움이 됩니다. 감사합니다!

프리미엄 구독하러 가기

주간 AI 뉴스레터
AI 유니콘 기업들에 대한 심층 분석 기사
AI 기술, 산업, 정책 전문가 인터뷰
AI 기술 및 산업에 대한 심층 분석 시리즈
분석 기사 요청 및 튜링 포스트 코리아 기고

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

🦸🏻#10: 최신의 AI 모델들은 진짜로 '추론'을 하는 걸까요?

들어가며

생각의 모드 (Modes of Thinking)

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

Reply

Keep Reading

Turing Post Korea

Home

Account