🦸🏻#17: 인간 확장의 궁극적 형태, Co-Agency

들어가며

얼마 전까지만 해도, ‘컴퓨터와 대화한다’는 건 내 앞에 있는 터미널에 명령어를 입력하거나, 정해져 있는 메뉴 중에 뭔가를 선택해서 클릭하는 것, 그 이상도 그 이하도 아니었습니다. 하지만, 지금 우리는 문맥과 맥락을 기억하고, 우리의 의도를 짐작하기도 하고, 복잡한 작업을 할 때 협업도 할 수 있는 ‘AI 에이전트’와 자연스럽게 대화를 나누고 있습니다.

이런 변화는, 창의성과 생산성, 그리고 일이라는 것의 본질 그 자체를 바꾸고 있습니다. 지금 우리는, 인간과 AI가 진정한 협력 파트너, 즉 ‘공동의 행위자 (Co-Agent)’로서 함께 행동하면서 단독적으로는 해낼 수 없는 결과를 만들어내는, Human-AI Co-Agency의 시대로 접어들고 있습니다.

튜링 포스트 코리아의 ‘AI 에이전트’ 시리즈의 지난 에피소드에서는, 사람이 AI의 작동 과정에 개입하는 실용적인 접근 방식이라고 할 수 있는 HITL(Human in the Loop)에 대해 이야기했습니다:

🦸🏻#16: '도구'로서의 인간? - 에이전틱 워크플로우에서 HITL의 진화

지능형 시스템의 미래를 바꾸는데 꼭 필요한, Human-AI Co-Agency

turingpost.co.kr/p/16-hitl-co-agency

오늘은 조금은 더 ‘감각적’이고 ‘주관적’인 관점에서 이야기를 해 볼까 합니다. 튜링 포스트 코리아의 다른 글들과는 조금 다른 톤으로 밀도있게 진행하겠지만, 흥미로운 이야기일 것 같습니다. 함께 가 보시죠!

오늘 에피소드에서는 다음과 같은 내용을 커버합니다:

모든 데모(Demo)의 어머니, 그리고 HCI의 진화
생성형 모델, 지금 우리는 어디에 와 있는가
Human-AI Co-Agency를 해석하는 두 가지 프레임웍: ‘인간의 확장’, ‘마법사 견습생’
Human-AI 커뮤니케이션의 현재: 맥루한과 위너의 시각으로
Human-AI Co-Agency의 미래를 위한 설계 원칙
다음 단계: 실험적 인터페이스와 사변적(Speculative) 미래들
맺음말: 인간과 AI의 공진화적 여정에 부쳐
보너스: 참고자료

모든 데모(Demo)의 어머니, 그리고 HCI의 진화

1968년 12월 9일 월요일 오후, 샌프란시스코 브룩스 홀(Brooks Hall)에서 열린 ‘가을 합동 컴퓨터 컨퍼런스 (Fall Joint Computer Conference)’에서, 더글라스 엥겔바트 (Doug Engelbart)와 그의 증강 연구 센터 (Augmentation Research Center, ARC) 팀은 ‘개인용 컴퓨팅의 미래’를 90분짜리 라이브 무대 쇼에 압축해서 선보였습니다.

이 데모는, 이후 알토(Alto), 매킨토시(Macintosh), 윈도우(Windows) 인터페이스를 만든 연구자들에게 깊은 영감을 주었고, 스튜어트 브랜드는 이 데모를 ‘모든 데모의 어머니( The Mother of All Demos)’라고 불렀습니다. 엥겔바트가 취한 ‘자동화’가 아닌 ‘인간 지능의 증강’에 초점을 맞춘 접근은 HCI(Human-Computer Interaction; 인간-컴퓨터 상호작용) 연구의 ‘북극성(North Star)’ 같은 존재가 되었습니다.

그날, 관객들이 처음으로 목격한 데모의 순간은 이런 것들이었어요 (위의 동영상을 함께 보시면 좋습니다):

엥겔바트의 프레젠테이션은 Human-Computer의 Co-Agency를 향한 하나의 선언문이었습니다. ‘사람과 기계가 실시간으로 풍부하게 대화를 하면서 함께 문제를 해결하는 방식’ 말이죠. 오늘날 우리가 흔하게 생각하는 모든 대화형 인터페이스, 문서 작업 협업, 영상통화 등은 1968년 12월 그 오후, 그 한 단면을 반향처럼 담고 있습니다.

하지만 꽤 오랜 기간, 그 비전은 현실이 되지는 못했습니다 – 수많은 챗봇, 음성 비서가 등장했는데도 말이죠. 그러다, 처음 그게 “진짜다” 라고 느껴지게 해 준 게 바로 챗GPT였습니다.

재미있는 건, 2022년 대화형 인터페이스로의 도약은, 사실 거의 우연처럼 일어났다는 겁니다:

❝

“우리는 ‘Playground’라는 도구를 가지고 모델을 테스트해 볼 수 있었어요. 근데 개발자들이 모델과 채팅을 해 보면서 흥미를 느꼈습니다. 자기가 원하는 방식대로 이것저것 이야기를 해 봤는데, 그게 지금 사람들이 사용하는 형태의 초기 방식이겠죠. 우리는 ‘이거 꽤 흥미로운데? 더 좋게 만들 수 있지 않을까?’하고 생각했고, 나중에 제품화할 수 있을지도 모른다는 막연한 느낌 정도는 갖고 있었어요”

샘 알트만, 벤 톰슨과의 인터뷰에서

물론, 이 모든 게 자연스러운 이야기로 들리는 건 이유가 있습니다. Z세대 (1997년에서 2012년 사이에 태어난 세대)는 디지털 커뮤니케이션이 일상이 된 세상에서 자라난 첫 세대예요. 진정한 ‘디지털 네이티브’로서, 이 친구들의 소통 방식 그 자체가 스마트폰, 소셜미디어, 끊임없는 인터넷 연결 등을 통해서 형성된 겁니다. Z세대 커뮤니케이션의 특징 중 하나가 ‘말하기’보다 ‘텍스트로 대화하기’를 훨씬 선호한다는 점이구요.

어쨌든, 그렇게 오픈AI는 챗봇을 만들었고, ‘챗GPT 모먼트’와 함께 지금의 ‘생성형 AI 혁명’이 시작되었습니다. 거창한 마스터플랜이 아니라, 하나의 우연한 우회로가 전체 지도를 바꿔놓은 셈이라고나 할까요?

한 때 소프트웨어 개발자가 정해놓은 메뉴를 탐색하거나 구조화된 쿼리를 입력해야 했던 작업들, 이제는 자연어로 그냥 물어보면 됩니다. ‘우리가 컴퓨터에 맞추는’ 시대에서, ‘컴퓨터가 우리에게 맞추는’ 시대로의 전환을 의미하는, ‘대화가 인터페이스가 되는 시대’가 시작된 겁니다.

순전히 역사에 대한 애정을 담아서, 그리고 HCI의 오랜 진화를 한 번 실제로 확인해 본다는 관점에서, Claude에서 직접 만들어본 타임라인을 소개합니다:

생성형 모델, 지금 우리는 어디에 와 있는가

자, 이제 우리는, 각자의 ‘주력 모델’을 정하게 된 시점에 와 있습니다. 대화를 나누고 글을 쓸 때 쓰는 모델, 코딩할 때 쓰는 모델, 이미지를 만들 때 쓰는 모델, 제품 개발할 때 API로 활용하는 모델. 각각이 우리 생활의 ‘디지털 루틴’의 서로 다른 부분에 자연스럽게 자리잡기 시작하고 있습니다. 누가 그렇게 정해줬다기보다는, 우리가 특정 작업을 할 때 선호하는 방식이 누적된 결과라고 할 수 있을 겁니다.

그리고, 이런 모델들 중에 일부는, 벌써 일종의 ‘기억’을 가지기 시작했어요. 이건, 아마 모든 걸 바꿀 만큼 중요한 변화일 겁니다. 경험이 더 개인화되고, 더 현실감있게 느껴집니다. 내 챗GPT는 나를 이해하고, 나 역시 그것과 어떻게 협업해야 할지, 어떻게 하면 유용하게 작동하도록 할 수 있는지를 계속해서 배워왔습니다.

예를 들어서, 어떤 작업 시작 전에 “아동 심리에 대해서 알고 있어?”처럼 먼저 알고 있는지 물어보는게 좋다는 걸 알게 됐습니다. 그 짧은, 찰나의 인터랙션만 가지고도 마치 이 기계가 나와 함께 사고하고 있다는 느낌을 줍니다 – ‘우리’의 협업에 어떤 리듬이 있는 것처럼 느껴지는 겁니다.

Claude와 ‘함께’ 코딩하는 사람들한테도 비슷한 이야기를 들었습니다. Claude는 그 사람들을 ‘잘 이해한다’고 합니다. 하지만 저한테는 그렇게까지는 아직 와닿지 않았고, 그 자체가 지금 우리가 어디쯤 와 있는지를 보여준다고 생각해요. 즉, 우리는 이제 이런 지속적인 연결을 맺기 시작하는 단계에 있는 셈이고, 각각의 모델들에게 어떤 방식으로 말을 거는 게 효과적인지, 어떻게 하면 서로 더 잘 이해할 수 있을지를 점차 배워가고 있는 겁니다. 환경이 되는 분들은, 초기 단계의 기억 저장소를 조금씩 채워가면서 모델이 응답하는 방식, 기억하는 방법을 형성하고, 조금씩 개인화를 해 가는 중입니다.

하지만, 여전히 긴장감도 감돌고 있습니다. 우리 주변에 너무나 많은 모델들, 그리고 플랫폼들이 흩뿌려져 있어요. 각각 서로 다른 상호작용 방식, 서로 다른 장단점을 갖고 있지만, 또 기억 방식이 다르거나 아예 기억이 없기도 합니다.

이 모든 모델들 간의 흐름을 어떻게 이어갈 수 있을까요? 우리가 쓰는 모델들에게 ‘우리가 누구인지’ 어떻게 가르칠 수 있을까요? 특히, 우리 스스로가 끊임없이 서로 다른 시스템 사이를 오가면서, 그 어떤 시스템도 ‘우리’를 제대로 기억할 수 없는 상황에서 말이죠.

그리고, 모델들과 플랫폼들의 변화는 우리가 실행하는 요청의 구성 방식, 그리고 기타 다른 커뮤니케이션의 패턴에도 변화를 가져옵니다. 이런 커뮤니케이션 방식에 대한 선호도의 변화가 다시 기술 기업들이, 특히 AI 분야에서 자사 제품을 설계하는 방법론에도 상당한 영향을 미쳤습니다.

기업들은 자사의 타겟 사용자층이 가진 선호도 역시 고려하죠. 앞서 언급한 Z세대는 디지털 네이티브 세대로, 아래와 같은 특성을 보입니다

간결성, 시각 중심 커뮤니케이션: Z세대는 짧고 핵심적인 ‘바이트 사이즈’ 메시지로 소통하는데, 종종 강렬한 이미지와 함께 전달합니다.
멀티스크린 멀티태스킹: 여러 기기와 앱을 넘나들면서 자연스럽게 커뮤니케이션을 이어갑니다.
즉각적 응답 기대: 인스턴트 메시징 환경에서 자란 만큼, 빠른 응답을 당연하게 여깁니다.
시각적 표현 선호: 단순한 텍스트보다는 이미지, 이모지, 영상 등을 활용해서 자신을 표현하는 경향이 강합니다.

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

프리미엄 플랜으로 업그레이드하시면 튜링 포스트 코리아의 모든 컨텐츠를 제한없이 보실 수 있습니다. 프리미엄 구독자가 되어 주시면 튜링 포스트 코리아의 컨텐츠 제작에 큰 도움이 됩니다. 감사합니다!

프리미엄 구독하러 가기

주간 AI 뉴스레터
AI 유니콘 기업들에 대한 심층 분석 기사
AI 기술, 산업, 정책 전문가 인터뷰
AI 기술 및 산업에 대한 심층 분석 시리즈
분석 기사 요청 및 튜링 포스트 코리아 기고

읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!

🦸🏻#17: 인간 확장의 궁극적 형태, Co-Agency

들어가며

모든 데모(Demo)의 어머니, 그리고 HCI의 진화

생성형 모델, 지금 우리는 어디에 와 있는가

튜링 포스트 코리아의 인사이트가 담긴 컨텐츠를 마음껏 읽어보세요!

Reply

Keep Reading

Turing Post Korea

Home

Account