• Turing Post Korea
  • Posts
  • AI가 진짜 일 잘하게 만들기: 'Deep Research' 완전 정복

AI가 진짜 일 잘하게 만들기: 'Deep Research' 완전 정복

AI 시대 일잘러들의 비밀 무기, Deep Research 활용법 총정리

수없이 많은 AI 도구들이 하루가 멀다하고 등장하는 지금. 여러분이 가장 많이 사용하시는 Tool은 어떤 것들인가요?

저같은 경우는, ChatGPT, Claude, Perplexity를 위주로 일반적인 검색이나 질의 응답을 하고, Replit으로는 MVP 개발을 해 보고 있는데요. 특히 업무적인 면에서 조사라든가 분석 관련한 작업에 ‘Deep Research’를 꽤 많이 쓰고 있어요. 아마 여러분들 중에도 Deep Research를, 단순히 재미나 취미로, 아니면 업무와 관련해서, 잘 사용하시는 분들이 많으리라 생각합니다.

생성형 AI 서비스의 특성 상, 플랫폼마다, 도구마다 프롬프트를 어떻게 구성하고 지시를 어떻게 내리느냐 등에 따라서 받아보게 되는 결과물이 꽤 많이 달라지게 되죠 - Deep Research의 경우에도 그건 마찬가지인 것 같아요.

마침, 우버, 메타 등에서 일했고 ‘The Operator’s Handbook’이라는 뉴스레터를 운영하고 있는 Torsten Walbaum이, 여러 가지 Deep Research 도구들을 비교도 해 보고, 이런 도구들을 어떻게 하면 가장 잘 사용할 수 있는지 본인의 경험에 비춰 이야기한 글이 있어서, Community Twist 섹션을 통해서 한 번 소개할까 합니다.

자, 그럼 ‘Deep Research’의 잠재력을 100% 발휘하게끔 할 수 있는 완전정복, 함께 보시죠!

ChatGPT의 Deep Research가 출시된 순간, 그 순간은 저한테는 엄청난 ‘와우!’의 순간이었습니다.

저는 엔지니어 출신은 아닌데, 저한테는 이 기능이 제가 하는 일에서 가장 핵심적이면서도 제가 잘 하던 작업을 처음으로 ‘처음부터 끝까지 자동화’해주는 AI였기 때문이죠.

전에는 몇 시간동안 구글 검색을 하고 결과를 정리했어야 하는 일을, 이제는 몇 분만에 20페이지 정도 분량의 보고서를 쉽게 받을 수 있게 됐죠. 정말 충격적이었어요.

하지만, 모든 일이 그렇듯이, 처음 느꼈던 흥분이 가라앉고 난 다음에 차분하게 바라보니, 그 결과물들이 상당히 ‘거칠고 부족한 점도 많다’라는 걸 깨달았습니다. 예를 들어서, 좀 의심스러운 출처라든가, 조사의 방법론이 명확하지 않다든가, 보고서 내용이 형식화가 잘 되어 있지 않다든가 하는 것들이요 - Deep Research 리포트에서 수없이, 쉽게 확인할 수 있는 것들이죠.

엄청난 가능성을 보여주는 서비스인 것은 분명햇지만, “언제든 내 손안에 있는 맥킨지 애널리스트” 같은 표현을 하기에는 부족한 점이 많았어요 - 적어도, 이 도구가 가진 약점을 해결하기 위해서 많은 노력을 하지 않는다면요.

그래서, 인터넷에서 Deep Research를 사용하는 방법이라든가 가이드를 많이 찾아봤는데, 대부분 아주 일반적인 내용이라, 크게 적용이 잘 되거나 하지는 않았어요. 그래서, 제가 직접 AI 기반의 리서치 에이전트에 대한 일종의 ‘궁극의 가이드’를 써 보기로 했습니다.

전혀 과장이 없어, 제가 직접 겪은 시행착오를 기반으로 해서, 뭐가 효과적이었고 뭐가 별로였는지, 그리고 최고의 결과물을 얻기 위한 방법을 말씀드릴고 합니다. 제가 이야기하는 모범 사례들이 실제로 어떤 차이를 가져오는지 볼 수 있게끔 비교 예시도 포함하려고 했습니다.

이 글에서는 다음과 같은 내용을 다루겠습니다:

  • Deep Research의 중요한 활용 사례, 그리고 한계

  • 어떤 AI 리서치 도구가 어떤 작업에 가장 적합한지

  • 항상 최고의 결과물을 만들어주는 효과적인 프롬프트 작성법

  • 최종 리포트의 가치를 극대화하는 방법

P.S. 이번 글은 ‘AI로 실제 업무를 처리하는 방법’을 이야기하는 새로운 시리즈의 첫 번째 글입니다. 앞으로도 이렇게 실무적이면서도 깊이있는 내용을 많이 다루려 합니다. 다뤄줬으면 하는 주제가 있다면 알려주세요.

(내가 생각하는) AI 리서치 도구의 가치

AI 리서치 에이전트는 정말 유용합니다 — 하시는 업무가 뭐든 큰 상관없이요. ‘리서치’라는 말 때문에 학계나 특정한 산업, 또는 인턴 업무에나 해당되는 것처럼 들릴 수는 있지만, 아마 자세히 들여다보면 여러분도 이 작업에 꽤 많은 시간을 쓰고 있을 겁니다.

예를 들어서:

  • 프로덕트 매니저는 경쟁 시장과 제품을 조사하고

  • 창업가는 부가세, 급여, 주식 테이블 관리 방법을 확인하고

  • 사업 운영팀이라면 매주 새로운 주제를 빠르게 습득하고 다음 일로 넘어가야 됩니다.

AI 리서치 에이전트는 위에서 이야기한 모든 작업에 도움을 줄 수 있을 뿐 아니라, 업무를 벗어나서 개인적인 관심사를 조사한다든가 할 때도 유용합니다.

제 경험을 기준으로 보자면, AI 리서치 도구들의 주요 사용 사례(Use Case)는 이런 것들입니다:

AI 리서치 도구를 사용하면, 이런 작업에 드는 시간을 80~90%까지 줄일 수 있습니다. 하지만! 이런 작업을 완전히 AI에 맡기지는 마세요. AI가 만들어 낸 결과물을 아무런 확인도 하지 않고 중요한 일에 쓰다 보면, 거기에 대가가 반드시 따를 때가 올 겁니다.

적어도, 현재 버전의 AI 리서치 에이전트는, 강력한 관리자가 직접 리딩을 해야만 제대로 된, 빈틈없는 결과물을 만들어낼 수 있습니다. 그리고 그런 강력한 관리자 역할을 하려면, 조심해야 할 게 뭔지 알아야 되구요.

주의해야 할 다섯 가지 문제

문제 #1: AI 에이전트는 작업에 필요한 ‘맥락’을 요구하지 않는다

예외적인 경우도 있지만, 대부분의 AI 리서치 도구는 조사 업무를 진행하는데 필요한 맥락을 스스로 묻지 않고, 프롬프트에서 제공된 정보만 가지고 우선 작업을 시작합니다. 마치 업무에 처음 투입되어서 의욕 넘치는 인턴처럼, 보고서를 작성하는 배경 정보나 용도도 모르고 일단 실행에 들어가 버리는 거죠.

심지어 AI가 질문을 하게끔 지시를 했을 경우에도:

  • 그 질문이 중요한 포인트는 건드리지 않고 놓치거나

  • 그 질문에 대한 대답이 불충분해도 다시 물어보지 않습니다

👉 그래서, 조사를 시키게 된 상황과 목적에 대한 정보를 미리 자세히 설명하고, 누락된 정보가 있다면 질문을 하도록 지시해야 합니다.

문제 #2: ‘출처’를 제대로 다루지 못하는 경우가 많다

출처 문제는 비단 AI 리서치 도구만의 문제는 아닙니다만, 역시 ‘조사’, ‘분석’이라는 업무 특성 상 기초 자료들의 출처를 잘 골라내고 다루지 못하면 그 결과물이 훌륭하기 힘들겠죠. 우선 관찰되는 대표적인 문제들은 이렇습니다:

  • 한 두 개의 출처에 과도하게 의존해서 편향된 판단을 내림

  • 출처를 뒤섞으면서 전제조건을 설명하지 않아서, 엉성한 분석이 나오게 됨

  • 낮은 품질, 신뢰도가 낮은 출처의 자료를 사용함 (예: 익명의 Reddit 글)

  • 너무 오래된 정보를 사용함 (예: 빠르게 변하는 분야에서 5~10년 전 데이터 사용)

👉 특히 ‘데이터 기반’ 보고서를 만드는 경우라면, 1) (특히 조사하는 영역에 대해 잘 알고 계신다면) 우선시할 출처를 가이드하고, 2) 출처의 사용 방식을 투명하게 정리해서 알려달라고 요구하세요.

문제 #3: 다양한 ‘고품질’ 데이터에 접근하지 못하는 경우가 많다

Deep Research는, ‘유료’로 운영되는 출처에는 접근할 수 없습니다. 당연한 것이죠. 그런데 아시다시피, 그런 출처에 중요한, 의미있는 데이터가 들어있는 경우가 많잖아요?

예를 들어서, B2B SaaS 분석을 하려면 LinkedIn API나 시장조사기관의 자료가 필요한 경우가 있습니다. 지금으로선, 직접 다운로드해서 AI 서비스에 넣어주는 수밖에 없습니다.

또, AI 리서치 도구는 온라인에서 찾을 수 있는 정보만 쓸 수 있기 때문에, ‘복잡한 법률 이슈’처럼 전문적이고 한정적인 주제에선 문제가 될 수 있습니다.

👉 이런 경우라면, Deep Research를 ‘전문가 인터뷰를 준비하는 도구’ 정도의 개념으로 활용하는게 맞다고 생각합니다. 즉, 정확한 결론을 내려주는 게 아니라, 어떤 질문을 해야 할지 정리하는 데 도움을 받는 겁니다.

문제 #4: 판단력이 떨어지는 경우가 종종 있다

DeepResearch 종류의 서비스가 만들어내는 리포트의 판단력, 쿼리마다, 도구마다 크게 다를 수 밖에 없죠. 어떤 때는 꽤 놀라울 정도의 훌륭한 결과를 내고, 어떤 때는 고등학생 인턴 정도가 습작한 것 같은 리포트를 검토하는 건가 싶기도 해요.

또 대부분의 경우, AI 리서치 도구가 어떤 블로그 포스트에서 본 의견을 그냥 요약한 것 같을 때도 있어요. 다시 말해서, 진짜 제대로 생각한 게 아니라 랜덤하다고 할 수 있는 누군가의 생각을 따라가게 될 수 있다는 거죠.

👉 해결 방법은:

  • 우선, 가장 뛰어난 도구를 선택하도록 하세요. 나름대로의 비교는 아래에 해 놨습니다.

  • 연구 계획을 사전에 확인하고, 실행의 방법론을 구체적으로 지시하세요

  • 초안을 받은 후에 피드백을 줘서 문제를 바로잡으세요

문제 #5: 기본적인 출력의 구조나 형식이 유용하지 않은 경우가 많다

ChatGPT나 Gemini가 기본적으로 생성하는 보고서는 ‘글자 덩어리’ 그 자체입니다. 구조라고 할 만한 게 없어서 읽기가 쉽지는 않아요. 물론 AI에게 “요약해 달라”고 요청할 수는 있지만, 때로 깊이있는, 상세한 정보가 필요할 때가 있죠. 사실 상당히 많다고 느낍니다 저는.

핵심은, 읽기 쉽게 구조화된 형태로 정보를 받는 것이죠.

👉 그래서, 보고서의 구조와 포맷에 대한 지시를 프롬프트에 명시하시는 것이 좋습니다. (예를 들면, TL;DR을 추가해 달라, 개요를 정리해라, 특정한 내용에 대해서는 표 형식으로 삽입해라 등)

자, 문제점 이야기는 이 정도쯤 하면 될 것 같구요. 이제 이 도구들을 최대한 잘 활용하기 위해서 시도해 볼 만한 구체적인 방법들을 이야기해 보면 좋을 것 같습니다.

  • 먼저, 다양한 AI 리서치 도구들의 장단점을 좀 더 살펴보고, 사용 목적별로 잘 맞는 도구들이 뭔지 알아볼께요.

  • 다음으로, ‘항상’ 높은 품질의 결과물을 얻고 싶을 때 활용할 만한 모범 사례를 살펴보겠습니다.

어떤 AI 리서치 도구가 가장 좋을까?

아마 거의 모든 분들이 ChatGPT의 Deep Research에 대해서는 들어보셨을 겁니다. 하지만 Deep Research와 유사한 도구들이 아주 많죠? 지난 몇 달 사이에만 해도, 수많은 스타트업들과 기업에서 저마다 리서치 기능이나 서비스를 출시했습니다. 대표적인 것만 봐도:

  • Gemini Deep Research

  • Perplexity Research

  • Grok DeepSearch

  • Claude Research

등이 있는데, 처음 보면 전부 비슷해 보이기는 합니다. 리서치 프롬프트를 채팅창에 입력하면, 5~30분 후에 여러 페이지 분량의 상세한 리포트가 나오는 식이죠.

하지만, 항상 “악마는 디테일에 숨어 있죠” - 개인적으로 수십 개의 유즈케이스를 가지고 이 AI 기반 리서치 도구들을 테스트해 보니, 리서치에 접근하는 방식과 결과물의 품질에는 상당한 차이가 있다는 걸 확인할 수 있었습니다.

참고: 여기서는 각 모델의 기본 버전을 비교합니다. (즉, 무료 사용자 기준으로 어떤 결과를 받을 수 있는지 보여드리는 겁니다.) 프리미엄 모델 간의 성능 차이는 마지막에 따로 한 번 다룹니다.

편집자 주

AI 리서치 도구: 종합 평가 요약표

⭐ 종합 추천

요약하자면:

  • ChatGPT Deep Research가 역시 진정한 ‘딥 리서치’라는 관점에서 가장 뛰어난 도구라고 봅니다. 그 깊이와 정확도/정밀도 면에서 다른 어떤 도구도 아직 따라오지 못하는 것 같습니다.

  • Perplexity는 새로운 주제에 대해서 간단하고 구조화된 개요(Overview)를 제공하는 데 탁월한 성능을 보여줍니다.

  • 다만, ChatGPT의 가장 큰 단점은 1) 출처를 선택하는 방식과 2) 형식 없이 덩어리로 쭉 나오는 텍스트입니다.

하지만 ChatGPT Deep Research의 두 가지 단점은 프롬프트를 잘 작성하면 개선할 수 있는 부분이라고 생각합니다. 반면에, 다른 도구들의 경우에는 프롬프트로 리서치 품질을 그리 크게 끌어올릴 수는 없었습니다.

물론, 그렇다고 해도 월 200달러의 ChatGPT Pro 요금제는 개인 사용자에게는 경우에 따라서 부담하기 아주 비싼 비용이기는 합니다. 게다가 무료 및 플러스 티어는 사용량 제한이 빡빡하죠. 그래서 일상적인 사용을 하는 경우에는 다른 도구를 메인으로 사용하고, 중요한 작업에만 ChatGPT Deep Research를 쓰는 게 좋지 않을까 합니다. (편집자 주: 저도 그렇게 사용하고 있습니다.)

💰 요금 및 사용 제한

🏆 1위: Grok / 🥈 2위: Perplexity

GrokPerplexity는 무료 요금제인 경우에도 하루에 실행할 수 있는 쿼리 수를 충분히 주기 때문에, 구독을 하지 않고 Deep Research를 사용해 보고 싶은 사람에게 최적의 선택입니다.

반면에, ChatGPT와 Gemini의 무료 요금제는 한 달에 쓸 수 있는 리서치 작업의 수가 꽤 제한적이고, Claude는 아예 무료 요금제에는 리서치 기능이 없습니다.

🤔 리서치 계획

🏆 1위: Gemini / 🥈 2위: ChatGPT

프롬프트를 아주 길게 쓰지 않았을 때, 에이전트가 리서치를 시작하기 전에 뭘 하려고 하는지 미리 잘 보여주면 아주 좋죠. 중요하기도 하구요.

예를 들어서, 소프트웨어 도구들을 비교해 달라는 요청을 했을 때, 어떤 기준으로 평가할 계획인지 먼저 알고 싶겠죠. 그래야 5분이든 10분이든 지나고 보니 나온 결과가 전혀 생각지 못한 엉뚱한 결과인 경우가 발생하지 않을 겁니다.

Gemini는 유일하게 기본적으로 리서치 계획을 보여주는 도구입니다. 다른 도구들 — ChatGPT, Claude, Perplexity — 는 요청하면 보여주지만, 반드시 그렇지는 않습니다. “리서치를 진행하기 전에, 너의 리서치 계획에 대한 피드백을 내가 주고 컨펌할 수 있도록 공유해 줘” 라고 해 보세요.

Grok은 대체로 요청을 무시하고 그냥 바로 리서치를 시작해 버립니다 🤷

팁: 에이전트가 계획을 공유할 가능성을 높이려면,
① 초기 프롬프트에 명시적으로 요청하고
② 후속 질문에도 다시 한 번 요청하세요.

편집자 주

🙋‍♂️ 컨텍스트(Context) 수집 능력

🏆 1위: ChatGPT / 🥈 2위: Claude

ChatGPT Deep Research는 유일하게 사용자가 지시하지 않아도 3~5개의 적절한 맥락 질문을 스스로 던지는 도구였구요. 그리고 그 질문들도 대부분 꽤 괜찮았습니다 (유능한 분석가 - 또는 똘망똘망한 주니어 - 가 묻는 수준 비슷했습니다).

다른 도구들도 프롬프트에 “질문해 달라”고 명시하면 질문을 하긴 하는데, 일관되게 그렇지는 않습니다.

테스트한 바에 따르면:

  • Gemini의 경우, 연구 계획을 공유한 직후에 혹시 부족한 맥락이 있으면 요청하라고 하면 질문을 잘 합니다.

  • Grok은 프롬프트에 "이 내용이 우리 회사에 어떻게 적용되는지 설명해줘"와 같은 문장을 포함하면, 때때로 맥락이 더 필요해서 추가 질문을 할 필요가 있다는 걸 인식합니다.

🧠 추론 및 판단력

🏆 1위: ChatGPT / 🥈 2위: Perplexity

리서치에서 추론과 판단력은 어쩌면 가장 핵심적인 요소라고 할 수 있겠죠.

에이전트가 어떤 기준으로 분석을 했는지, 어떤 결론을 도출했는지 납득이 가지 않으면, 아무리 리포트가 길고 예쁘게 작성되어 있어도 소용이 없잖아요?

ChatGPT는 여기서도 명확한 우위를 점합니다. 평가 기준을 선정하거나 인사이트를 도출할 때, 비교적 명확한 판단 근거를 제시하고, 구체적으로 추천도 해 줍니다.

반면에, Perplexity를 제외한 다른 도구들은 자주 분석 방법이 잘 납득이 안 가거나, 결론에 도달한 논리가 불분명한 경우가 많습니다. 그래서, 결과물을 실제로 활용하려면, 내용을 꼼꼼히 검토하고 후속 질문을 하는 게 필수라고 느껴졌습니다.

📖 보고서의 깊이

🏆 1위: ChatGPT / 🥈 2위: Gemini

전체적으로는 ChatGPT와 Gemini가 가장 포괄적인 보고서를 생성합니다. 다만, Gemini는 종종 프롬프트에 없는 일반적인 설명을 덧붙이는 경향이 있습니다.

ChatGPT의 방대한 리포트는 복잡한 주제에 대해서 보다 세밀하게 검토, 고려할 수 있게 해 주는 장점이 있지만, 보고서 구조나 형식 자체는 조악하기 짝이 없어서,직접 개선하게금 지시를 추가해야 합니다 (예를 들어서, 각 섹션에 요약을 추가하라는 등). 또는, 빠르게 인사이트가 필요할 경우에는 요약을 요청하는 것도 좋은 방법입니다.

반면에, 나머지 세 도구는 오히려 반대의 문제를 안고 있습니다. 리포트의 깊이가 많이 모자라고, 수많은 출처를 검토했다 하더라도 ‘요약’ 수준에 머무른다고 느껴집니다. 디테일한 비교, 실무적인 가이드는 거의 기대하기 어렵습니다.

Perplexity 등에 “특히 철저하게 작성해 줘”, “최소 [X천] 단어 분량으로 해 줘”라고 요청하면 조금 더 자세한 리포트를 받을 수는 있지만, ChatGPT 수준까지는 어려운 것 같습니다.

리포트 구조 및 형식

🏆 1위: Perplexity / 🥈 2위: Grok

PerplexityGrok은 기본 설정만으로도 비교적 읽기 쉬운 리포트를 생성합니다. 목록 정리, 표 구성 등 시각적으로 잘 정리된 형식이 기본적으로 적용되어 있습니다.

만약 빠르게 요점만 파악하고 싶은 경우라면, 추가적인 프롬프트 없이도 잘 정리된 정보를 얻고 싶은 사용자에게 적합해 보입니다.

그렇지만, 앞서 말했듯이 다른 도구들 — 특히 ChatGPT — 은 원하는 구조를 얻기 위해서는 프롬프트로 명확한 지시를 해줘야 합니다.

📚 출처

🏆 1위: Perplexity / 🥈 2위: Claude

Deep Research 작업의 출처와 관련해서 중요한 요소는 다음과 같습니다:

  • 어떤 종류의 출처를 우선적으로 선택할 수 있는지

  • 얼마나 많은 출처를 고려했는지 (다양한 시각과 데이터의 반영 여부)

  • 선택한 출처의 품질은 어떤지

  • 인용문을 추적하는 게 쉬운지 (즉, 논리를 검토하고 근거를 확인할 수 있는지)

ChatGPT의 경우, 이 중에 ‘출처 추적’을 제외하면 기본 설정 상태에서는 모두 약한 편입니다.

하지만 실제 사용에서는 큰 문제가 되지 않는다고 보는데, 그 이유는:

  1. 요약과 결론이 여전히 타당한 경우가 많고

  2. 피드백에 아주 잘 반응하기 때문입니다.

예를 들어서, 유럽 주요 시장의 시장 규모 개요를 요청했을 때, 첫 번째 버전은 방법론도 의심스러웠고 출처도 마찬가지였습니다. 하지만 5분 만에 아래 두 가지 방법을 통해서 훨씬 나은 버전을 얻을 수 있었습니다:

  1. ChatGPT o3에게 시장 규모 추정에 적합한 최고의 데이터 출처 목록을 먼저 요청하고

  2. Deep Research에게 이 목록을 기반으로 해당 부분을 다시 작성해 달라고 요청,
    → 출처 간의 수치가 일치하지 않는 경우 왜 그런 차이가 생겼는지 가설까지 제시해 달라고 지시

프리미엄 버전, 과연 돈값을 할까?

자, 지금까지 ‘기본 설정’, 즉 ‘무료 요금제’를 기준으로 몇 가지 Deep Research 도구들을 다양한 각도에서 비교해 봤는데요. 사실은 많은 분들이 어느 정도의 요금을 지불하면서 Deep Research 도구를 쓰고 계시지 않을까 싶습니다.

그런데, Deep Research를 조금 써보다 보면 이런 생각이 들 수 있습니다: “이 비싼 프리미엄 요금제들, 과연 값어치를 할까?”

그래서, 제가 전부 유료 요금제에 가입해서 직접 써봤습니다.

결론만 요약하자면, 제가 판단하기에는 정말 Deep Research를 많이 쓰는 사용자라면 ChatGPT 프리미엄 버전만 돈값을 합니다. 나머지 도구들은, 해당 플랫폼을 다른 용도로도 쓰고 있다면 몰라도, 리서치 목적만으로는 추천하지 않습니다.

고려사항은 두 가지인데요:

1. 요청 수 제한

  • PerplexityGrok은 무료 버전에서도 충분한 리서치 크레딧을 제공합니다. 그래서, 대부분의 사용자에게 업그레이드는 필요 없습니다.

  • Gemini는 사용량 제한이 꽤 빨리 닳고, Claude는 무료로는 아예 리서치 기능이 없습니다. 하지만 이 도구들을 쓸 바엔 ChatGPT를 사용하는 게 더 낫습니다.

2. 출력 품질

프리미엄 요금제에 대한 안내를 보면, ‘고급 추론’, ‘더 심도있는 리서치’, ‘더 많은 출처 및 인용’ 같이 그럴 듯한 문구들이 붙어 있는데, 실제로 써보면 차이가 있을까요?

이것도 요약만 말씀드리면, 거의 없다고 봅니다:

  • Perplexity Pro는 무료 버전과 거의 똑같습니다. “10배 더 많은 인용”이라고 광고했지만, 실제로는 눈에 띄는 차이가 없었습니다. 그나마 차트가 많아졌는데, 솔직히 말해서 크게 더 유용하다고 느끼지는 못했습니다.

  • Grok DeeperSearch도 기대 이하였습니다. 같은 쿼리로 테스트해본 결과, DeeperSearch는 더 많은 출처를 보여주기는 했지만, 내용의 깊이에서는 ChatGPT Deep Research에 한참 미치지 못했습니다.

올바른 Deep Research 프롬프트 작성법

결국, 리서치 결과의 퀄리티의 상당 부분이 프롬프트의 퀄리티에 달려 있는 것도 현실입니다. 그냥 대충 요구사항을 써서 요청하면, 15분이나 기다린 끝에 엉망진창인 리포트를 받아보고 리서치 크레딧을 날리는 일도 자주 생길 수 있습니다.

모든 도구마다 성격이 조금씩 다르긴 하지만, 좋은 Deep Research 프롬프트의 핵심적인 구조를 잘 잡아두면, 도구에 상관없이 괜찮은 품질의 결과물을 얻을 수 있습니다.

아래에서 구성 요소를 하나씩 설명하고, 전체를 조합한 예시를 보여드리겠습니다.

Step 1: 목표를 명확하게 제시하기

당신이 Deep Research를 통해서 얻고자 하는 결과가 뭔가요? 요약이든, 추천이든, 뭔가를 비교하는 것이든, 단계별로 가이드를 해 달라는 것이든요. 그걸 명확한 목표로 제시하시는 게 좋습니다.

  • “AI 검색용 SEO가 어떻게 작동하는지 이해하고 싶어요”

  • “AI 검색엔진용 SEO 모범 사례를 간단히 요약하고, 컨텐츠의 가시성을 높이기 위한 구체적인 체크리스트를 제시해 주세요. 활용할 수 있는 도구도 하나 추천해 주세요.”

Perplexity Deep Research의 예시

Step 2: 컨텍스트(Context) 제공하기

가장 시간도 많이 들고, 가장 중요한 단계라고 생각합니다. Deep Research의 진짜 마법은 "주제 요약"이 아니라, 당신의 상황, 환경에 맞는 맞춤형 리포트를 생성해준다는 데 있으니까요.

만약에 컨텍스트를 생략한다면, AI는 임의로 필요한 컨텍스트를 가정하거나 ‘모든 사람에게 통할만한 일반적인 답변’ 정도나 제공하게 될 거예요.

포함하면 좋은 컨텍스트의 요소는:

  • 💼 비즈니스 배경 (예: 제품, BM, 지역 등)

  • 🙋‍♂️ 대상 독자 (예: 당신, CFO, 투자자 등)와 이들이 주제에 대해 어느 정도 알고 있는지

  • 🚧 제약 조건 (예: 법적 제약, 기술적 한계 등)

  • 🎯 리포트를 활용할 의사결정의 목적

💡 팁이 있다면, 만약에 프롬프트에 사용할 컨텍스트를 만드는 게 막막하다면, o3한테 이렇게 물어보세요:

"내가 [X] 주제로 Deep Research 리포트를 만들려고 해. [Y]라는 목적 때문인데, 어떤 맥락을 제공해야 가장 맞춤형으로 잘 나올까? 과거의 대화 맥락은 없다고 가정하고 답해줘."

아니면, Deep Research 에이전트에게 직접 “추가적인 컨텍스트가 필요한지 물어봐 달라”고 요청해도 좋습니다.

Gemini 예시

Step 3: 출력 형식을 명확하게 요청하기

앞서 언급했듯이, 특히 ChatGPT는 기본적인 출력 형식이 읽기 어려운 ‘텍스트의 덩어리’로 되어 있습니다. 따라서 다음과 같은 지시사항을 프롬프트에 포함하면 그 결과에 - 포맷에 - 큰 차이가 생깁니다.

문서의 내용과 구조를 명확히 지정

전체 문서와 개별 섹션에 대해 포함되었으면 하는 요소를 명시적으로 요청하세요.

예를 들면:

  • 비교표, 템플릿, 카피 예시, 코드 스니펫 등 원하는 항목을 구체적으로 지정

  • 피라미드 원칙(Pyramid Principle)을 따르도록 요청
    → 전체 요약과 각 세부 섹션에도 핵심 결론을 먼저 제시하도록

출처의 개요를 요청

출처와 관련해서는 다음의 내용들을 명시적으로 요청하는 것이 좋습니다:

  • 출처의 종류 (예: 정부 조직, 상업 기관, 언론, 블로그 등)

  • 각 출처가 어떤 내용에 쓰였는지

  • 생성 또는 업데이트된 날짜 등

Perplexity에서 B2B SaaS 소프트웨어의 TAM 분석을 했을 때의 출처 개요 예시

출력 포맷을 지정

간단한 지시 몇 가지로도 큰 차이를 만들 수 있습니다.

  • 적절한 위치에 Bullet 목록굵은 글씨를 사용하도록 요청

  • 어떤 비교라든가 개요라든가 표 형식을 우선 사용하도록 요청

Perplexity에서 출력 구조와 형식을 잘 정리해서 지정했을 때(오른쪽)와 그렇지 못할 때(왼쪽)의 차이

Step 4: 리서치 계획을 요청하고 피드백할 것

앞서 말했듯이, Gemini만이 기본적으로 리서치 계획을 공유합니다. 다른 툴은 요청하지 않으면 바로 실행에 들어가구요.

작업을 시작하기 전에, 리서치 계획을 공유해달라고 반드시 요청하세요.

ChatGPT가 공유한 리서치 계획 일부 예시

Deep Research 도구가 공유하는 리서치 계획에서 확인할 주요 항목은 이렇습니다:

  • 계획이 포괄적인가? (요청한 분석 항목이나 섹션이 빠지진 않았는가?)

  • AI가 집중하는 포인트가 적절한가? (당신이 특히 궁금한 포인트를 중심으로 잡고 있는가?)

  • 동의하지 않는 전제나 가정은 없는가? (부족한 컨텍스트가 있다면 이 시점에서 추가)

  • 분석 방식이 합당한가? (비교 기준이나 방법론에 동의하는가?)

이 시점에서, 예를 들면 “기업 웹사이트 대신 독립적인 제 3자 데이터를 우선 사용하라”든가, “최근 데이터만 포함하라”든가 하는 등 ‘출처의 우선순위도 명확히 요청’할 수 있습니다.

(선택 사항) 예시를 제공할 것

만약에 리포트에 대해서 명확히 기대하는 이미지가 있다면, 직접 만든 리포트나 참고할 문서를 업로드하고 "이 스타일을 따라 달라"고 요청하세요.

이전에 직접 수동으로 만들던 리포트를 Deep Research로 대체하려는 경우라면 이 방법이 특히 효과적입니다.

종합적인 프롬프트 작성 예시

아래는 위의 팁을 모두 반영한 실제 Deep Research 프롬프트 예시입니다:

그리고 이게 ChatGPT가 내놓은 결과물입니다 - 한 번 확인해 보시면, 꽤 괜찮다는 걸 알 수 있습니다.

※ 단, 이 예시에서도 ChatGPT는 “계획을 공유하겠다”고 해놓고 잊어버렸습니다. 그래서 저는 항상 컨텍스트를 요청하는 질문에 답변할 때 ‘계획 공유 요청을 반복’하는 걸 추천합니다.

그 외의 팁(Tips)

🤖 고품질 프롬프트를 빠르게 만드는 법: AI에게 요청하세요

프롬프트를 직접 만들어도 되지만, AI에게 도움을 요청해도 되죠.

예를 들어, ChatGPT o3에 이렇게 요청했을 때…

…꽤 완성도 높은 프롬프트가 생성되었습니다.

※ 단, AI가 제안하는 특정한 요구사항이 생각하시는 목적과 정확히 일치하지 않을 수도 있으니까,
그냥 그대로 복붙을 하기보단 반드시 검토하시고 상황에 맞게 조정하셔야 합니다.

💬 Deep Research는 ‘대화’라고 생각하고 접근하세요

Deep Research에 사용할 크레딧은 한정되어 있고, 좋은 프롬프트를 작성하는 게 중요하지만, 사람과 일할 때처럼 ‘대화형’으로 접근하는 게 훨씬 효과적입니다. 그 이유는:

1. 완벽한 리포트를 상상하긴 어렵지만, 보고 나면 문제점을 바로 알 수 있다

우리가 어떤 주제에 대해서 완벽한 분석이 어떤 모습일지 처음부터 묘사하기는 어렵습니다. 하지만 리포트를 한번 보면, ‘뭐가 빠졌는지’는 비교적 쉽게, 금방 알 수 있어요.

그래서 완벽한 프롬프트를 고민하기보다는, 1차 결과를 받아본 뒤에 피드백하는 방식이 훨씬 빠릅니다.

특히 해당 주제의 비전문가일수록 이 접근법이 유효합니다:

  • 먼저, 하이레벨한 개요와 후속 딥다이브 주제 목록을 요청

  • 이후, 흥미로운 영역에 대해 한 가지씩 심화 조사 요청

이렇게 하면, 50페이지짜리 복잡한 리포트를 한 번에 받기보단 필요한 정보만 단계적으로 얻을 수 있어 부담이 덜합니다.

2. 프롬프트가 지나치게 구체적이면 AI의 창의성이 제한된다

업무를 위임할 때도 마찬가지죠. 모든 걸 마이크로하게 지시하기보다는, 자율성을 주었을 때 더 나은 결과가 나오는 경우가 많습니다.

너무 딱딱한 프롬프트를 주면, 결국 당신이 직접 만들 수 있는 수준에 그칠 뿐입니다. 놀라운 결과를 얻고 싶다면, 약간은 열린 지시를 해 보세요.

3. 분석 리포트는 ‘기초’가 잘못되면 전부 무용지물이다

예를 들어서, 특정한 ML 모델 구축법을 분석한 리포트를 받았는데, 알고 보니 당신 상황에 맞는 중요한 전제가 빠져 있었다면 아무 의미가 없죠? 정말, 정리가 아무리 잘 되었더라도 전체가 쓸모없게 됩니다.

복잡한 주제를 다룰 때는, 처음에는 핵심 논리와 분석의 구조를 점검하는 데 집중하세요. 그 다음, 만족스럽다면 보고서를 기반으로 프로젝트 계획, 도구 추천 등 실행 자료로 확장하면 됩니다.

📄 최종 리서치 리포트를 어떻게 활용하면 좋을까

예를 들어서, ChatGPT Deep Research 보고서는 상당히 긴 경우가 많습니다 - 최대 2만 단어 이상에 달하는 경우도 있구요.

그런데 바로 처음부터 끝까지 읽을 필요는 없습니다. 많은 경우에, 라이브러리에서 자료들 참고하듯이 부분적인 참고를 먼저 하는 방식이 훨씬 효율적입니다.

  • 핵심적인 요약이 필요하면, 보고서를 다시 ChatGPT에 넣고 요약 요청

  • 협업 프로젝트라면, 대상 부서별 요약본 요청 (예: PM용, 재무팀용 등)

또, 이 리포트를 AI 모델에게만 활용하게 할 수도 있습니다. 예를 들어서, Claude나 다른 프로젝트 에이전트에게 보고서를 컨텍스트로 넣어서 대화 기반의 워크플로우를 생성한다든가 하는 생각을 해 볼 수 있어요.

Claude의 ‘Project’에 보고서를 컨텍스트로 추가할 수 있습니다.

맺으며

여러 선도적인 AI 스타트업, 빅테크들이 앞다투어 내놓고 있는 Deep Research 도구, 이 도구들은 제대로 활용만 한다면 정말로 놀라운 결과를 엄청난 생산성으로 뽑아내 줄 수 있는 도구들입니다.

이 글을 통해서, 그 엄청난 도구들의 잠재력을 여러분이 최대한 끌어낼 수 있게끔 돕는 하나의 참고자료가 되었기를 바랍니다.

감사합니다!

*읽어주셔서 감사합니다. 재미있게 보셨다면 친구와 동료 분들에게도 뉴스레터를 추천해 주세요.

Reply

or to participate.