HistoWiz는 2013년 뉴욕에서 설립된 바이오테크 스타트업으로, 전통적인 병리학 연구의 느린 속도를 혁신하겠다는 목표를 갖고 있습니다. 조직 샘플을 자동으로 처리하고 디지털화하는 플랫폼을 제공하는데, 연구자들에게 3일 만에 고품질의 Whole Slide 이미지를 제공합니다. Y Combinator의 지원을 받은 이 회사는 제약사와 학계의 연구를 가속화하고, 글로벌 접근성과 클라우드 기반 아카이빙으로 과학자들, 의사들의 업무를 한결 쉽게 만들어주고 있습니다.
HistoWiz의 PathologyMap™은 디지털 병리학을 더 똑똑하게 만드는 엔드투엔드 솔루션으로, 연구자들이 슬라이드 이미지를 쉽게 관리하고 AI 앱을 통합해서 분석할 수 있게 해 줍니다. 원클릭으로 여러 AI 도구를 실행하거나, 블록과 디지털 데이터를 연결해서 즉시 검색하는 기능이 돋보입니다. 이 플랫폼은 의사와 AI 간의 협업을 촉진하고, 이상 탐지 같은 AI 기반 품질 관리로 과학적 발견의 속도를 높이는, 연구 현장의 ‘지도’같은 역할을 해 줍니다.
Akash Parvatikar는 HistoWiz에서 PathologyMap™의 프로덕트 매니저이자 AI 과학자로 활약 중인 젊은 리더로, 카네기 멜론 대학에서 Computational Pathology 박사 학위를 받은 전문가입니다. 디지털 병리학에 AI 적용을 더 많이 하기 위해 노력하는 가운데, 제약 산업에서의 적용을 촉진하는데 열정을 쏟고 있습니다.

저는 이번에 처음 제대로 알게 되었는데요. 매해 10월은 ‘유방암 인식의 달’이라고 합니다.
‘Interview with Innovators’의 이번 에피소드는 유방암 인식의 달을 기념해서, AI 과학자이나 디지털 병리학, 계산 생물학을 전공한 프로덕트 리더, Akash Parvatikar와의 인터뷰를 공유합니다. Akash는 HistoWiz에서 PathologyMap™을 이끌고 있는데, 이 디지털 병리학 플랫폼은 Whole Slide 이미지를 AI 도구를 사용해서 ‘검색 가능하고 분석 가능한 데이터로 변환’, 암 연구와 정밀 의학에서의 인사이트 획득 프로세스를 가속화합니다.
디지털 병리학은 아주 새로운 분야인데, 미국이 겪고 있는 병리학자 부족 문제를 해결할 아주 중요한 해결책으로 인식되고 있다고 하네요.
이번 에피소드에서 다룰 주제는 다음과 같습니다:
디지털 병리학이 뭔지, 유리 슬라이드(Glass Slide) 스캔하는게 왜 그렇게 중요한지
AI가 지금 도움이 되고 있는 부분, 아직 아주 유망한 기술로만 남아있는 부분
설명 가능성, 실패(Failure) 모드, 데이터 표준이 임상 도입에 중요한 이유
병리학과 진단에서 AI를 사용하는데 진짜 병목(Bottleneck)은 무엇인지
에이전트 워크플로우가 실험실에 어떻게 부분적으로 도입될 수 있는지
디지털화, FDA 승인, 병원 적용까지의 실제적인 타임라인
사람의 역할은 어떻게 바뀌어갈지
Q. 안녕하세요, Akash. 유방암 인식의 달을 기념해서 이번 인터뷰를 진행하게 되어 기쁩니다. 먼저 큰 그림부터 시작해볼게요. AI가 암 진단의 과정을 의미 있게 진짜 바꾸게 될 시점이 언제일까요?
안녕하세요, 불러주셔서 감사합니다.
지금 병리학 실험실은 디지털화를 한참 진행하는 단계에 있습니다. 지금도 임상의들은 현미경으로 암을 진단하지만, 엄청난 양의 유리 슬라이드를 디지털화하려는 강한 움직임이 있습니다. 이렇게 되면, 암의 특징을 탐지하는 데 AI 같은 지능형 도구가 활용될 수 있는 문이 열릴 거예요.
지금으로서는 우리가 추구해야 하는 두 가지의 길 - 하나를 선택해야 한다는 건 아니구요 - 이 있다고 생각합니다. 하나는 디지털화이고, 다른 하나는 임상의의 진단을 돕는 AI 도구를 만드는 겁니다. 곧, 아마 2~3년 안에 이 두 길이 하나로 합쳐질 거예요. 유리 슬라이드가 완전히 디지털화되고, 최첨단 AI가 더 빠르게, 때로는 조기에 오진할 수 있는 특징을 찾아낼 것입니다.
Q. 그렇군요. 조기에 병을 발견한다든가 더 정확하게 진단한다든가 하는 관점에서, 현재 실현되고 있는 혁신적인 돌파구는 뭐고, 아직 꿈에 불과한 단계에 있는 건 뭔가요?
지금은 임상의, 즉 암 진단의 도메인 전문가들이 AI를 받아들이는 데 초점이 맞춰져 있습니다. AI는 의사들이 수년간 의존해 온 문헌을 기반으로 만들어지고 있죠. 일부 특징은 식별하는 데 시간이 오래 걸리고, 다른 것들은 자주 놓치기도 합니다. 현재 AI는 주로 진단의 보조 역할을 하는데, 진단 프로세스를 가속화하고 의사들이 매일 찾는 특징을 포착하는데 도움을 주는 방향으로 만들어지고 있습니다.
동시에, 대형 언어 모델(LLM)과 딥러닝을 활용해서 의사들이 과거에 크게 주목하지 않았지만 중요한 예후 마커가 될 수 있는 특징을 탐구하는 문샷 프로젝트도 있습니다. 이건 물론 장기적인 목표죠. 빠르게 도입을 하는데 있어서는 단순함이 우선입니다. AI 도구는 의사의 일상적인 진료 활동에 자연스럽게 녹아들어야 합니다.
Q. 의사들이 AI를 사용해온 지 얼마나 됐나요? 처음의 시기와 지금은 어떤 변화가 있었나요?
미국의 주요 병원들 — 메이요 클리닉, 마운트 시나이, NYU, MSKCC — 은 일찍이 AI를 도입했습니다. 초기에는 디지털 이미지를 사용해서 종양, 괴사, 외상 같은 고수준의 특징을 살펴봤습니다. 이제 알고리즘이 성숙해지면서 특정한 세포 탐지, 세포의 유형 식별, 세포 간 공간적 이질성 분석 같은 저수준 특징에도 AI를 적용하고 있습니다.
질문도 점점 복잡해지고 있습니다. 예를 들어서, AI가 조직 샘플 내 종양의 공간적 이질성을 매핑할 수 있을까요? 거기서 어떤 예후 마커를 추출할 수 있을까요? 이건 초기에 적용했던 사례를 훨씬 넘어서는 단계입니다.
이제 도전 과제는 이런 주요 병원들이 이미 사용하는 도구를 미국과 전 세계의 더 많은 병원에 저렴한 비용으로 보급하는 것이기도 합니다.
Q. Akash, 당신은 AI 과학자이니 병리학 AI의 메커니즘을 잘 아실 텐데요. Whole-Slide Image를 다루는 데 가장 어려운 점은 무엇인가요? AI가 어떻게 작동하는지 자세히 설명해 주세요.
중요한 질문입니다. Whole-Slide Image는 한 장이 수백 메가바이트에서 몇 기가바이트에 이를 정도로 큽니다. 40배 확대에서 출력하면 테니스 코트 1~2개를 덮을 정도의 스케일이예요. 이건, 고양이와 강아지를 구분하거나 장면을 탐지하는 일반적인 컴퓨터 비전 작업과는 전혀 다릅니다.

Prompt to Kontext.FLux: A massive slide-image of a cell printed on two tennis courts
의사들은 보통 40배 확대한 이미지로 작업하니까 디테일이 매우 높습니다. 컴퓨터 비전 관점에서는 바늘 더미에서 바늘을 찾는 문제죠. 게다가 메모리 제약도 있습니다. 수 기가바이트 이미지를 서버에 올려 대규모로 AI를 실행하려면 최적화를 신중하게 아주 잘 해야 합니다.
아무래도 표준적인 접근법은 타일 또는 패치 기반 처리이겠죠. 이미지를 작은 조각으로 나누고, 각각의 조각에 AI를 적용한 뒤 결과를 다시 모으는 방식입니다. 하지만 기술적인 측면뿐 아니라 데이터를 이해하는 것이 중요합니다. 뛰어난 컴퓨터 비전 과학자라도 병리학은 다릅니다. 어떤 특징이 중요한지, 카테고리 간 차이는 무엇인지 알아야 합니다.
이걸 해 내려면, 문헌 검토뿐 아니라 병리학자들과 함께 앉아서 논의해야 합니다. 결국 AI는 병리학자들이 쓰기 위해서 만들어지는 것이니까요. 그 분들이 코딩할 필요는 없지만, 그 분들이 가진 전문성이 프로세스 초반부터 반영되어야 합니다.
Q. 흥미롭네요. 방금 설명하신 건 컴퓨터 비전인데, 이제 생성 AI도 있습니다. 병리학에서 생성 AI는 어떻게 활용되나요?
현재 생성 AI는 진단에 거의 사용되지 않습니다. 그 중요한 이유는, AI가 자신의 실패 모드(Failure Mode)를 신뢰할 수 있게 알려주지 못하기 때문입니다. 특히 대형 LLM 기반 시스템은 오탐지나 미탐지를 스스로 인지하지 못합니다.
유망한 방향은 있을 겁니다. 다양성을 잘 포착하게끔 만들어진, 소규모의 잘 선별된 데이터셋을 활용한 Few-Shot 학습 같은 거요. 이렇게 하면 AI가 어떤 경우에 잘 작동하고, 어떤 경우에 어려움을 겪는지 알려줄 수 있습니다. 참고로 이게 제 박사 연구의 핵심이기도 했어요—설명 가능한 AI 프레임워크를 만들어서 성능 뿐 아니라 실패 지점을 명확히 보여주는 것이 목표였습니다.
그렇지만, 기술의 도입은 점진적으로 이뤄져야 합니다. 생성 AI 모델을 도입해서 “이제 병리학자를 대체한다”고 말하면 의사도, 환자도 받아들이지 않을 것입니다. 지금은 단계적으로, 보조 도구로 발전해야 합니다.
Q. ‘에이전트’라는 단어를 언급하셨는데, 에이전트 워크플로우가 이미 의료 현장에 적용되고 있나요, 아니면 아직 먼 미래의 이야기인가요?
병리학 전반으로는 아직 멀었지만, 워크플로우의 일부에서는 에이전틱 기법을 활용한 접근법이 도움이 될 수 있습니다. 예를 들어서, 생검 후 슬라이드를 처리하고 디지털화한 뒤 품질 관리가 필요합니다. 이미지가 펜 자국이나 혈액 자국이 없이 고품질의 이미지인지, AI를 활용한 분석에 적합한지 확인해야 하죠. 이 과정에서 에이전트 워크플로우가 전체 코호트의 품질을 표준화할 수 있겠죠.
HistoWiz에서는 데이터를 표준화하기 위해 이런 에이전트 워크플로우를 탐구하고 있습니다. 하지만 전체 진단 파이프라인을 에이전트가 담당하는 것은 아직 멀었습니다.
Q. 설명 가능성과 AI의 ‘환각’(오탐지나 잘못된 답변)이 중요한 병목이라고 하셨는데, 다른 장애물은 없나요? 그리고 언제쯤 해결될까요?
가장 큰 병목은, 제 박사 과정과 실무에서 모두 경험한 건데, 병리학에서 고품질의 주석을 갖춘 데이터셋이 부족하다는 점입니다. 먼저, 환자가 자신의 샘플을 연구에 사용하도록 동의해야 합니다. 유방, 대장, 간 등 어떤 기관이든 충분한 데이터를 얻기 어렵습니다.
두 번째로, 도메인 전문가들 간의 의견 불일치가 큽니다. 제 박사 연구에서 세 명의 전문 병리학자가 유방암 전 단계 샘플에 주석을 달았는데, 합의나 다수결로 정했지만 ‘정답’이 완벽하지 않았습니다.
NYU에서 한 가지로 진단된 샘플이 스탠퍼드나 유럽, 인도에서는 다르게 해석될 수 있습니다. 특히 전 단계 암에서는 혼란이 가장 큽니다. 이건 ‘정답’ 자체가 신뢰할 수 없을 수 있다는 뜻입니다. 여기에 데이터 편향 문제도 있습니다. 한 병원 시스템에서 훈련된 모델이 그 시스템 밖이나 미국 밖 환자들에게 얼마나 잘 적용될까요? 이게 현재 가장 큰 도전입니다.
Q. 굉장히 구체적인 문제네요. 보편적인 정답으로 추출할 수 없는 건가요?
맞아요. NYU 데이터로 훈련된 AI 모델은 NYU 병리학자들이 특징을 읽는 방식을 반영합니다. 하지만 이건 (당연히) 글로벌 표준이 아니죠. 같은 이미지를 스탠퍼드에 가져가면 다른 카테고리로 분류가 될 수 있습니다. 특히 전 단계 암에서는 모델이 완전히 실패할 수도 있는 거예요. ‘정답’이 너무 가변적이기 때문이죠. 이게 현재 가장 큰 문제입니다.
Q. 정말 디테일하고도 까다로운 문제인 것 같네요. 그럼, 당신이 개발하고 있는 PathologyMap은 이 문제를 해결하려는 건가요?
네. HistoWiz에서 우리는 고품질의 이미지를 관리하고 분석할 수 있는 이미지 관리 플랫폼을 만들고 있습니다. 그 위에 AI 오케스트레이션 레이어를 구축했죠. 사용자가 한 슬라이드에서 여러 회사의 앱—예를 들어 유방암 분석 도구 네 가지—를 동시에 실행하고 성능을 비교할 수 있습니다.
무엇보다 중요한 건, 결정권을 사용자에게 돌려주는 겁니다. 그래서 개방적이고 비독점적인 플랫폼으로 만들었고, Python, MATLAB, R로 만든 커스텀 어노테이션도 수용할 수 있습니다. 전 세계적으로 이런 플랫폼은 드물죠.
Q. PathologyMap은 주로 누구를 위해 설계된 제품인가요? 의료 전문가만을 위한 건가요?
주로 전임상 및 임상 병리학 연구를 위한 겁니다. 전임상은 신약 개발 회사가 임상 시험에서 약물이 인간이나 실험쥐 데이터에 어떻게 작용하는지 테스트하는 경우를 말하구요. 임상에서는 병원이 몇 년 전 생검 자료를 디지털화하려는 경우를 예로 들 수 있습니다. 물리적 슬라이드는 접근이 번거롭지만, 디지털 플랫폼을 통해 쉽게 업로드하고 공유하고, 임상 기록과 비교할 수 있습니다.
Q. 민감한 분야인 만큼 규제는 어떤지도 궁금하네요.
HistoWiz는 GLP(우수 실험실 관리기준)를 준수합니다. 우리는 전임상 연구에 초점을 맞추고 있는데, 실시간의 환자 진단에 AI를 직접 사용하기보다는 과거 데이터나 동물 모델을 다룹니다. 이 영역에서는 규제가 덜 엄격합니다.
하지만 전체 분야를 놓고 보면, FDA 승인을 받은 AI 도구는 아주 적어요. 승인된 경우도 이미지에서 중요한 영역을 표시하는 것 같은 좁은 작업에 국한되구요. 전립선암 탐지 같은 전체 진단에는 아직 큰 장벽이 있습니다. 업계는 실질적으로 유용한 도구에 대한 승인을 받기 위해 고군분투하고 있습니다.
Q. 다시, 유방암 인식의 달이라는 토픽으로 돌아가서, AI가 환자나 병리학자에게 이미 변화를 가져온 사례를 본 적이 있나요?
네, 어느 정도는 그렇습니다. 하지만 대부분 아직 파일럿 단계입니다.
디지털 병리학 자체는 아주 새로운 분야라고 봅니다. 2017년에 와서야 FDA가 디지털 스캐너를 1차 진단에 사용할 수 있도록 승인했죠. 그 전에는 방사선학이 이미 디지털화되고 AI 도구가 사용되고 있었지만, 병리학은 여전히 아날로그였습니다.
그러다가, 코로나19가 큰 전환점을 만들었습니다. 의사들이 병원에 와서 진단하는 것을 꺼리게 되면서 디지털화가 가속화되었죠. 물론, 디지털화는 빠르게 진행되고 있지만, 실세계 진단에서는 아직 갈 길이 멉니다. 병원은 환자들이 AI를 부분적으로 사용한 진단을 받아들일지, 의사들이 이를 광범위하게 신뢰할지 고민해야 합니다. 이건 여전히 풀어야 할 중요한 질문이죠.
그렇지만 AI는 이미 워크플로우 최적화에 도움을 주고 있습니다. 미국은 병리학자 부족 문제를 겪고 있는데, 이 격차는 점점 커질 겁니다. AI는 기존 병리학자들의 업무를 간소화해 주죠—품질 관리나 세포 분열, 림프구 수 같은 저수준 특징을 식별하고 정량화하는 데 아주 효과적입니다. 병리학자들은 이 정보를 활용해 진단을 내리는데, 이런 면에서 실질적인 변화가 일어나고 있습니다.
Q. 처음부터 질문을 했어야 했는데, 디지털 병리학이라는 분야를 모두가 이해할 수 있도록 한 문장으로 설명해 줄 수 있나요?
디지털 병리학은 항상 현미경으로 보던 병리학 유리 슬라이드를 고해상도 스캐너로 디지털화해서 화면에 표시하고, 이미지 관리 도구와 소프트웨어, AI를 활용할 수 있게 하는 것입니다.
이건 방사선학과 비교할 수 있습니다. 방사선학은 10년 이상 전에 디지털화되었습니다. 병리학에서는 생검을 하고, 유리 슬라이드에 올리고, 조직학 처리를 거쳐 병리학자가 현미경으로 살펴봅니다. 이제 여기에 한 단계를 추가하는 겁니다—슬라이드를 스캔하는 거죠. 그러면 의사가 고해상도로 디지털로 볼 수 있습니다.
여기에는 큰 장점이 있습니다. 데이터에 대한 접근과 공유가 엄청나게 쉬워지니까요. 인도나 미국의 시골 지역 환자가 뉴욕이나 캘리포니아의 전문 병리학자에게 슬라이드를 검토받을 수 있습니다. 이런 이유로 디지털화가 빠르게 성장하고 있습니다.
Q. 다음 마일스톤은 언제쯤 어떤 일이 일어나는 걸까요? 예측일 뿐이라도, 이 분야에 깊이 관여하고 계신 만큼 의견이 궁금해요.
메이요 클리닉은 1,200만 장의 슬라이드를 디지털화했고, NYU도 모든 슬라이드를 디지털화하고 있습니다. 첫 번째 마일스톤은 디지털화입니다. 음악을 생각해보세요. 스포티파이 이전에는 카세트와 DVD가 있었지만, 이제는 모두 디지털입니다. 책도 마찬가지로, 구글 북스가 도서관 전체를 스캔하면서 킨들 같은 도구가 가능해졌죠.
지금 병리학은 디지털화 단계에 있습니다. 앞으로 2~3년 안에 FDA 승인이 더 늘어날 테지만, 완전한 진단이 아니라 진단 보조에 초점이 맞춰질 겁니다. 병리학자가 여전히 전문가로 남겠지만, 병목 현상을 피하기 위해 지능형 도구를 사용하게 될 겁니다.
2~3년 안에 병리학자들이 AI의 도움을 받아 더 많은 사례를 진단하고, 전 세계적으로 고품질의 전문적 도구에 더 쉽게 접근할 수 있게 되고, 의료 사례의 판단 정확도가 높아질 겁니다.
Q. 정밀 의학의 ‘스포티파이’ 같은 플랫폼이 가능할까요?
절대 가능합니다—그게 목표이기도 해요.
Q. 누군가 그런 플랫폼을 만들고 있나요?
직접적으로는 아니지만, 흥미로운 이니셔티브가 있습니다. 예를 들어서, Tempus AI는 병리학 보고서, 방사선학 보고서, 혈액 샘플, 유전체 분석을 결합한 멀티모달 데이터셋과 도구를 만들고 있습니다. 환자를 모든 모달리티에서 전체적으로 프로파일링해서 정밀 의학을 발전시키고 활용하겠다는 아이디어죠.
Q. 당신이 이야기한 타임라인을 조금 더 연장해 이상적인 상황을 상상한다면, AI와 함께하는 워크플로우에서 인간의 역할은 어떻게 될까요?
인간의 역할은 그대로일 것입니다. 테슬라에 비유하자면, 고급 기능이 있더라도 운전자는 여전히 운전대를 잡고 있습니다—완전 자율주행과는 거리가 멀죠. 병리학자도 운전석에 있을 것입니다. 하지만 AI는 그들이 놓칠 수 있는 특징을 탐지하거나, 수십 년 치 슬라이드와 보고서에서 몇 초 만에 정보를 가져올 수 있습니다. 예를 들어서, 7년 전 환자의 생검을 즉시 비교할 수 있죠. 물리적 슬라이드로 이 작업을 하면 엄청난 시간이 걸립니다. 인간의 역할은 사라지지 않고, 훨씬 강력한 도구로 지원받는, 그러나 여전한 주체로 남을 것입니다.
Q. 경제적 측면은 어떤가요? 이 분야의 발전이 숫자로도 뒷받침되고 있나요?
네, 활발한 논의가 진행 중입니다. 미국 병원은 슬라이드를 최대 25년간 보관해야 합니다. 수백만 장의 슬라이드 때문에 소모해야 하는 부동산 비용만 해도 엄청납니다. 클라우드나 Iron Mountain 같은 시설에 디지털로 저장하는 게 훨씬 경제적입니다.
생산성의 측면도 있습니다. 병리학자는 물리적인 실제 슬라이드로 하루 30건을 처리할 수 있다면, 디지털로는 50건을 처리할 수 있습니다. 그렇다면 병리학자 부족 문제를 보완하고 더 많은 환자를 진단할 수 있게 되는 거죠. 경제적 전망은 밝지만, 의료 시스템과의 논의는 계속되고 있습니다.
Q. 당신이 만들어가고자 하는 ‘AI 병리학의 세계’에서 가장 기대되는 점과 우려되는 점은 무엇인가요?
가장 기대되는 건 원격 병리학입니다. 전문적인 의사들은 아무래도 대도시 지역에 집중돼 있는데, 그 외 지역의 환자들이 고품질 진료를 받을 수 있습니다. 슬라이드를 디지털화하면 뉴욕이나 캘리포니아의 전문가가 검토할 수 있습니다. Second Opinion도 며칠 걸리던 것이 몇 분 만에 가능해집니다. 일종의, 병리학 데이터와 전문가를 연결하는 통신 플랫폼이죠.
우려되는 건, 도메인 지식 없이 만들어진 AI 모델입니다. 너무 자주 히트맵이나 grad-CAM으로 ‘설명 가능성’을 주장하는 걸 보게 되는데, 여전히 병리학자의 언어로 말하지 못합니다. 모델이 어떤 특징을 탐지했는지, 의사에게 이해 가능한 용어로 설명하지 못하면 설명 가능한 게 아닙니다. 논문이나 특허는 얻을 수 있을지 몰라도 임상 승인은 받지 못할 것입니다.
작게 시작하고, 병리학자가 이해하는 특징을 사용하고, 도메인 전문가와 함께 만들어야 합니다. 그렇지 않으면 채택되지 않을 것이고요. 그게 걱정입니다.
Q. 중요한 지적입니다. 마지막 질문인데요 - 혹시 AI, 의학, 또는 삶에 대한 당신의 접근 방식이나 마인드셋을 형성한 책이 있나요?
기술적인 주제로 이야기했으니, 병리학의 ‘블루 북’—WHO 종양 분류서를 꼽겠습니다. 각 기관별로 책이 있고, 유방암만 해도 12~15권입니다. 각각의 책에서 진단에 대한 상세한 가이드라인을 제시합니다. 제 박사 과정 내내 이 책들을 성경처럼 살펴봤고, 병리학에 입문하려는 누구나 이 책에서 시작해야 한다고 생각합니다. 데이터 이해에 정말 중요한, 과소평가된 자원 중 하나라고 생각합니다.
Q. Akash, 기술적이면서도 인간적인 이야기를 들려주셔서 감사합니다. 의사와 환자에게 AI가 어떤 도움을 줄 수 있는지 생생히 보여주셨어요.
즐거운 대화였습니다. 감사합니다.
읽어주셔서 감사합니다. 친구와 동료 분들에게도 뉴스레터 추천해 주세요!


