'기술도, 임상도 데이터에서 출발합니다.' – 데이터팀 이야기
2025.04.11
Hutomi: 안녕하세요, 김준식 팀장님! 오늘은 휴톰의 ‘숫자 뒤에 숨은 전략’을 담당하는 데이터팀과 인터뷰를 하게 되어 기대가 큽니다.
김준식 팀장님: 반갑습니다. 데이터는 잘 드러나지 않지만 모든 판단의 기반이 되는 요소이죠.
휴톰의 데이터가 어떻게 가치를 만들어내고 있는지, 자세히 말씀드릴게요.

Q. 데이터팀은 어떤 업무를 수행하나요?
저희 데이터팀은 단순히 ‘데이터를 분석하는 부서’가 아니라, 휴톰의 의료 데이터 생태계를 실질적으로 구축하고 운영하는 팀입니다.
가장 기본이 되는 업무는 다기관 임상 데이터의 수집과 관리입니다.
각 병원에서 수집된 데이터가 정합성 있게 쌓이도록, 메타 정보부터 수집 절차까지 체계적으로 관리하고 있고요.
이후엔 이 데이터를 정제하고 전처리하는 작업이 이어집니다. 누락된 정보나 오류 데이터를 탐지하고 보정하는 과정에서 SQL과 Python을 활용해 분석 가능하고 모델 학습에 적합한 데이터셋으로 가공합니다.
또 중요한 역할 중 하나는 의료 데이터 표준화입니다. 의료 데이터는 기관마다 코드와 명칭이 다르기 때문에, 국내외 표준을 참고해 내부에서 일관된 형식으로 정리하고 유지 관리하는 작업을 하고 있습니다.
이와 더불어 머신러닝 모델 개발을 위한 데이터 준비, 그리고 자동화된 품질 관리 시스템 구축까지 맡고 있으며, 임상팀·개발팀과의 협업을 통해 의학적 맥락이 반영된 데이터 관리 체계를 지속적으로 고도화하고 있습니다.
요약하자면, 저희는 정확하고 일관된 데이터를 기반으로, 회사의 모든 의사결정과 제품 개발을 뒷받침하는 핵심 인프라를 만들고 있다고 보시면 됩니다.
Q. 휴톰에서는 데이터를 어떤 방식으로 활용하고 있나요?
휴톰은 다기관에서 수집한 임상 데이터를 기반으로 다양한 분석 및 모델링 작업을 수행하고 있습니다.
구체적으로는 데이터 정제 및 전처리를 통해 고품질 데이터셋을 구축하고, SQL 및 Python을 활용해 데이터를 추출·가공하며, ㅡ머신러닝/딥러닝 모델 개발에 최적화된 형태로 준비합니다.
또한 의료 데이터의 특성을 고려해 표준화·정규화 작업, 데이터 품질 검증 및 자동화 시스템 구축도 함께 병행하고 있습니다.
휴톰의 데이터 활용은 단순한 통계 분석이 아닌, 실제 의료 현장에 적용 가능한 정량적 인사이트를 제공하는 데 집중하고 있습니다.
Q. 의료 데이터를 다룰 때 가장 어려운 점은 무엇인가요?
의료 데이터는 기술적으로 복잡할 뿐만 아니라, 도메인 지식과 법적 제약이 동시에 요구되는 분야입니다.
가장 큰 어려움은 5가지를 뽑아볼 수 있을 것 같아요.
- 표준화의 어려움: 기관마다 포맷과 코드 체계가 달라 통합 분석이 어렵습니다.
- 개인정보 보호: GDPR, HIPAA 등 글로벌 수준의 규제를 철저히 준수해야 합니다.
- 데이터 품질 문제: 누락, 오기, 이상치 등 정제 과정에서 많은 리소스가 필요합니다.
- 의학적 해석 역량: 단순 수치 이상으로, 임상 맥락을 이해한 해석이 필요합니다.
- 비정형 데이터의 병행 처리: 영상, 텍스트, 구조화되지 않은 정보까지 동시에 다룹니다.
저희는 이를 극복하기 위해 의료 도메인 전문가와 협업, 자동화된 검증 시스템, 표준화 프레임워크를 지속적으로 개발·적용하고 있습니다.
Q. 데이터 기반 의사결정은 회사에 어떤 영향을 주었나요?
데이터 기반 의사결정이 도입되면서, 회사 전체가 보다 명확한 기준과 방향성을 갖고 움직일 수 있게 되었습니다.
예를 들어, 제품 개발 과정에서는 사용자의 피드백과 사용 데이터를 분석해 어떤 기능을 우선 개발해야 하는지, 어떤 부분을 개선해야 하는지 객관적으로 판단할 수 있었고요.
또, 수집된 임상 데이터를 기반으로 우리 제품의 임상적 효과를 수치로 입증할 수 있게 되면서, 의료진과 병원의 신뢰를 높이는 데에도 큰 도움이 되었습니다.
내부적으로는 운영 효율도 많이 개선되었습니다.
데이터 분석을 통해 불필요한 프로세스를 줄이고, 리소스 배분을 최적화할 수 있었기 때문이죠.
가장 크게 체감되는 변화는, 이제 의사결정 과정에서 ‘감’보다 ‘근거’가 우선시되는 문화가 자리잡았다는 점입니다.
데이터팀은 그 근거를 제공하는 역할을 하고 있고, 그 점에 큰 책임감을 느끼고 있습니다.
Q. 기억에 남는 데이터 분석 사례가 있다면요?
가장 의미 있었던 사례는 다기관 임상 데이터를 활용한 환자 예후 예측 모델 개발입니다.
기존에는 단일 기관 데이터를 사용했기에 한계가 있었지만, 다기관 데이터를 표준화하고 통합함으로써 모델의 예측 정확도를 획기적으로 향상시킬 수 있었습니다.
특히 주목할 점은, 의료진이 경험적으로 알고 있던 가설들을 데이터 분석을 통해 정량적으로 검증했다는 점입니다.
이는 데이터가 임상 의사결정의 과학적 근거가 될 수 있음을 입증한 사례입니다.
Q. 데이터팀의 비전은 무엇인가요?
저희의 비전은 한 문장으로 말하면, “의료 데이터의 가치를 극대화해 더 나은 의료 환경과 환자 경험을 창출하는 것”입니다.
이를 위해 다음과 같은 4가지 목표를 중심으로 움직이고 있습니다
- 데이터 표준화 및 통합 강화
- AI 기반 분석 플랫폼 고도화
- 안전하면서도 유연한 데이터 거버넌스 확립
- 전사적 데이터 기반 의사결정 문화 확산
단순히 ‘데이터를 잘 다루는 팀’이 아니라, 의료 기술의 미래를 데이터로 설계하는 팀이 되는 것이 저희의 목표입니다.
Hutomi: 데이터를 단순히 수집하고 분석하는 수준이 아니라,
의료 현장에서 의미 있는 변화를 만드는 실질적 자산으로 전환하고 있다는 점이 인상 깊었습니다.
김준식 팀장님: 네, 단순히 데이터만 잘 다뤄서는 안 됩니다.
의학적 맥락을 이해하고, 기술적으로 구현하고, 정책적으로 보호하는 전방위적 사고가 필요합니다.
Hutomi: 말씀처럼, 데이터가 기술과 임상을 연결하는 핵심 축이라는 점이 잘 느껴졌습니다.
앞으로도 의료기술의 미래를 설계하는 든든한 백엔드로서의 활약, 기대하겠습니다!