ChatGPT, 의사보다 진단평가 점수 앞서
페이지 정보
본문
인공 지능과 의학의 교차점에서 흥미로운 발전이 일어났습니다. 인간과 유사한 텍스트를 생성할 수 있는 고급 AI 프로그램인 ChatGPT-4가 의료 데이터 처리와 임상 추론 능력에서 내과 레지던트 및 순환 의사들을 능가했다는 사실이 밝혀졌습니다. 이 눈에 띄는 비교는 베스 이스라엘 디코네스 메디컬 센터(BIDMC)의 의사 과학자들에 의해 수행되었으며, JAMA Internal Medicine에 연구 편지로 게재되었습니다. 이 연구는 의사들의 임상 추론 능력을 직접 비교하기 위해 대규모 언어 모델(LLM)의 추론 능력을 검증된 평가 도구를 사용하여 평가하려는 목적을 가졌습니다.
BIDMC의 내과 의사이자 조사자인 Adam Rodman 박사는 LLM이 진단을 내릴 수 있다는 것을 초기에 인식했지만, 효과적인 의료 실습에는 진단 뒤에 여러 단계의 임상 추론이 포함되어 있다고 강조했습니다. 연구의 목적은 LLM이 이러한 환자 치료의 중요한 측면에서 의사들을 맞추거나 능가할 수 있는지 평가하는 것이었습니다. 연구 결과는 의료 커뮤니티뿐만 아니라 임상 설정에서 AI 활용의 패러다임 변화를 제안하는 것으로 나타났습니다.
이 연구는 의사들의 임상 추론을 평가하기 위해 개발된 수정된 IDEA(r-IDEA) 점수를 사용했습니다. 참여자에는 두 개의 학술 의료 센터에서 21명의 순환 의사와 18명의 레지던트가 포함되었으며, 각각 20개의 선택된 임상 사례 중 하나를 통과하는 작업이 주어졌습니다. 이 사례들은 진단 추론의 네 가지 순차적 단계를 커버하도록 설계되었습니다: 중증도 분류 데이터, 시스템 리뷰, 신체 검사, 진단 검사 및 영상. 인간 참가자들에게 주어진 동일한 지시를 따라 ChatGPT-4는 모든 20개의 임상 사례를 평가하기 위해 실행되었습니다.
결과는 놀라웠습니다. ChatGPT-4는 순환 의사 9점, 레지던트 8점에 비해 10점 만점에 10점을 받으며 가장 높은 r-IDEA 점수를 받았습니다. 진단의 정확성과 올바른 임상 추론 측면에서는 인간과 AI 간의 경쟁이 더 치열했지만, AI는 일부 사례에서 잘못된 추론을 보였습니다. 이는 AI가 의학 과정에서 인간 추론의 대체물보다는 보완적 도구로서 더 적합하다는 미묘한 결론을 강조합니다.
이러한 발견의 의미는 매우 광범위합니다. AI가 임상 실습에서 중요한 체크포인트 역할을 할 수 있음을 시사하며
, 진단을 놓치지 않도록 도와줄 수 있습니다. BIDMC의 3년 차 내과 레지던트이자 연구의 주저자인 Stephanie Cabral 박사는 AI 통합이 현재의 비효율성을 완화하고 환자와의 의사소통에 더 집중할 수 있게 하여 환자-의사 상호작용을 개선할 수 있기를 희망한다고 표현했습니다.
연구는 AI가 단순히 진단을 내릴 수 있는 것뿐만 아니라 여러 단계의 임상 추론 과정을 통과할 수 있으며, 아마도 인간 전문가보다 더 효과적일 수 있다는 것을 보여줍니다. 이러한 계시는 의료의 질과 환자 경험을 향상시킬 새로운 기회를 열어주며, 의료 실습에서 AI의 역할을 재고할 독특한 기회를 제공합니다. LLM을 임상 워크플로우에 최적으로 통합하는 방법을 탐색하기 위한 추가 연구가 필요하지만, 현재의 발견은 의료를 혁신할 AI의 잠재력을 활용하기 위한 유망한 단계입니다.
<<ChatGPT로 요약하고 번역한 글입니다>>
maplus님의 댓글
외과의사나 군인의 경우도 로봇기술이 따라오면 비용대비 대체효용이 높은 순서대로 대체될 거고요.
인간들은 경력자 위주로 남아서 AI 나 로봇들의 최종결정승인 정도만 하게 될 겁니다.
일레인15님의 댓글
의학분야도 비슷하게 흘러갈거라 봅니다. 단순 이미지 분석이나 증상에 따른 분류는 AI가 더 잘할수밖에 없으니까요..로봇 기술만 더 정밀해진다면 수술도 사람이 할 필요가 없을거구요..
okdocok님의 댓글의 댓글
비읍님의 댓글
# rm -rf ./윤석열
choa님의 댓글
일단 Ai에게 판례에 대한 딥러닝을 할려면 일단 합리적인 판례구축이 필요하다고 생각합니다.
Cookie님의 댓글
비밀기지님의 댓글
블루튜닝님의 댓글
근데 의사들이 환자의 안색이나 촉진, 냄새 이런 데이터화 할 수 없는 것들로 오랜 경험으로 직관적으로 진단하는 것들도 많다 보니 AI 도입은 수치화 가능한 것이나 이미지 진단 이런 쪽으로 도입될 거라 봅니다.
okdocok님의 댓글의 댓글
Lasido님의 댓글
서울대병원 의사 말이 생각납니다. 자기한테 오는 환자는 돌다돌다 해결 못해 마지막 심정으로 오는 사함들인데, 자기가 해결해 주어야 해서, 책 뒤진다고.. 대부분 희귀병이..
이모양님의 댓글