ChatGPT, 의사보다 진단평가 점수 앞서

알림
|
X

페이지 정보

작성자 Phil2030 211.♡.217.192
작성일 2024.04.04 09:53
분류 과학
1,796 조회
3 추천
쓰기 분류

본문



인공 지능과 의학의 교차점에서 흥미로운 발전이 일어났습니다. 인간과 유사한 텍스트를 생성할 수 있는 고급 AI 프로그램인 ChatGPT-4가 의료 데이터 처리와 임상 추론 능력에서 내과 레지던트 및 순환 의사들을 능가했다는 사실이 밝혀졌습니다. 이 눈에 띄는 비교는 베스 이스라엘 디코네스 메디컬 센터(BIDMC)의 의사 과학자들에 의해 수행되었으며, JAMA Internal Medicine에 연구 편지로 게재되었습니다. 이 연구는 의사들의 임상 추론 능력을 직접 비교하기 위해 대규모 언어 모델(LLM)의 추론 능력을 검증된 평가 도구를 사용하여 평가하려는 목적을 가졌습니다.


BIDMC의 내과 의사이자 조사자인 Adam Rodman 박사는 LLM이 진단을 내릴 수 있다는 것을 초기에 인식했지만, 효과적인 의료 실습에는 진단 뒤에 여러 단계의 임상 추론이 포함되어 있다고 강조했습니다. 연구의 목적은 LLM이 이러한 환자 치료의 중요한 측면에서 의사들을 맞추거나 능가할 수 있는지 평가하는 것이었습니다. 연구 결과는 의료 커뮤니티뿐만 아니라 임상 설정에서 AI 활용의 패러다임 변화를 제안하는 것으로 나타났습니다.


이 연구는 의사들의 임상 추론을 평가하기 위해 개발된 수정된 IDEA(r-IDEA) 점수를 사용했습니다. 참여자에는 두 개의 학술 의료 센터에서 21명의 순환 의사와 18명의 레지던트가 포함되었으며, 각각 20개의 선택된 임상 사례 중 하나를 통과하는 작업이 주어졌습니다. 이 사례들은 진단 추론의 네 가지 순차적 단계를 커버하도록 설계되었습니다: 중증도 분류 데이터, 시스템 리뷰, 신체 검사, 진단 검사 및 영상. 인간 참가자들에게 주어진 동일한 지시를 따라 ChatGPT-4는 모든 20개의 임상 사례를 평가하기 위해 실행되었습니다.


결과는 놀라웠습니다. ChatGPT-4는 순환 의사 9점, 레지던트 8점에 비해 10점 만점에 10점을 받으며 가장 높은 r-IDEA 점수를 받았습니다. 진단의 정확성과 올바른 임상 추론 측면에서는 인간과 AI 간의 경쟁이 더 치열했지만, AI는 일부 사례에서 잘못된 추론을 보였습니다. 이는 AI가 의학 과정에서 인간 추론의 대체물보다는 보완적 도구로서 더 적합하다는 미묘한 결론을 강조합니다.


이러한 발견의 의미는 매우 광범위합니다. AI가 임상 실습에서 중요한 체크포인트 역할을 할 수 있음을 시사하며


, 진단을 놓치지 않도록 도와줄 수 있습니다. BIDMC의 3년 차 내과 레지던트이자 연구의 주저자인 Stephanie Cabral 박사는 AI 통합이 현재의 비효율성을 완화하고 환자와의 의사소통에 더 집중할 수 있게 하여 환자-의사 상호작용을 개선할 수 있기를 희망한다고 표현했습니다.


연구는 AI가 단순히 진단을 내릴 수 있는 것뿐만 아니라 여러 단계의 임상 추론 과정을 통과할 수 있으며, 아마도 인간 전문가보다 더 효과적일 수 있다는 것을 보여줍니다. 이러한 계시는 의료의 질과 환자 경험을 향상시킬 새로운 기회를 열어주며, 의료 실습에서 AI의 역할을 재고할 독특한 기회를 제공합니다. LLM을 임상 워크플로우에 최적으로 통합하는 방법을 탐색하기 위한 추가 연구가 필요하지만, 현재의 발견은 의료를 혁신할 AI의 잠재력을 활용하기 위한 유망한 단계입니다.


<<ChatGPT로 요약하고 번역한 글입니다>>



댓글 15 / 1 페이지

이모양님의 댓글

작성자 이모양 (172.♡.118.56)
작성일 04.04 10:23
예전 외신에서 재판관을 AI로 했더니 인간보다 오류가 적었다는 기사가 기억나네요.

우르르르님의 댓글

작성자 우르르르 (172.♡.222.81)
작성일 04.04 11:08
야한얘기만 이제 잘하면 최고겠네요

choochoo님의 댓글

작성자 choochoo (162.♡.187.8)
작성일 04.04 11:31
판검사를 우선적으로다가…

maplus님의 댓글

작성자 maplus (172.♡.119.21)
작성일 04.04 13:59
대용량 데이터를 모아서 합리적 추론을 이끌어내는 분야는 모두 AI 에게 주도권을 빼앗기겠죠.
외과의사나 군인의 경우도 로봇기술이 따라오면 비용대비 대체효용이 높은 순서대로 대체될 거고요.
인간들은 경력자 위주로 남아서 AI 나 로봇들의 최종결정승인 정도만 하게 될 겁니다.

일레인15님의 댓글

작성자 일레인15 (172.♡.211.232)
작성일 04.04 14:12
법률 서비스도 일부 분야는 AI가 더 잘합니다. 그리고 이미 실제로 케이스 분석 및 대응에 적용중이기도 하구요.(특히 예전에 로스쿨 학생들이나 어쏘들에게 시키던 업무들은 상당수 AI로 대체됨)

의학분야도 비슷하게 흘러갈거라 봅니다. 단순 이미지 분석이나 증상에 따른 분류는 AI가 더 잘할수밖에 없으니까요..로봇 기술만 더 정밀해진다면 수술도 사람이 할 필요가 없을거구요..

okdocok님의 댓글의 댓글

대댓글 작성자 okdocok (172.♡.211.68)
작성일 04.05 13:43
@일레인15님에게 답글 솔직히 환자 상태를 언어로 모두 풀어 쓴걸 입력할 수 있다면 더 정확할 수 있는데... 말투, 통증의 호소 양상, 사는곳, 유병률 등등 언어로 입력 불가능한 요소들이 너무나 많아서.

비읍님의 댓글

작성자 비읍 (162.♡.118.198)
작성일 04.04 16:04
응용능력이 아니라 암기한 것만 갖고 치료하는 사람들과 비교하면 ai를 이길 수가 없긴 하겠네요.
# rm -rf ./윤석열

choa님의 댓글

작성자 no_profile choa (172.♡.34.30)
작성일 04.04 16:56
저도 판검사를 Ai로 바꿨으면 좋겠다는 생각이지만
일단 Ai에게 판례에 대한 딥러닝을 할려면 일단 합리적인 판례구축이 필요하다고 생각합니다.

Cookie님의 댓글

작성자 Cookie (172.♡.7.15)
작성일 04.05 00:19
사실 주어진 데이터를 분석해서 추론하는 분야는 AI를 이길 수 없는 것이 너무나도 당연한 수순으로 가고 있는 것 같습니다. 세무/법률/의료진단+처방 등등.. 실제로 사람이 해야 되는 서비스들만 남게 되지 않을까요? 보일러공, 자동차 정비(진단은 AI가 대체) 등등요..

비밀기지님의 댓글

작성자 no_profile 비밀기지 (162.♡.91.5)
작성일 04.05 02:49
관리감독도 사람이 필요하다는 것 또한 블러핑에 가깝죠. 어차피 AI감독은 AI가 하는게 더 효율적일 예정이라…

블루튜닝님의 댓글

작성자 블루튜닝 (172.♡.211.111)
작성일 04.05 09:58
테이터 기반 결정에서는 사람보다 AI가 더 정확한 결정을 내리긴 할 겁니다.
근데 의사들이 환자의 안색이나 촉진, 냄새 이런 데이터화 할 수 없는 것들로 오랜 경험으로 직관적으로 진단하는 것들도 많다 보니 AI 도입은 수치화 가능한 것이나 이미지 진단 이런 쪽으로 도입될 거라 봅니다.

okdocok님의 댓글의 댓글

대댓글 작성자 okdocok (172.♡.211.67)
작성일 04.05 13:44
@블루튜닝님에게 답글 그래서 영상의학과, 해부병리과는 활용도가 높죠.

Lasido님의 댓글

작성자 no_profile Lasido (172.♡.33.132)
작성일 04.05 10:51
의사도 모르면 책 찾아봐야 되는데, 큰병원 교수님들 아니면, 책 찾아 보는 의사가 있을지…

서울대병원 의사 말이 생각납니다. 자기한테 오는 환자는 돌다돌다 해결 못해 마지막 심정으로 오는 사함들인데, 자기가 해결해 주어야 해서, 책 뒤진다고.. 대부분 희귀병이..

okdocok님의 댓글의 댓글

대댓글 작성자 okdocok (162.♡.187.83)
작성일 04.05 13:45
@Lasido님에게 답글 3차병원의 숙제죠. 문제는 찾아도 없는 경우도 많긴해요. 그래서 검사도 대부분 풀로 긁을 수 밖에 없어요.

클로버님의 댓글

작성자 no_profile 클로버 (172.♡.223.177)
작성일 04.05 12:32
당연한 결과 아닐까요?
쓰기 분류
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색