구글 "메드-제미나이가 분석한 '흉부CT', 의사 3분의 2는 우수 평가"
페이지 정보
본문
* 이데일리 기사 내용 일부
https://v.daum.net/v/20240827124951919
https://www.edaily.co.kr/News/Read?newsId=02551846638991584
“메드-제미나이(Med-Gemini)에게 흉부CT 사진을 주고 분석한 후 보고서를 쓰도록 했다. 의사들의 72%는 의사가 직접 쓴 보고서와 비교해 동등하거나 더 우수하다고 평가했다.”
로리 필그림(Rory Pilgrim) 구글 리서치 소프트웨어 엔지니어는 27일 서울 포시즌스호텔에서 열린 ‘리서치앳 코리아’ 기자회견에서 ‘메드-제미나이’를 소개하며 이같이 밝혔다. 리서치앳은 구글이 전 세계 연구 커뮤니티를 대상으로 최신 연구 주제를 공유하는 프로그램인데 한국에서만 작년에 이어 올해 두 번째 개최됐다.
◇ 제미나이, 의료에 결합해보니…“의사 절반 이상 ‘유용’”
메드-제미나이는 구글의 대규모 언어모델(LLM)인 제미나이를 의료·건강 분야와 결합해 만든 모델이다. 필그림 엔지니어는 “메드-제미나이는 덱스트 뿐 아니라 이미지, 유전정보 등 다양한 형태의 의료 데이터를 학습해 방사선학 보고서 생성, 유전체 위험 예측 등 복잡한 의료 작업을 수행할 수 있다”고 밝혔다. 의사가 질병을 진단하는 과정에서 다양한 시각 정보, 첨단 영상, 후각, 청각 등을 활용하는데 메드-제미나이의 멀티모달(multimodal) 기능이 유용하게 적용될 수 있다는 분석이다.
이를 위해 구글은 메드-제미나이가 CT사진 등 2D 이미지를 해석하고 수술 영상, 심전도 신호 등 3D 이미지를 해석하게 하고 흉부 엑스레이, 여러 초음파 등을 텍스트와 함께 해석하도록 훈련시켰다. 게놈 시퀀스(인간 유전자 정보를 나타내는 DNA 염기서열의 순서) 정보를 제미나이가 이해할 수 있도록 이미지로 전환하고 관련 MRI에 연령·성별 정보를 더해 학습시켰다.
필그림 엔지니어는 “의사를 대상으로 메드-제미나이가 흉부 사진을 바탕으로 작성한 보고서와 실제 의사가 작성한 보고서를 비교하도록 블라인드 테스트를 진행한 결과 72%의 의사가 제미나이가 작성한 보고서가 의사와 비슷하거나 더 우수하다고 평가했다”고 밝혔다. 엑스레이 사진에선 53%의 의사가 메드-제미나이가 유용하다고 평가했다.
필그림 엔지니어는 “메드-제미나이가 3D 이미지를 해석하는 데 유용하다”며 “처음인데도 고무적인 결과를 냈다고 생각한다”고 밝혔다. 이어 “관련해 여러 기관과 협업을 하고 있는데 이들은 자체 데이터를 활용해 메드-제미나이를 평가하고 싶어한다”며 “2D 이미지를 시작으로 다양하게 확대 분석하기를 원한다”고 덧붙였다.
메드-제미나이는 소리 등을 토대로 질병을 진단하거나 전염병이 어떻게 옮겨가는지를 추적하는 데도 유용하다. 필그림 엔지니어는 “기침을 한다면 음향 소리를 분석해 병명을 진단할 수 있고 질병이 어떻게 옮겨가는지 추적할 수 있다”고 밝혔다. 다만 “기침 소리로 질병을 분석하는 기술은 아직 초기 단계”라며 “파운데이션 모델을 갖고 있기는 하나 현재 연구단계에 있는 모델로 어떻게 적용될 수 있는 지 평가하는 단계에 있다”고 설명했다.
[… 이후 내용 링크 참조 …]
carg님의 댓글
그나저나 ct나 x-ray는 방사선사가 찍으면 되지만 소아 장충첩은 같은 환자에게 필요한 복부초음파는 애초에 초음파 볼줄 아는 사람이 이리저리 적절한 곳을 비춰가며 판독해야 하는 문제라서 찍고 판독 맡길수도 없고 로봇팔이 실시간 판독과 함께 움직여줄게 아니라면
ai가 하기에는 아주 오랜 시간이 걸릴 것 같네요