논문 - 마이크로소프트 Phi-3 Mini 언어 모델, 스마트폰에서 실행 가능

알림
|
X

페이지 정보

작성자 아름다운별 117.♡.24.205
작성일 2024.04.23 23:17
분류 IT
1,555 조회
5 추천
쓰기 분류

본문

 

 

(Engadget 기사 일부 내용 Claude 3 Opus 번역)

마이크로소프트는 새 연구 논문에서 스마트폰 등 로컬 기기에서 실행되도록 설계된 최신 경량 AI 모델인 Phi-3 Mini를 공개했습니다. 이 모델은 마이크로소프트가 가까운 시일 내에 공개할 3가지 소형 Phi-3 언어 모델 중 첫 번째 모델입니다. 클라우드 기반 LLM보다 저렴한 대안을 제공하여 소규모 조직이 AI를 채택할 수 있도록 하는 것이 목적입니다.

 


마이크로소프트 말에 따르면, 새로운 모델은 이전 Phi-2 소형 모델을 크게 능가하는 성능을 보여주며, Llama 2와 같은 대형 모델에 견줄 만한 수준을 보입니다. Phi-3 Mini가 자체 크기의 10배에 달하는 모델 수준에 근접한 응답을 제공한다고 합니다.

 

"혁신은 훈련 데이터셋에서 비롯된다"라고 연구 논문은 언급합니다. 논문에서는 언급합니다. 해당 데이터셋은 Phi-2 모델을 기반으로 하지만, "대폭 필터링한 웹 데이터와 합성 데이터"를 활용한다고 연구팀은 설명합니다. 실제로, 별도의 LLM이 이 2가지 작업을 수행하는 데 사용되었으며, 작은 언어 모델이 더 효율적일 수 있도록 새로운 데이터를 효과적으로 생성합니다. The Verge 기사에 따르면, 연구팀은 복잡한 주제를 전달하기 위해 더 단순한 언어를 사용하는 어린이용 책에서 영감을 얻었다고 합니다.

 

Phi-3 Mini는 아직 클라우드 기반 LLM 결과만큼 생성할 수는 없지만, 수학, 프로그래밍, 학업 시험 등 다양한 작업에서 Phi-2나 다른 소형 언어 모델(Mistral, Gemma, Llama-3-In)보다 우수한 성능을 보여줍니다. 동시에, 인터넷 연결 없이도 스마트폰과 같은 단순한 기기에서 실행될 수 있습니다. [이후 내용 생략]

 

점수 표

Phi-3과 타 모델 점수 비교표 이미지입니다.

댓글 1 / 1 페이지

표면장력님의 댓글

작성자 no_profile 표면장력 (174.♡.243.209)
작성일 04.23 23:34
엄청나네요 ㄷㄷ
쓰기 분류
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색