아름다운별 (118.♡.81.216)
2026년 6월 4일 PM 01:30
Ars Technica 기사
Google’s new Gemma 4 12B model is designed to run on any laptop with 16GB of RAM
https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/
내용 일부 Gemini 3.1 Flash Lite로 번역 후 편집했습니다.
지난 4월 구글은 Gemma 4 제품을 발표하면서 모바일에 최적화한 2종(E2B와 E4B)과 더 전문적인 작업을 위한 모델 2종(26B Mixture of Experts, 31B Dense)을 공개했습니다. 그래서 중간 영역에 다소 큰 공백이 있었는데, 이번에 새로 출시된 12B가 바로 그 자리를 채웁니다.
Gemma 4 12B는 모바일 버전보다 훨씬 뛰어난 성능을 갖추고 있으면서도 로컬에서 실행하기 위해 아주 비싼 AI 가속기가 필요하지 않습니다.
구글은 이번 12B 모델이 품질 저하 없이 많은 소비자용 노트북에서 실행될 수 있다는 점에서 독보적이라고 설명합니다. 16GB 시스템 RAM 또는 VRAM을 갖춘 컴퓨터만 있으면 이번 120억 개 파라미터 모델을 구동할 수 있습니다.
Gemma 4 26B MoE 전체 메모리 사용량의 절반 정도로, 구글은 벤치마크상으로 거의 대등한 성능을 발휘한다고 주장합니다.

Gemma 4 12B에는 새로 고안된 다중 토큰 예측(Multi-Token Prediction, MTP) 드래프터(drafter)가 탑재되어 있어 사용되지 않는 프로세싱 사이클(processing cycle)을 활용하여 향후 발생할 토큰을 계산합니다. 그 결과 속도와 효율성이 향상되었습니다.
구글은 이전에도 다른 Gemma 4 모델들을 위한 선택적 MTP 버전을 출시한 바 있지만, 기본적으로 MTP가 적용된 모델이 나오는 것은 이번이 처음입니다.
Gemma 4 12B 모델은 LM Studio, Google AI Edge Gallery 앱 등을 통해 이용할 수 있습니다.
댓글 (1)
-
EEcridor
02:31 · 91.♡.196.218
댓글을 작성하려면 이 필요합니다.
방금 16GB 램에 깔아봤는데 메모리 부족이라고 12B 모델 다운로드가 안 되네요.
받아쓰기 하는 Google ai edge eloquent로는 12B 모델이 받아지는데, 도저히 못 쓸 수준으로 느립니다.