구글, 16GB VRAM에서 실행 가능한 Gemma 4 12B 모델 공개

아름다운별 (118.♡.81.216)

2026년 6월 4일 PM 01:30

조회 4,047 공감 0

6/5 수정: 16GB RAM → VRAM 입니다.

https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/

Ars Technica 기사

Google’s new Gemma 4 12B model is designed to run on any laptop with 16GB of RAM

https://arstechnica.com/google/2026/06/googles-new-gemma-4-open-ai-model-is-sized-for-your-laptop/

내용 일부 Gemini 3.1 Flash Lite로 번역 후 편집했습니다.

지난 4월 구글은 Gemma 4 제품을 발표하면서 모바일에 최적화한 2종(E2B와 E4B)과 더 전문적인 작업을 위한 모델 2종(26B Mixture of Experts, 31B Dense)을 공개했습니다. 그래서 중간 영역에 다소 큰 공백이 있었는데, 이번에 새로 출시된 12B가 바로 그 자리를 채웁니다.

Gemma 4 12B는 모바일 버전보다 훨씬 뛰어난 성능을 갖추고 있으면서도 로컬에서 실행하기 위해 아주 비싼 AI 가속기가 필요하지 않습니다.

구글은 이번 12B 모델이 품질 저하 없이 많은 소비자용 노트북에서 실행될 수 있다는 점에서 독보적이라고 설명합니다. 16GB VRAM을 갖춘 컴퓨터만 있으면 이번 120억 개 파라미터 모델을 구동할 수 있습니다.

Gemma 4 26B MoE 전체 메모리 사용량의 절반 정도로, 구글은 벤치마크상으로 거의 대등한 성능을 발휘한다고 주장합니다.

Gemma 4 12B에는 새로 고안된 다중 토큰 예측(Multi-Token Prediction, MTP) 드래프터(drafter)가 탑재되어 있어 사용되지 않는 프로세싱 사이클(processing cycle)을 활용하여 향후 발생할 토큰을 계산합니다. 그 결과 속도와 효율성이 향상되었습니다.

구글은 이전에도 다른 Gemma 4 모델들을 위한 선택적 MTP 버전을 출시한 바 있지만, 기본적으로 MTP가 적용된 모델이 나오는 것은 이번이 처음입니다.

Gemma 4 12B 모델은 LM Studio, Google AI Edge Gallery 앱 등을 통해 이용할 수 있습니다.

https://lmstudio.ai/models/gemma-4

https://developers.google.com/edge/gallery

E

Ecridor

06.05 · 91.♡.196.218

방금 16GB 램에 깔아봤는데 메모리 부족이라고 12B 모델 다운로드가 안 되네요.
받아쓰기 하는 Google ai edge eloquent로는 12B 모델이 받아지는데, 도저히 못 쓸 수준으로 느립니다.
아

아름다운별 → Ecridor 작성자

06.05 · 118.♡.85.44

네 구글이나 기사에서 처음에 잘못 올린 것 같네요.
알

알아야면장

06.05 · 49.♡.101.52

제 맥북프로 24gb에서나 램 85%차지하면서 돌아는갑니다. 16은 무리일듯요
아

아름다운별 → 알아야면장 작성자

06.05 · 118.♡.85.44

네 16GB VRAM인 모양입니다.
아

아르카디아

06.05 · 119.♡.99.23

레노버 Y700 4세대 (16/256) 제품에 설치해서 테스트 해 봤습니다. 엣지 겔러리에서는 12b 모델이 없어서 PocketPal AI앱을 설치해서 gemma-4 12b Q4_K_M 모델을 사용해 봤는데 4.23토큰의 속도가 나오네요.
엣지 겔러리 E4b 모델은 동일한 내용으로 49.3토큰이 나옵니다.

댓글을 작성하려면 이 필요합니다.

새로운 소식

추가 메뉴

댓글 (5)