추가 메뉴

잡담
DiffusionGemma를 3090에서 테스트 해보았습니다. [영어 결과]
YBman

Lv.1 YBman (211.♡.87.197)

2026년 6월 11일 PM 10:08

조회 411 공감 0

RTX 3090 24GB에서 DiffusionGemma 26B-A4B-it Q4_K_M GGUF 테스트.

프롬프트: "Explain DeepMind."

최고 raw TPS는 max_steps=4에서 222.8 tok/s였지만 출력은 깨졌습니다.

영어 기준 실사용 가능한 지점은 max_steps=24의 49.5 tok/s 전후로 측정됩니다.

보수적 품질 설정 max_steps=48은 42.9 tok/s였습니다.

영어가 더 잘나올 줄 알았는데 비슷한 것 같습니다.


샘플 요약:

max_steps=4:

DeepMind is a British artificial intelligence (AI) research laboratory based in London

subsidiary of subsidiary of subsidiary subsidiary parent parent...

max_steps=12:

DeepMind is a British artificial intelligence research laboratory based in London. It is a

subsidiary of Alphabet Inc...

...

AlphaZero ... playing playing against itself ... surpassing surpassing...

max_steps=24는 영어 답변이 꽤 쓸 만했습니다. 다만 같은 문단을 반복하는 현상이 있습니다.

max_steps=48도 가장 안정적이지만 완전히 깨끗하진 않습니다.


댓글 (0)

  • 아직 댓글이 없습니다. 첫 댓글을 작성해보세요!

댓글을 작성하려면 이 필요합니다.