Deepseek가 가성비인 이유
알림
|
페이지 정보
작성일
2025.01.28 21:24
본문
https://x.com/awnihannun/status/1881412271236346233
Deepseek R1의 원본 수준 모델(671B)을 로컬 환경에서 구동하는데 2023년형 Mac Studio 192GB 2대를 클러스터로 묶으면 된다고 합니다. 한대당 839만원이니 총 1678만원이죠.
기존의 ChatGPT나 Gemini, Coplot 등이 쓰던 NVIDIA A100 80GB이 대당 2000만원이고 그걸 왕창 쓰던 거 생각하면… 그야말로 껌값이네요.
32명
추천인 목록보기
댓글 9
/ 1 페이지
코미님의 댓글의 댓글
@패러데이님에게 답글
그게 애플이 가끔 특정 분야(?)나 제품이 엄청 싼 일이 종종 있어요.
iamchp님의 댓글
8bit를 3bit로 양자화된 모델을 돌리는것 같습니다.
그래도 대단합니당.... 훈련을 어떻게 저렇게 효율적으로 했을지... 궁금합니다.
그래도 대단합니당.... 훈련을 어떻게 저렇게 효율적으로 했을지... 궁금합니다.
패러데이님의 댓글