ChatGPT 4o에게 DeekSeek에대해 물었더니…
알림
|
페이지 정보
작성일
2025.01.26 02:43
본문
DeepSeek는 2023년에 설립된 중국 항저우 기반의 인공지능(AI) 스타트업으로, 대규모 언어 모델(LLM) 개발에 주력하고 있습니다. 이 회사는 중국의 헤지펀드인 High-Flyer의 지원을 받고 있습니다. 
DeepSeek는 최신 모델인 DeepSeek-V3를 통해 OpenAI의 GPT-4o, Anthropic의 Claude 3.5, Meta의 Llama 3.1 등 기존 기술 대기업의 모델들을 성능 면에서 앞지르고 있습니다. 이 모델은 6,710억 개의 매개변수를 보유하고 있으며, 14.8조 개의 토큰으로 학습된 방대한 데이터셋을 기반으로 다양한 언어와 도메인에서 높은 성능을 발휘합니다. 
DeepSeek는 효율적인 추론과 비용 효율적인 학습을 달성하기 위해 Multi-head Latent Attention(MLA) 및 DeepSeekMoE 아키텍처를 채택하였습니다. 
또한, DeepSeek는 오픈소스 전략을 통해 기술 생태계를 구축하고 발전시키는 데 가치를 두고 있습니다. 
이러한 혁신적인 접근 방식을 통해 DeepSeek는 AI 산업의 판도를 바꾸고 있으며, 향후 중국 AI의 발전 방향에 중요한 영향을 미칠 것으로 예상됩니다.
—-/—
라고 설명하네요.
자기보다 성능이 앞선다는데요?
0명
추천인 목록보기
댓글 3
/ 1 페이지
돈이든힘이든있어야내겠지요님의 댓글