우리가 이러는동안 중국은 AI 기술로 미국을 한방 먹였네요

알림
|
X

페이지 정보

작성자 no_profile nextmobil 218.♡.114.67
작성일 2025.01.27 10:10
1,772 조회
19 추천

본문

중국 스타트업에서 내놓은 LLM 모델인 DeekSeek-V3(gpt-4o 대응)와 추론 강화 LLM DeepSeek-R1(o1 대응) 때문에 미국을 포함한 전세계 AI 업계가 말그대로 난리가 났네요.


일단 미국 정부의 규제로 nvidia로부터 제대로된 GPU 수입도 못하는 상황에서 말도 안되는 개발비로 현재 미국에서 내놓는 SOTA 모델들을 넘어섰고 자세한 기술 논문과 함께 학습에 사용된 데이터만 제외하고 모든걸 MIT 라이센스(상용 사용까지 허용)로 공개했다는것입니다.

특히 추론 강화 LLM인 DeekSeek-R1에서는 사람들의 예상을 깨고 복잡한 SFT가 아닌 효율적이고 간단한 강화학습을 위주로 이 문제를 해결하고 인정을 받아서 전세계 학계에 주는 영향도 상당할것으로 보입니다.


주말 내내 기술 논문 분석해주는 블로그와 유튜브 찾아보고 직접 ollama 로도 돌려보고 서비스 가입해서 사용도 해보았는데 성능이 ㅎㄷㄷ합니다


한국 AI 업계 근방에서 일하는 입장에서 한국은 AI 분야에서 변방으로 물러나 미국, 중국의 활약을 멀리서 지켜만 봐야하는건 아닌지 많이 걱정이 되네요

19추천인 목록보기
댓글 5 / 1 페이지

외국인노동자입니다님의 댓글

작성자 no_profile 외국인노동자입니다 (157.♡.92.86)
작성일 어제 10:18
이미 변방 아닌감요......

기립근님의 댓글

작성자 기립근 (116.♡.126.239)
작성일 어제 10:21
어차피 쏟아붓는 돈과 인력이 비교가 안되지 않나요.. 굥이 부러뜨리기도 했고

분홍몸매님의 댓글

작성자 no_profile 분홍몸매 (223.♡.81.145)
작성일 어제 10:41
RL 만으로 기능이 발현된다는데 너무 신기한데요

YBman님의 댓글의 댓글

대댓글 작성자 YBman (59.♡.6.147)
작성일 어제 10:48
@분홍몸매님에게 답글 결국 RL이 답인가 싶은 생각도 드네요.

아름다운나님의 댓글

작성자 아름다운나 (203.♡.104.126)
작성일 어제 11:06
말그대로 혁신이네요. 앞으로가 더 기대됩니다.
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색