우리가 이러는동안 중국은 AI 기술로 미국을 한방 먹였네요

중국 스타트업에서 내놓은 LLM 모델인 DeekSeek-V3(gpt-4o 대응)와 추론 강화 LLM DeepSeek-R1(o1 대응) 때문에 미국을 포함한 전세계 AI 업계가 말그대로 난리가 났네요.

일단 미국 정부의 규제로 nvidia로부터 제대로된 GPU 수입도 못하는 상황에서 말도 안되는 개발비로 현재 미국에서 내놓는 SOTA 모델들을 넘어섰고 자세한 기술 논문과 함께 학습에 사용된 데이터만 제외하고 모든걸 MIT 라이센스(상용 사용까지 허용)로 공개했다는것입니다.

특히 추론 강화 LLM인 DeekSeek-R1에서는 사람들의 예상을 깨고 복잡한 SFT가 아닌 효율적이고 간단한 강화학습을 위주로 이 문제를 해결하고 인정을 받아서 전세계 학계에 주는 영향도 상당할것으로 보입니다.

주말 내내 기술 논문 분석해주는 블로그와 유튜브 찾아보고 직접 ollama 로도 돌려보고 서비스 가입해서 사용도 해보았는데 성능이 ㅎㄷㄷ합니다

한국 AI 업계 근방에서 일하는 입장에서 한국은 AI 분야에서 변방으로 물러나 미국, 중국의 활약을 멀리서 지켜만 봐야하는건 아닌지 많이 걱정이 되네요