(펌글) 딥시크가 혁신인 이유
알림
|
페이지 정보
작성자
TonyStark
작성일
2025.01.28 10:40
본문
170명
추천인 목록보기
댓글 32
/ 1 페이지
TonyStark님의 댓글의 댓글
작성일
01.28 10:46
@해질무렵님에게 답글
지금 딥시크의 결과물은 차치하고, 과정이 진짜 혁신이었네요. 기술의 발전이 놀랍습니다 ㄷㄷ
joydivison님의 댓글
작성자
joydivison
작성일
01.28 10:46
설명을 읽어보니 왠지 더 허상 같은 느낌이 들기도 해요. 알고리즘을 잘 짜서 효율화 했다늠 건데…좀 더 지켜봐할 듯 싶어요
TonyStark님의 댓글의 댓글
작성일
01.28 10:49
@최면님에게 답글
미국 기업들은 그걸 해낼 수 있겠죠? 현실이 된다면 놀라운 변혁이 다가올 것 같은.. 소비자 입장에도 두근두근하네요.
에피네프린님의 댓글
작성자
에피네프린
작성일
01.28 10:48
이 글이 많이 퍼지던데 전혀 좋은글 아닙니다
저기 나온 이야기는 요새 나오는 llm들의 일반적인 특징들이고 물론 deepseek도 가지는 특성이지만, 딥식이가 충격을 준 딥시크만의 특성은 하나도 안들어있어요
딥시크의 혁신은 강화학습만으로 성능을 대폭 끌어올릴 방법을 찾아냈다는거입니다.
저기 나온 이야기는 요새 나오는 llm들의 일반적인 특징들이고 물론 deepseek도 가지는 특성이지만, 딥식이가 충격을 준 딥시크만의 특성은 하나도 안들어있어요
딥시크의 혁신은 강화학습만으로 성능을 대폭 끌어올릴 방법을 찾아냈다는거입니다.
에피네프린님의 댓글의 댓글
작성일
01.28 16:21
@마루치1님에게 답글
여기 쓰기엔 너무 길어질거같아서
딥식이 논문 리뷰한 유튭 영상을 보시면 이해가 갈겁니다
딥식이 논문 리뷰한 유튭 영상을 보시면 이해가 갈겁니다
finalsky님의 댓글
작성자
finalsky
작성일
01.28 10:56
엔비디아& 전력회사들만 큰일 난 거죠.
다른 AI 빅테크 들은 그 방법을 차용해서 얼마든지 지금의 AI 효율을 높일 수 있으니까요.
다른 AI 빅테크 들은 그 방법을 차용해서 얼마든지 지금의 AI 효율을 높일 수 있으니까요.
피에스님의 댓글
작성자
피에스
작성일
01.28 10:59
너무 쉽게 쓰려고 과장이랑 오류가 꽤 많아진 느낌이네요.. 전문가 시스템 같은거만 해도 이미 chatgpt 이전부터 흔히 쓰이는 기술이에요..
luq.님의 댓글
작성자
luq.
작성일
01.28 11:24
엔비디아 없이 가능하다도 아니고 중저가 엔비디아 칩으로 했다는 거 같은데 왜 점유율이 하락한다는 건지 모르겠네요. 딥식조차 CUDA로 만들었다는거 같던데. 지금 엔비디아 칩 외 강력한 라이벌 AI칩이 있긴 한가요?
게다가 대규모 투자가 가능한 업체에서만 굴릴 수 있을 정도로 장벽이 높았는데 중소형 업체에서도 할만한 규모로 가능하다면 오히려 저변이 더 확대될 거 같기도 한데요.
울며 겨자먹기로 OpenAI 같은데다 돈 주고 쓰던 업체가 직접 굴릴 수 있게 되는 거 아닌가 싶은데 말이죠.
게다가 대규모 투자가 가능한 업체에서만 굴릴 수 있을 정도로 장벽이 높았는데 중소형 업체에서도 할만한 규모로 가능하다면 오히려 저변이 더 확대될 거 같기도 한데요.
울며 겨자먹기로 OpenAI 같은데다 돈 주고 쓰던 업체가 직접 굴릴 수 있게 되는 거 아닌가 싶은데 말이죠.
가랑비님의 댓글
작성자
가랑비
작성일
01.28 11:28
Deepseek 이 새로운 접근법을 대중에게
오픈할 정도로 안정화 시킨 것은 대단하지만,
nvidia 등의 실리콘 업체의 가치가 내려가는
것은 아닌 것 같습니다. 결국은 뭘해도 성능 좋은
실리콘을 써야하고, 더 좋은 실리콘이 더 나은
결과를 만들어낼 가능성은 여전히 높다고 봅니다.
실리콘 성능 2배가 결과 지표 2배가 되는
것은 아니겠지만, 어느 정도 이상은 의미가
있다고 봅니다. HBM으로 인한 데이터 전송의
장점은 여전히 유효한 혁신이라고 생각합니다.
주식은 최근 급격히 오른 것이, 조만간 조정맞을
예정이었는데 딥식이 시의적절하게 뺨을 때리지
않았나 "근거없는 상상"을 해 봅니다.
근거는 없습니당. ㅎ
오픈할 정도로 안정화 시킨 것은 대단하지만,
nvidia 등의 실리콘 업체의 가치가 내려가는
것은 아닌 것 같습니다. 결국은 뭘해도 성능 좋은
실리콘을 써야하고, 더 좋은 실리콘이 더 나은
결과를 만들어낼 가능성은 여전히 높다고 봅니다.
실리콘 성능 2배가 결과 지표 2배가 되는
것은 아니겠지만, 어느 정도 이상은 의미가
있다고 봅니다. HBM으로 인한 데이터 전송의
장점은 여전히 유효한 혁신이라고 생각합니다.
주식은 최근 급격히 오른 것이, 조만간 조정맞을
예정이었는데 딥식이 시의적절하게 뺨을 때리지
않았나 "근거없는 상상"을 해 봅니다.
근거는 없습니당. ㅎ
그래나다어쩔님의 댓글
작성자
그래나다어쩔
작성일
01.28 11:29
전기차 사실 분들은 급하지 않다면 내년에 사시면 좋겠네요. 올해가 AI의 대변혁기라면 내년엔 자율주행이 상향 평준화되겠네요.
남산깎는노인님의 댓글
작성자
남산깎는노인
작성일
01.28 11:32
딥시크의 성능은 거짓말을 할 수 없지만 비용이나 설비에 대한 언급은 너무나 의심 가는 상황입니다. 저는 비용이나 설비에 대해선 구라라고 생각합니다. 비유하면 10년 전 중급 그래픽 카드로 8k 60fps 돌린다는 소린데. 중국계나 중국 큰손이 숏 치려고 개수작한게 아닌가 싶을 정도로요. 딥시크가 12월에 나온놈도 아닌데. ㅎㅎㅎ
고마치아라님의 댓글
작성자
고마치아라
작성일
01.28 11:35
뭐 가성비란 얘기죠. 결국 1등은 아니란 얘기. 인터뷰때 최고라고 하는 말보고 뻥카가 심하네 라고 생각이 드네요. 저는 저번주에 하이닉스 정리했지만요.
유전무죄무좀유죄님의 댓글
작성자
유전무죄무좀유죄
작성일
01.28 11:56
계산력은 다다익선 입니다. 저 글에서는 한정된 계산 자원을 효율적으로 이용했다 뿐이라서요. 효율적으로 더 큰 자원을 쓰게되면 더 많은걸 할 수 있다고 봅니다.
페이퍼백님의 댓글
작성자
페이퍼백
작성일
01.28 12:15
우리는 검증을 기다리면 됩니다.
세계 여러 나라가 그리고 많은 기업들이 테스트를 시작할 겁니다.
정말 500만 달러로 가능한지 아닌지를요.
입증되면 미국의 AI 독점은 끝나겠죠.
세계 여러 나라가 그리고 많은 기업들이 테스트를 시작할 겁니다.
정말 500만 달러로 가능한지 아닌지를요.
입증되면 미국의 AI 독점은 끝나겠죠.
엔뜨님의 댓글
작성자
엔뜨
작성일
01.28 13:28
오픈 소스로 풀었다는 점이 고무적이고
거대 회사들은 그 방법을 써봄과 동시에 내부 검증만 된다면 그만한 자금력으로 더 큰 발걸음을 내딛을 것만 같습니다. 서로서로 경쟁하니 발전 속도는 더 붙을 것 같아요.
거대 회사들은 그 방법을 써봄과 동시에 내부 검증만 된다면 그만한 자금력으로 더 큰 발걸음을 내딛을 것만 같습니다. 서로서로 경쟁하니 발전 속도는 더 붙을 것 같아요.
금오키도키님의 댓글
작성자
금오키도키
작성일
01.28 17:19
사용했단 기법이 대단한것도 아니고...R1이 지난주 초에 나왔는데 정작 그땐 조용했죠. 스코어 측면에선 우월하다하지만 자세한 질문엔 오류 정보를 종종 낸다하고 중국쪽 질문은 다 외면하죠. MoE에서 나온 전문가 개념도 특별한것도 아니고 강화학습도 대단한 기술도 아닌 상황에..제대로 한건지 의심스럽습니다. 그냥 시장 조정을 위한거 아닌가 싶네요
해질무렵님의 댓글
엔디비아 주식, 손해보더라도 팔아야 할거 같네요.