다모앙 커뮤니티 운영 규칙을 확인하세요.
X

딥시크 글을 보고 드는 생각

페이지 정보

작성자 수필
작성일 2025.01.28 12:42
1,150 조회
10 추천

본문

https://damoang.net/free/3005016


자게에서 딥시크가 혁신인 이유라는 글을 읽고 많은 생각이 듭니다.

1. 저 비용에 가능한가?

미국에서 원자로를 다시 가동한다고 하고, 소형핵원자로의 개발에도 영향을 줄만큼

AI는 전기를 잡아먹는 괴물입니다. 그런데 딥시크는 그만큼 전력을 먹지 않아도 되고

고가의 칩을 사용하지 않아도 AI를 훈련할 수 있다는 게 가능한지 의심이 들 정도입니다.

이게 사실이라면 후발주자로 따라갈 나라들에게 큰 도움이 되는 셈이고,

미국이 패권을 쥐고 갈 AI 산업이 좀 더 다양해질 가능성이 열립니다.

오픈AI에게 매달 20달러 주고 열심히 chatgpt를 굴리는 입장에서 선택권이 다양할수록 좋은 것이지요.

오픈 소스로 푼 만큼 후발 주자들이 잘 따라왔으면 합니다.


2. 지도학습의 필요성?

AI, 보다 넓게는 딥러닝, 인공지능을 만드는데 있어서 설계자가 개입하는 지도학습은 다소 밀려난 것으로 알고 있습니다.

하지만 딥시크가 경량화에 성공하면서 "전문가 시스템" 구축에 성공해서,

AI의 부분부분을 활성화해서 경량화+저전력화+효율화까지 달성했다면 또 새로운 장이 열린 듯 하네요.

그런데 다르게 보면 이 지도학습이라는 건 '중국' AI라면 매우 필요한 것일 겁니다.

당장 딥시크에게 천안문이나 시진핑, 곰돌이 푸에 대해서 물어보는 분들이 많은 상황입니다.

이런 민감한 질문에 대해서 지도학습은 반드시 필요할 것이고, 어떻게든 방법을 찾아냈다는 의미가 되겠네요.

또 달리 말하면 딥시크 방식으로 훈련된 후속모델들은 어떤 특정분야에 있어서는 좋게 말해서 지도,

나쁘게 말하면 검열이 가해진 방식으로 나올 지도 모르겠습니다.


3. 미중경쟁의 한 그늘

AI의 발전에 있어서 떼어놓을 수 없는 것이 미중간의 경쟁입니다. 트럼프가 돌아왔고, 그는 적어도 표면적으로는 중국을 적대시할 겁니다.

그리고 AI를 훈련시키는 반도체 칩에 대해서는 이전보다 더욱 강한 제재를 가할 지도 모릅니다.

이런 상황에서 중국은 어떻게든 난관을 돌파하는 방법을 모색해야 하고, 그런 결과물 중 하나가 딥시크로 보입니다.

미국이 첨단 산업에서 한 발 앞서 나가고 중국에 대해서는 철저히 봉쇄정책을 펼치고 있지만,

이미 그러기엔 늦은 것이 아닌가 싶습니다.


4. 중국, 중국, 중국...

딥시크의 유용함을 들어보고 로컬 오프라인으로는 돌려봤습니다. 가지고 있는 맥이 고작 M2프로에 불과해서

양자화된 모델을 돌렸더니 답변의 퀄리티가 좋진 않았습니다. 그리고 과정과정에서 나오는 한자는 참 낯설더군요.

AI가 생각하면서 내뱉는 중국어는 생소했습니다.

그래서 앱을 다운로드해서 써보고 싶긴 한데...중국이라는 게 참 걸립니다.

제 개인정보가 이미 중국 서버 어딘가에는 남아있긴 할테지만 더이상의 정보를 넘겨주는 건 꺼림직합니다.

참 아쉽습니다.


5. 저작권 관련 이슈

AI를 훈련하는데 있어서 저작권 이슈는 매우 민감한 사항입니다. 미국에서도 오픈AI와 메타를 향해 소송이 들어갔고,

이 와중에 메타는 라마를 훈련하면서 LibGen이라는 책해적질 사이트의 데이터를 사용한 것으로 구설수에 올랐습니다.

저커버그도 이 상황을 잘 알고 있었을 것이라는 게 공개됐고, 윤리적 문제에 있어서 다시 한번 도전을 받고 있습니다.

(메타는 최근 가짜 뉴스 검열을 중단하면서--팩트체크 중단, 또 사람들 입에 오르내리고 있습니다)

라마는 오픈소스로 다 열어놨으니 제 입장에서는 그리 큰 문제인가 싶긴 하지만,

영리를 추구하는 기업이 저작권을 고려하지 않는 걸 넘어서 해적질된 책의 데이터를 사용한 건 작지 않은 문제긴 합니다.

저작권 문제는 참 어렵습니다. AI 역시 인류의 자산으로 취급되어야 한다는 입장인데,

정작 이걸 개발하는 건 모두 사기업이라서 미묘합니다.


6. 오픈소스로 가볍게 돌려볼 모델을 조만간 볼 수 있을까

이 소박하지만 어려운 소원을 딥시크를 통해 꿈꿔보네요.

경량화를 달성한 챗gpt급의 AI를 로컬로 원활히 돌릴 수 있다면, AI의 대중화가 열렸다고 봐도 될 거 같습니다.

딥시크가 진짜배기라면 제 예상보다는 더 빠르게 나오지 않을까 합니다.



10추천인 목록보기
댓글 3 / 1 페이지

퍼렁곰님의 댓글

작성자 no_profile 퍼렁곰
작성일 01.28 13:30
제가 개발자는 아니지만, ai모델의 신경망.. hidden layer라고 불리는 부분에서 도대체 어떤식으로 추론이 이루어지는지는 이 세계의 그 누구도 모르는걸로 알고있습니다.
무슨 이야기냐면, 모델을 훈련시킬때 천안문이나 시진핑에 관련된 질문에 대한 답을 편향되게끔 추론하는 모델을 훈련하는건 불가능하다는 겁니다.
제가 알기로 딥시크는 모델 그 자체는 건드리지 않고, 웹상에서 답변을 출력할때 공산당 관련된 답을 검열하는 걸로 알고있습니다. 그런데 딥시크가 모델을 오픈소스로 풀었기때문에, 딥시크 모델을 중국이 아닌 다른 곳에서 돌리면 시진핑에 대한 검열없는 대답을 들을 수 있다는 뜻입니다.

많은 분들이 중국 ai하면 '검열'부터 떠올리고 "시진핑 욕 못하지?" 또는 "개인정보 다넘어가는데" 같은 이야기를 합니다. 그러나 딥시크는 그런식으로 바라보면 안됩니다. 순수하게 기술력 - 알고리즘 측면에서 미국이 리딩하지 않은 기술이 나왔다는 것에 주목해야하고, "그렇다면 우리는 어떻게해야하지"를 논해야하지 검열이니 하는 부차적이고 소모적인 논쟁은 별 도움이 안된다고 생각합니다.

수필님의 댓글의 댓글

대댓글 작성자 수필
작성일 01.28 13:41
@퍼렁곰님에게 답글 히든레이어에서 어떤 방식으로 학습이 이뤄지는지에 대해서 잘 알려지지 않고, 설명할 수 없다는 건 잘 알고 있습니다. 그래서 설명가능한 AI 모델도 나오고 있고, '블랙박스'라고 불리는 AI 자체에 대해 두려움을 가진 전문가들도 있는 것으로 알고 있구요.
로컬 모델을 완전히 데스트해본 게 아니라 답변이 검열되는 걸 '지도학습'이라고 추측했던 건 제가 잘못이해한 거 같습니다.
저 역시 더 발전적인 방향으로 AI 개발이 어떻게 가야할 지 또 한국에서는 어떻게 대처할 지에 대해서 논해야 한다고 생각합니다. 중국에 대한 과장도 피해야 하지만 과소평가하는 것 역시 조심해야겠지요. 딥시크는 후발주자로 따라가는 국내 IT 기업들에게 교훈이 될 수 있을 겁니다.

rustacean님의 댓글

작성자 no_profile rustacean
작성일 01.28 13:57
지도학습이 밀려난 적은 없는것 같습니다. 당장 DeekSeek를 포함한 GPT계열의 다음 토큰 추측 학습 자체가 지도학습이니까요.

다만 강화학습은 한때 밀려난 적이 있는데 이번에 강화학습도 잘 작동할 수 있다는 걸 보여준 면은 있는것 같습니다. 하지만 강화학습만 사용해서 추론 능력을 만들어내면 답변이 끝없이 반복되는 점, 답변이 읽기 힘든 점, 언어를 자기 마음대로 섞어쓰는 점이 있어 지도학습과 강화학습을 섞어서 만들었다고 합니다.
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색