DeepSeek R1 이 중국쪽 사료를 뒤지는데에도 효과적이네요.

알림
|
X

페이지 정보

작성자 가사라 112.♡.211.243
작성일 2025.01.26 17:20
1,189 조회
4 추천

본문

저는 AI 에도 관심이 많고 고대사 관련 자료를 취미로 종종 살펴보는데, 중국에서 OpenAI o1 급 성능을 무료로 쓰게 해주는 DeepSeek R1 을 내놓으니 요긴하게 쓸 데가 많네요.


사례를 들자면, 발해(渤海)라는 명칭은 고대에는 중원 내부의 호수(염수호)가 있어서 그 호수를 일컫는 말이었다가 물이 빠지면서 호수가 없어지고 발해라는 이름은 현재 요동반도와 산동반도 사이의 바다를 일컫는 용도로 쓰이게 되었죠.

이 사실에 관해 Gemini 나 ChatGPT, Claude, Perplexity 등에 사료로 확인할 수 있냐고 물어보면 그런건 찾을 수 없다고 하거나 YouTube 에 관련 영상이 있다 정도로만 알려주죠.


하지만, DeepSeek R1 은 이미 고대사관련 자료들을 다 학습한 탓인지 아니면 RAG 로 연결하게 잘 준비해둔 탓인지 중국25사 관련 자료들을 뒤져서 어느 부분에 관련 기록이 있는지 다 찾아서 알려주네요.

게다가 발해라는 이름이 쓰인 케이스들을 정리해서 알려달라고 하니 호수이름, 국가명, 현재의 발해만 3가지를 잘 정리해서 보여줍니다.

(담수호라고도 하고 소금생산이라고도 나와서 다시 물어보니 소금생산관련 기록들이 많아서 염수호가 맞다고 고쳐주네요.)





현재까지 테스트해본 바로는 동북공정같은 오염된 데이터를 보여주지는 않고 대체로 괜찮은 수준의 역사적 사실을 보여주는데, 다만 현재의 중국공산당에서 금지하는 항목들을 물어보면 그건 다 막혀있는지 대답을 안해주긴 하네요.

(시진핑이라든가... 천안문이라든가...)


사실 제가 고대사 관련 사료들을 모아서 LLM 에 RAG 로 연결해서 구현해볼 생각은 있었는데 DeepSeek R1 정도면 정말 만족스럽습니다.

사료들이 방대해서 있어도 단순검색정도로는 의미있는 자료를 만들어내기 어려운데, LLM 이 붙어주니 힘들이지 않고도 괜찮은 내용을 뽑아볼 수 있네요.


몇 년 후면 아이들은 물론이고 많은 사람들이 지식의 원천으로 AGI 급의 LLM 들을 신뢰하고 의지하게 될텐데 우리의 힘으로 관리할 수 있는 괜찮은 인공지능 서비스 하나는 꼭 있었으면 하는 바람도 가져봅니다.


4추천인 목록보기
태그
댓글 13 / 1 페이지

삶은다모앙님의 댓글

작성자 삶은다모앙 (61.♡.223.158)
작성일 01.26 17:26
동북공정 이런거 뒤지면... 우찌될까요?

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 17:38
@삶은다모앙님에게 답글 어차피 제대로 된 답변이 나오지 않을 것이라 딱히 질문할 필요성은 못느꼈는데요.
제대로 조사해보고자 한다면 최소한 3개의 업계선두서비스들을 모두 써보고 취합을 하는게 좋겠죠.

가꾸님의 댓글

작성자 가꾸 (175.♡.173.127)
작성일 01.26 17:27
ChatGPT, Claude, Perplexity는 검색 엔진을 통해 정보를 가져오는 방식인 반면,
DeepSeek R1은 RAG 방식처럼 데이터를 통해 정보를 가져온다는 것은
DeepSeek R1은 별도의 정보 데이터를 보유하고 있다는 의미로, 이는 방대한 데이터를 수집하여 보관하고 있다는 뜻이죠.

개인적으로는 정보의 정확도는 향상될 수 있지만, 보안과 최신성 측면에서 위험이 있을 수 있어, 일반적인 AI에게는 좋지 않아 보이내요.


+ 그리고 생각을 좀더 해보니
만약 바이두 같은 중국 검색엔진에서 찾으신 것과 동일한 정보들이 나오면,
DeepSeek R1도 검색엔진을 사용하는데 중국 검색엔진이라 그런게 아닐까 추측됩니다.

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 17:37
@가꾸님에게 답글 제가 RAG 로 구현하는 것을 생각하고 있어서 은연중에 RAG 를 썼을까라고 본문에 쓰긴 했는데, 실제로는 웹검색을 통해 자료들을 가져온 것 같네요.
Search 버튼을 활성화한 상태로 질문한 것이거든요.

웹검색결과도 따로 볼 수 있는데, 중국어자료도 있고 한국어자료도 있고 영어자료도 있는걸 봐선 꽤 방대하게 검색하고 자료를 수집한 다음에 추론한 것 같습니다.

B739님의 댓글의 댓글

대댓글 작성자 B739 (211.♡.196.36)
작성일 01.26 18:57
@가사라님에게 답글 웹 검색도 RAG 의 한 일부분이라서.. 딱히 문제는 없을 것 같습니다.

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 19:00
@B739님에게 답글 가꾸님이 말씀하신 내용은 RAG 로 연결된 중국25사가 있느냐는 의미였어요.
그건 일반적인 서비스 운용에는 매우 부하가 큰 방식이니 웹검색을 RAG 로 연결하는게 맞다는 것이죠.

B739님의 댓글의 댓글

대댓글 작성자 B739 (211.♡.196.36)
작성일 01.26 19:06
@가사라님에게 답글 아 잘못 이해했네요.. 감사합니다

던진도넛님의 댓글

작성자 no_profile 던진도넛 (42.♡.123.98)
작성일 01.26 17:36
동아시아 고대사에 개인적으로 관심이 많은데 국내는 자료가 별로 없고 중국쪽 자료들은 접근성이 떨어지거나 노이즈가 많은게 문제였는데 앞으로 유용하게 쓸 것 같네요 ㄷㄷㄷ

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 17:40
@던진도넛님에게 답글 우리에게는 현존하는 사료가 별로 없어서 너무 아쉽죠.
(조선개국초에 없애버린 사료들이 어마어마하다는...)

8086님의 댓글

작성자 8086 (211.♡.216.139)
작성일 01.26 17:37
웹 인터페이스와 달리 API로 접근하면 검열이 거의 없다는 얘기도 있네요.

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 17:40
@8086님에게 답글 System Instruction 으로 검열 지시사항을 따로 넣어놨을수도 있겠네요.
API 도 워낙에 싸서 제대로 써보려면 검열없이 API 쓰는 것도 부담이 없긴 합니다.

셀빅아이님의 댓글

작성자 셀빅아이 (125.♡.200.218)
작성일 01.26 17:40
동남아 자료 연구나 관련 데이터 찾는건 확실히 좋네요.
각자만의 경쟁력이 생기는것 같습니다.

가사라님의 댓글의 댓글

대댓글 작성자 가사라 (112.♡.211.243)
작성일 01.26 17:42
@셀빅아이님에게 답글 중국쪽 고대사사료들은 많기도 하지만 이를 머릿속에 넣고 취합해서 의미있는 자료로 만드는게 진짜 일이었는데, LLM 이 이런 쪽으로는 구세주급입니다.
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색