LLM 모델 몇가지를 테스트해봤는데요...
알림
|
페이지 정보
작성일
2024.10.14 18:16
본문
한 플랫폼에서 모델 바꿔 끼어가며 테스트해볼
수 있는 사이트가 있어서, 프롬프트를 간단히 작성
해서 JSON 데이터를 넘겨주고 사람한테 설명
해달라고 요청했습니다...
LLaMA 3.2 모델은 한국어의 빈도가 낮은건지
한국어를 갓 공부하여 영어랑 한국어를 섞어쓰는
듯한 느낌이 있고요. (대충 쓸만하지 못하다는 소리.)
Qwen (Alibaba 계열에서 개발한) 모델은
곧잘 하는데, 가끔 한자를 섞어 내보내는 것 같아
두고 봐야 할 것 같습니다. (ㅈㅅ일보가 떠오릅니다)
최근에 나온 Gemini 1.5 Flash 8B 같은 경우에는
준수하게 뽑아내는군요. 애널리틱스에서 토큰 값을
보니 괜찮게 뽑아냅니다. (Approx. 0.0000149 $)
OpenAI 는 안봐도 거의 비슷하게 나올 것 같아서
패스했습니다.
결론은 한국어 쓸때는 대기업 벗어나면 안되겠군요.
리더보드랑 뭔가 괴리가 많은것 같습니다..
- 게시물이 없습니다.
댓글 4
/ 1 페이지
우주난민님의 댓글의 댓글
@B739님에게 답글
그리고 이 수준에서 더 향상되기도 힘든게 나무위키 수준의 정보야 지금도 누구나 인터넷에서 검색해서 찾아볼 수 있고 이미 학습이 됐지만 개별분야 전문가들이 보는 자료는 다 비공개에 고가이고 돈을 준다고 해서 다 접할 수 있는 것도 아니라서요
에피네프린님의 댓글
잘 되다가 다음버전 나오면 안되기도 하고
이건되는데 저건 또 안되고...
정말 장님 코끼리만지기에요 ㅎㅎ
이건되는데 저건 또 안되고...
정말 장님 코끼리만지기에요 ㅎㅎ
우주난민님의 댓글