아직까지 LLM들은 거짓말을 많이 하는군요

알림
|
X

페이지 정보

작성자 이프로 211.♡.218.2
작성일 2024.12.18 08:49
1,347 조회
2 추천
쓰기

본문

안녕하세요,


지난 달부터 다양한 문제들을 LLM 들에게 풀어달라고 요청했었습니다.

MS 사이트에 있는 문제부터 해서 SAP까지 다양하게 적용해봤는데

생각보다 적중률이 높지 않습니다.


평균 60% 정도로 대부분의 커트라인인 70%에 못미치고 100% 다 낙제를 하더군요.

그래서 학습이 되는건가 해서 다시 진행해봤는데 마의 70%는 넘지 못했습니다

아직까지는 문제 풀이용으로는 많이 부족하다는 느낌이었습니다.

댓글 9 / 1 페이지

콰인님의 댓글

작성자 no_profile 콰인 (175.♡.250.216)
작성일 어제 09:00
인류가 경계할까봐 힘을 숨기는 거 아닐까요? ^^

이프로님의 댓글의 댓글

대댓글 작성자 이프로 (211.♡.218.2)
작성일 어제 11:23
@콰인님에게 답글 아??? 그런가요 ㅋㅋㅋ

박스엔님의 댓글

작성자 박스엔 (223.♡.212.87)
작성일 어제 09:30
그런 용도로 학습된게 아니지 않던가요 ㅎㅎ

이프로님의 댓글의 댓글

대댓글 작성자 이프로 (211.♡.218.2)
작성일 어제 11:23
@박스엔님에게 답글 주어진 용도로만 사용하는게 맞는건지는 모르겠습니다

박스엔님의 댓글의 댓글

대댓글 작성자 박스엔 (223.♡.212.203)
작성일 어제 12:20
@이프로님에게 답글 주어진 용도가 아닌걸로 쓰려면 이제 agi 라고 불러야 하지 않을까요..
챗지피티 같은게 여러가지 기능을 합쳐서 일부 문제도 풀고 그림도 그리고 합니다만 아무래도..

일리어스님의 댓글

작성자 일리어스 (211.♡.22.79)
작성일 어제 09:35
수능 문제던가. 전에 얼핏 봤는데
유료화버전일수도 있고, 학습 문제일수도 있고.
하튼 이미 수능 상위권이라고 들었어요

이프로님의 댓글의 댓글

대댓글 작성자 이프로 (211.♡.218.2)
작성일 어제 11:23
@일리어스님에게 답글 수능만 학습했나보군요

아메리카농님의 댓글

작성자 아메리카농 (202.♡.191.103)
작성일 어제 09:44
LLM은 이미 제공된 정보를 기반으로 하는거라 그런 데이터가 없으면 못하지 않나요?
용도마다 다를것 같긴 하네요

이프로님의 댓글의 댓글

대댓글 작성자 이프로 (211.♡.218.2)
작성일 어제 11:24
@아메리카농님에게 답글 풀이했던 문제가 MS에 있는 내용들이라 제가 추론하기로는 거뜬이 맞춰야 한다고 생각했습니다.
어려운 문제가 아니었거든요
쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색