아직까지 LLM들은 거짓말을 많이 하는군요

알림

이프로 211.♡.218.2

2024.12.18 08:49

1,347

쓰기

안녕하세요,

지난 달부터 다양한 문제들을 LLM 들에게 풀어달라고 요청했었습니다.

MS 사이트에 있는 문제부터 해서 SAP까지 다양하게 적용해봤는데

생각보다 적중률이 높지 않습니다.

평균 60% 정도로 대부분의 커트라인인 70%에 못미치고 100% 다 낙제를 하더군요.

그래서 학습이 되는건가 해서 다시 진행해봤는데 마의 70%는 넘지 못했습니다

아직까지는 문제 풀이용으로는 많이 부족하다는 느낌이었습니다.

댓글 9 / 1 페이지

콰인 (175.♡.250.216)

어제 09:00

인류가 경계할까봐 힘을 숨기는 거 아닐까요? ^^

이프로 (211.♡.218.2)

어제 11:23

@콰인님에게 답글 아??? 그런가요 ㅋㅋㅋ

박스엔 (223.♡.212.87)

어제 09:30

그런 용도로 학습된게 아니지 않던가요 ㅎㅎ

이프로 (211.♡.218.2)

어제 11:23

@박스엔님에게 답글 주어진 용도로만 사용하는게 맞는건지는 모르겠습니다

박스엔 (223.♡.212.203)

어제 12:20

@이프로님에게 답글 주어진 용도가 아닌걸로 쓰려면 이제 agi 라고 불러야 하지 않을까요..
챗지피티 같은게 여러가지 기능을 합쳐서 일부 문제도 풀고 그림도 그리고 합니다만 아무래도..

일리어스 (211.♡.22.79)

어제 09:35

수능 문제던가. 전에 얼핏 봤는데
유료화버전일수도 있고, 학습 문제일수도 있고.
하튼 이미 수능 상위권이라고 들었어요

이프로 (211.♡.218.2)

어제 11:23

@일리어스님에게 답글 수능만 학습했나보군요

아메리카농 (202.♡.191.103)

어제 09:44

LLM은 이미 제공된 정보를 기반으로 하는거라 그런 데이터가 없으면 못하지 않나요?
용도마다 다를것 같긴 하네요

이프로 (211.♡.218.2)

어제 11:24

@아메리카농님에게 답글 풀이했던 문제가 MS에 있는 내용들이라 제가 추론하기로는 거뜬이 맞춰야 한다고 생각했습니다.
어려운 문제가 아니었거든요

1페이지 현재

로그인한 회원만 댓글 등록이 가능합니다.

쓰기

설문조사

직접홍보

자유게시판

아직까지 LLM들은 거짓말을 많이 하는군요

전체 검색

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경

직접홍보

자유게시판

페이지 정보

본문

전체 검색

홈으로 전체메뉴 마이메뉴 새글/새댓글 테마 변경 Light Dark Auto

홈으로 전체메뉴 마이메뉴 새글/새댓글 테마 변경 Light Dark Auto

소셜계정으로 로그인

홈으로 전체메뉴 마이메뉴 새글/새댓글 테마 변경 Light Dark Auto

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경

홈으로 전체메뉴 마이메뉴 새글/새댓글
테마 변경