챗GPT가 달라졌다 … 수능국어 8등급서 올해는 1등급

알림
|
X

페이지 정보

작성자 아름다운별 175.♡.19.233
작성일 2024.11.20 16:02
분류 IT
5,859 조회
22 추천
쓰기

본문

* GitHub 링크

https://github.com/Marker-Inc-Korea/Korean-SAT-LLM-Leaderboard


* 아래부터 매일경제 기사 내용 일부

https://v.daum.net/v/20241119174804612

https://www.mk.co.kr/news/it/11172587


챗GPT 최근 3개년 수능 국어 성적 이미지입니다.


오픈AI 최신모델 'o1프리뷰'

국어영역 1문제 틀린 97점

여러개 지문 비교문항도 척척

더많은 시간 생각하도록 훈련

6개문항 푸는데 1분10초 걸려

"언어능력 곧 인간 능가할것"


인공지능(AI) 추론 능력이 날로 개선되면서 대학수학능력시험에서 국어 영역 1등급을 받는 수준까지 올라섰다. 19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 '수능 국어 LLM 리더보드'에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025학년도 수능 국어 영역에서 원점수 97점으로 1등급권에 안착했다. 올해 수능 국어 영역에서 단 한 문제만 틀리고 모두 맞힌 셈이다. 선택 과목은 '화법과 작문'으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.


복잡한 추론이 필요한 수능 국어에서 기존 AI는 3~9등급 사이 점수를 받으며 고전해 왔는데, 최근 AI의 추론 능력이 비약적으로 발전하면서 o1-프리뷰 모델이 고득점 획득에 성공한 것이다. 챗GPT 기존 모델인 GPT-4o (2024년 5월 출시)모델은 2023~2024학년도 수능에서 모두 중위권 학생 수준인 4등급을 기록했다.


이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다. 마커AI 소속 개발자는 블로그를 통해 "2025학년도 수능에서 기록한 97점이라는 점수는 LLM의 한국어 능력이 인간을 뛰어넘을 시기가 머지않았음을 보여준다"고 평했다.

[이후 내용 생략]

댓글 15 / 1 페이지

뚱뚱한남편님의 댓글

작성자 no_profile 뚱뚱한남편 (103.♡.126.34)
작성일 11.20 16:46
세상에..

DINKIssTyle님의 댓글

작성자 DINKIssTyle (61.♡.73.102)
작성일 11.20 16:52
ㄷㄷ 다른 과목들 해보면 점수가 어찌될지 궁금해지는군요

유닉스님의 댓글

작성자 no_profile 유닉스 (211.♡.180.145)
작성일 11.20 17:02
기레기들도 빨리 ai로 대처되길 기도해봅니다

마카로니님의 댓글의 댓글

대댓글 작성자 마카로니 (60.♡.222.169)
작성일 11.20 21:46
@유닉스님에게 답글 판사도요

오일팡행주님의 댓글의 댓글

대댓글 작성자 no_profile 오일팡행주 (211.♡.84.48)
작성일 11.20 22:22
@유닉스님에게 답글 기레기는 오답율이 99..998%니까 당연한거겠죠

ASTERISK님의 댓글

작성자 ASTERISK (211.♡.201.137)
작성일 11.20 17:51
랭귀지 모델이 추론까지 한다구요!!??

채찍PT님의 댓글의 댓글

대댓글 작성자 채찍PT (118.♡.73.84)
작성일 11.20 18:13
@ASTERISK님에게 답글 o1 엔진은 추론모델로 알고있습니다

요오옹님의 댓글

작성자 요오옹 (121.♡.136.19)
작성일 11.20 18:34
빨리 판사 AI 도입이 시급합니다. 인간보다 백배는 나을듯요

WindBlade님의 댓글

작성자 WindBlade (176.♡.12.144)
작성일 11.20 19:01
언어 1등급이라면 이미 대다수의 인간은 추월했네요. 최상위 등급도 조만간 정복하겠네요.

monarch님의 댓글의 댓글

대댓글 작성자 monarch (211.♡.113.31)
작성일 11.20 20:43
@WindBlade님에게 답글 그렇게 해석되네요... ㄷㄷㄷ
인간을 줄세우기 위한게 시험이니...ㄷㄷㄷ

엉클머리님의 댓글의 댓글

대댓글 작성자 엉클머리 (220.♡.180.115)
작성일 11.20 22:13
@WindBlade님에게 답글 다른 실험 결과에서도 추론 능력은 상위 3%에 들었습니다.

Everlasting님의 댓글

작성자 Everlasting (121.♡.172.2)
작성일 11.20 19:53
물리적으로 인체 이식만 된다면 배운다는게 의미 없어질 듯 해요

부릎뜨니숲이어쓰님의 댓글

작성자 부릎뜨니숲이어쓰 (119.♡.48.246)
작성일 11.20 22:41
ai 시작에 저 정도인데다가 앞으로 계속 업글 될 텐데 와...무섭네요ㄷㄷㄷ

카비젤님의 댓글

작성자 no_profile 카비젤 (223.♡.53.232)
작성일 11.21 07:39
프리뷰와 o 의 차이일 수 있겠네요. 영어, 수학 결과도 있습니다.
ChatGPT vs Claude, 수능 보고 서울대 갈 수 있을까? https://yozm.wishket.com/magazine/detail/2851/

초식호랑이님의 댓글

작성자 초식호랑이 (182.♡.8.145)
작성일 11.21 08:38
판결시 AI의견도 추가 필요할듯요.
쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색