OpenAI의 CriticGPT 모델, GPT-4 결과물 비판 능력 강화

알림
|
X

페이지 정보

작성자 아름다운별 118.♡.84.112
작성일 2024.06.28 21:14
분류 IT
3,933 조회
5 추천
쓰기

본문

[공식] Finding GPT-4’s mistakes with GPT-4

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

※ PDF - https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf


* Ars Technica 기사 - OpenAI’s new “CriticGPT” model is trained to criticize GPT-4 outputs

https://arstechnica.com/information-technology/2024/06/openais-criticgpt-outperforms-humans-in-catching-ai-generated-code-bugs/


[기사 일부 내용 GPT-4o 번역]

목요일(현지 기준) OpenAI 연구원들은 ChatGPT가 생성한 코드의 오류를 찾아내기 위한 새로운 AI 모델, CriticGPT를 선보였습니다.


이 모델은 강화 학습(RLHF)을 통해 사람 피드백을 받아서, AI 시스템이 사람이 원하는 방식으로 작동하도록 하는 ('정렬' 이라고 부르는) 과정을 향상하고, 대형 언어 모델(LLM) 출력 정확도를 높이는 데 도움을 줍니다.


"LLM Critics Help Catch LLM Bugs" (LLM 검토자가 LLM 버그를 잡는 데 도움을 줍니다) 라는 새 연구 논문을 보면, OpenAI는 ChatGPT가 생성한 프로그래밍 코드를 검토하는 사람 트레이너를 돕기 위해 CriticGPT를 개발했습니다.


GPT-4 계열 LLM을 기반으로 한 CriticGPT는 코드를 분석하여 잠재적인 오류를 지적하여, 사람이 쉽게 실수를 발견할 수 있도록 돕습니다. 연구원들은 고의로 버그를 삽입한 코드 샘플 데이터셋을 사용해 CriticGPT를 훈련해 다양한 코딩 오류를 인식하고 지적할 수 있게 했습니다.


연구진은 자연적으로 발생하는 LLM 오류와 관련된 사례 중 63%에서 CriticGPT의 비평이 사람의 비평보다 더 선호된다는 것을 발견했습니다. 또한, CriticGPT를 사용하는 사람-기계 팀은 사람만으로 비평하는 것보다 더 포괄적인 비평을 작성하면서, AI만으로 비평하는 경우에 비해 혼동(환각) 비율을 줄였습니다.


… [이후 내용 생략] …



[왼쪽 그래프 - 비평의 포괄성 / 오른쪽 그래프 - 환각 발생률]

※ CriticGPT는 트레이너들이 더 포괄적인 비평을 작성할 수 있게 도와주며, 모델 혼자서 작성한 비평보다 환각을 줄입니다.

댓글 9 / 1 페이지

겜돌이님의 댓글

작성자 겜돌이 (218.♡.224.249)
작성일 06.28 22:55
AI끼리 서로 까는?시대…
뭔가 인간 개입없이 알아서 발전할날도 얼마 안남았군요.

토피아님의 댓글

작성자 no_profile 토피아 (220.♡.233.73)
작성일 06.28 23:47
와…. 대단하네요

부산아재님의 댓글

작성자 no_profile 부산아재 (49.♡.12.102)
작성일 06.28 23:56
ai:넌(인간) 이제 그냥 가만있어?;;;

plaintext님의 댓글

작성자 plaintext (119.♡.120.4)
작성일 06.29 01:27
근데 고집이 센게 아니라
정정 능력이 너무 부족해요..
제가 뭐 어려운 코드를 고치라는 것도 아니고
지적한건 틀려도 수정을 해야지
알겠습니다 하고 같은 답을 반복하는데
이게 사람(?)인가 싶더라구요...ㅎㅎㅎㅎ

백장미님의 댓글

작성자 백장미 (223.♡.81.252)
작성일 06.29 09:46
스카이넷과 인간의 싸움이 아니라
skynet과 groundnet간 싸움이 미래에서 벌어질지도 모르겠네요

하늘괭이님의 댓글

작성자 하늘괭이 (58.♡.27.59)
작성일 06.29 10:13
진짜 무궁무진 하네요.

나무플러스님의 댓글

작성자 no_profile 나무플러스 (106.♡.196.222)
작성일 06.29 11:04
일단 gpt 를 해지하고, 출시되면 써봐야 겠군여.

공수거님의 댓글

작성자 공수거 (118.♡.84.35)
작성일 06.29 16:25
AI가 댓글 알바 하는 날이 올까 두렵네요

신라면ㅡ세점님의 댓글

작성자 신라면ㅡ세점 (14.♡.87.120)
작성일 07.01 10:46
호라이즌 제로던의 가이아와 하데스가 떠오르는군요.
쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색