다모앙 커뮤니티 운영 규칙을 확인하세요.
X

OpenAI, GPT-4.5 발표

페이지 정보

작성자 아름다운별
작성일 2025.02.28 05:07
분류 IT
4,805 조회
10 추천

본문

* OpenAI 공식 블로그 내용 일부

Introducing GPT-4.5

https://openai.com/index/introducing-gpt-4-5/

# "How to use GPT-4.5 in ChatGPT" 부분만 번역한 내용입니다.


오늘부터 ChatGPT 프로 사용자는 웹, 모바일, 데스크톱의 모델 선택기에서 GPT-4.5를 선택할 수 있습니다. 다음 주에는 플러스 및 팀 사용자에게, 그다음 주에는 엔터프라이즈 및 에듀 사용자에게 배포될 예정입니다.


GPT-4.5는 검색을 통해 최신 정보에 접근할 수 있으며, 파일과 이미지 업로드를 지원하고, 글쓰기와 코드 작업용 캔버스를 사용할 수 있습니다. 그러나 현재 GPT-4.5는 ChatGPT의 음성 모드, 비디오, 화면 공유와 같은 멀티모달 기능을 지원하지 않습니다. 향후 AI가 사용자를 위해 '그냥 작동'하도록(just works) 사용자 경험을 단순화하기 위해 노력할 것입니다.


* 참조 1 - OpenAI 공식 X 계정 글


* 참조 2 - CEO 샘 올트먼 글

10추천인 목록보기
댓글 9 / 1 페이지

엉클머리님의 댓글

작성자 엉클머리
작성일 02.28 05:12
요약

GPT-4.5는 GPT-4o에 비해 전반적으로 개선된 대화 품질, 향상된 체인 오브 솟(Chain-of-Thought) 능력, 낮은 환각률 및 10배 이상의 계산 효율성을 보여줍니다. 이로 인해 일상적인 작업과 복잡한 문제 해결에서 더 자연스럽고 신뢰할 수 있는 성능을 제공합니다.

반면, 준비 평가(Preparedness Framework Evaluations)와 같이 모델 자율성, 특수 작업(예: SWE-bench, Agentic Tasks) 등 첨단 과제에서는 GPT-4.5의 성능이 o3-mini와 같은 최신 frontier 모델이나 deep research 모델에 비해 다소 낮은 편입니다. 즉, GPT-4.5는 범용적 사용에 최적화되어 있어 GPT-4o보다 여러 면에서 우수하지만, 일부 첨단 평가에서는 o3(예, o3-mini) 모델들이 더 높은 성과를 보이고 있습니다. 

GPT-4.5의 주요 특징은 다음과 같습니다:

• 확장된 지식 기반과 자연스러운 대화: 전 세대 모델보다 더 많은 정보를 내재화하고 있으며, 보다 자연스럽고 직관적인 대화 경험을 제공합니다.
• 향상된 계산 효율성: GPT-4에 비해 10배 이상의 계산 효율성을 달성하여 빠른 응답과 처리 속도를 자랑합니다.
• 강화된 체인 오브 솟(Chain-of-Thought) 능력: 복잡한 문제 해결이나 논리적 추론 작업에서 더 우수한 성능을 보입니다.
• 개선된 감성 및 창의적 능력: 내부 평가에서 “따뜻하고 직관적”이라는 평을 받을 정도로 감성 지능이 향상되어, 창의적인 글쓰기와 디자인 작업에 도움을 줍니다.
• 안전성과 정렬(Alignment) 기술 강화: 사용자 의도에 보다 정밀하게 맞추어 대응하고, 불허 콘텐츠에 대한 반응 역시 안정적으로 관리합니다.
• 연구 엔지니어 인터뷰 평가: 코딩 문제에서 79%의 점수를 기록해 deep research 모델과 동등한 성능을 보여줍니다.
• SWE-bench Verified 평가: 전 세대인 GPT-4o에 비해 개선되었으나, 최첨단 코딩 모델(deep research, o3-mini 등)과 비교할 때는 약간 낮은 성과를 보입니다.

아름다운별님의 댓글의 댓글

대댓글 작성자 아름다운별
작성일 02.28 05:41
@엉클머리님에게 답글 API 가격도 놀라운 수준이네요 🤔
https://openai.com/api/pricing/

엉클머리님의 댓글의 댓글

대댓글 작성자 엉클머리
작성일 02.28 06:47
@아름다운별님에게 답글 가격을 높여서 배끼는 걸 방지합니다?!

김파인님의 댓글

작성자 no_profile 김파인
작성일 02.28 09:01
어차피 claude나 후발주자도 금방금방 따라잡는데 비싼 돈 주고 OPEN AI 쓸 이유를 모르겠네요. Dall=E를 먼저 개발하고도 오픈소스인Stability 에 맥없이 밀려난 과거를 볼 때 Open Ai가 chat모델에서 독보적인 지위를 차지하기는 힘들것 같습니다. 다른 모델들도 충분히 좋고 한쪽이 좀 우수해져도 이미지 모델들처럼 금방금방 다둘 따라잡는 느낌이에요

칼쓰뎅님의 댓글의 댓글

대댓글 작성자 칼쓰뎅
작성일 02.28 21:03
@김파인님에게 답글 그래도 현존 원탑인건 사실이니까요. 선도기업이라는게 있죠 ㅎㅎ

엉클머리님의 댓글

작성자 엉클머리
작성일 02.28 15:45
성능이 떨어지는데 가격은 가장 높은 이유가 있습니다. 저는 열심히 쓰겠습니다.

뚜릉아빠7님의 댓글

작성자 no_profile 뚜릉아빠7
작성일 03.01 21:32
생초보인 제가 1주일간 사주팔자 사이트 만들기에 도전중인데

4만원짜리 지피티도 질러봤지만
제미나이코드 어시스턴트로 현재는
고비들을? 넘기고 있네요

괜찮은것 같아요

Diablo님의 댓글

작성자 no_profile Diablo
작성일 03.01 22:58
소넷 3.7에 비하면 어느정도일까요

기적님의 댓글의 댓글

대댓글 작성자 기적
작성일 03.01 23:52
@Diablo님에게 답글 테스트 중인데 일단 코딩은 Sonnet 3.7 think 모드에 비해서 많이 모자른 결과를 보여주고 있네요.
API 비용 차이 생각하면 Sonnet의 압승으로 보입니다.
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색