OpenAI, GPT-4.5 발표
페이지 정보
작성자
아름다운별

작성일
2025.02.28 05:07
본문
* OpenAI 공식 블로그 내용 일부
Introducing GPT-4.5
https://openai.com/index/introducing-gpt-4-5/
# "How to use GPT-4.5 in ChatGPT" 부분만 번역한 내용입니다.
오늘부터 ChatGPT 프로 사용자는 웹, 모바일, 데스크톱의 모델 선택기에서 GPT-4.5를 선택할 수 있습니다. 다음 주에는 플러스 및 팀 사용자에게, 그다음 주에는 엔터프라이즈 및 에듀 사용자에게 배포될 예정입니다.
GPT-4.5는 검색을 통해 최신 정보에 접근할 수 있으며, 파일과 이미지 업로드를 지원하고, 글쓰기와 코드 작업용 캔버스를 사용할 수 있습니다. 그러나 현재 GPT-4.5는 ChatGPT의 음성 모드, 비디오, 화면 공유와 같은 멀티모달 기능을 지원하지 않습니다. 향후 AI가 사용자를 위해 '그냥 작동'하도록(just works) 사용자 경험을 단순화하기 위해 노력할 것입니다.
* 참조 1 - OpenAI 공식 X 계정 글
* 참조 2 - CEO 샘 올트먼 글
10명
추천인 목록보기
댓글 9
/ 1 페이지
아름다운별님의 댓글의 댓글
작성일
02.28 05:41
김파인님의 댓글
작성자
김파인

작성일
02.28 09:01
어차피 claude나 후발주자도 금방금방 따라잡는데 비싼 돈 주고 OPEN AI 쓸 이유를 모르겠네요. Dall=E를 먼저 개발하고도 오픈소스인Stability 에 맥없이 밀려난 과거를 볼 때 Open Ai가 chat모델에서 독보적인 지위를 차지하기는 힘들것 같습니다. 다른 모델들도 충분히 좋고 한쪽이 좀 우수해져도 이미지 모델들처럼 금방금방 다둘 따라잡는 느낌이에요
뚜릉아빠7님의 댓글
작성자
뚜릉아빠7

작성일
03.01 21:32
생초보인 제가 1주일간 사주팔자 사이트 만들기에 도전중인데
4만원짜리 지피티도 질러봤지만
제미나이코드 어시스턴트로 현재는
고비들을? 넘기고 있네요
괜찮은것 같아요
4만원짜리 지피티도 질러봤지만
제미나이코드 어시스턴트로 현재는
고비들을? 넘기고 있네요
괜찮은것 같아요
기적님의 댓글의 댓글
작성일
03.01 23:52
@Diablo님에게 답글
테스트 중인데 일단 코딩은 Sonnet 3.7 think 모드에 비해서 많이 모자른 결과를 보여주고 있네요.
API 비용 차이 생각하면 Sonnet의 압승으로 보입니다.
API 비용 차이 생각하면 Sonnet의 압승으로 보입니다.
엉클머리님의 댓글
GPT-4.5는 GPT-4o에 비해 전반적으로 개선된 대화 품질, 향상된 체인 오브 솟(Chain-of-Thought) 능력, 낮은 환각률 및 10배 이상의 계산 효율성을 보여줍니다. 이로 인해 일상적인 작업과 복잡한 문제 해결에서 더 자연스럽고 신뢰할 수 있는 성능을 제공합니다.
반면, 준비 평가(Preparedness Framework Evaluations)와 같이 모델 자율성, 특수 작업(예: SWE-bench, Agentic Tasks) 등 첨단 과제에서는 GPT-4.5의 성능이 o3-mini와 같은 최신 frontier 모델이나 deep research 모델에 비해 다소 낮은 편입니다. 즉, GPT-4.5는 범용적 사용에 최적화되어 있어 GPT-4o보다 여러 면에서 우수하지만, 일부 첨단 평가에서는 o3(예, o3-mini) 모델들이 더 높은 성과를 보이고 있습니다.
GPT-4.5의 주요 특징은 다음과 같습니다:
• 확장된 지식 기반과 자연스러운 대화: 전 세대 모델보다 더 많은 정보를 내재화하고 있으며, 보다 자연스럽고 직관적인 대화 경험을 제공합니다.
• 향상된 계산 효율성: GPT-4에 비해 10배 이상의 계산 효율성을 달성하여 빠른 응답과 처리 속도를 자랑합니다.
• 강화된 체인 오브 솟(Chain-of-Thought) 능력: 복잡한 문제 해결이나 논리적 추론 작업에서 더 우수한 성능을 보입니다.
• 개선된 감성 및 창의적 능력: 내부 평가에서 “따뜻하고 직관적”이라는 평을 받을 정도로 감성 지능이 향상되어, 창의적인 글쓰기와 디자인 작업에 도움을 줍니다.
• 안전성과 정렬(Alignment) 기술 강화: 사용자 의도에 보다 정밀하게 맞추어 대응하고, 불허 콘텐츠에 대한 반응 역시 안정적으로 관리합니다.
• 연구 엔지니어 인터뷰 평가: 코딩 문제에서 79%의 점수를 기록해 deep research 모델과 동등한 성능을 보여줍니다.
• SWE-bench Verified 평가: 전 세대인 GPT-4o에 비해 개선되었으나, 최첨단 코딩 모델(deep research, o3-mini 등)과 비교할 때는 약간 낮은 성과를 보입니다.