취미생활자 (222.♡.32.74)
2026년 2월 6일 AM 08:15 · 수정됨(02. 09. 07:51)

가장 똑똑한 모델을 업그레이드합니다.
새로운 Claude Opus 4.6은 이전 모델의 코딩 능력을 한층 개선했습니다. 더 신중하게 계획을 세우고, 에이전틱 작업을 더 오래 지속하며, 대규모 코드베이스에서 더 안정적으로 작동하고, 자체 실수를 잡아내는 코드 리뷰 및 디버깅 능력이 향상되었습니다. 또한 Opus급 모델 최초로, Opus 4.6은 100만 토큰 컨텍스트 윈도우를 베타로 제공합니다.
Opus 4.6은 향상된 능력을 다양한 일상 업무에도 적용할 수 있습니다: 재무 분석 수행, 리서치, 문서·스프레드시트·프레젠테이션의 활용 및 생성 등. Claude가 자율적으로 멀티태스킹할 수 있는 Cowork에서 Opus 4.6은 이 모든 역량을 사용자를 대신해 발휘할 수 있습니다.
이 모델의 성능은 여러 평가에서 최첨단 수준입니다. 예를 들어, 에이전틱 코딩 평가인 Terminal-Bench 2.0에서 최고 점수를 달성했고, 복잡한 다학제적 추론 테스트인 Humanity's Last Exam에서 모든 프론티어 모델을 선도합니다. 금융, 법률 등 경제적으로 가치 있는 지식 노동 작업의 성능을 측정하는 GDPval-AA에서는 업계 차순위 모델(OpenAI의 GPT-5.2)을 약 144 Elo 포인트 차이로, 자체 이전 모델(Claude Opus 4.5)을 190 포인트 차이로 앞섰습니다. Opus 4.6은 또한 모델의 온라인 희귀 정보 검색 능력을 측정하는 BrowseComp에서도 다른 어떤 모델보다 뛰어난 성능을 보입니다.
<< 생략 >>
Claude Opus 4.6으로 번역하였습니다.
댓글 (6)
- 8
88610824
02.06 · 211.♡.126.102
4.6 되어서야 100만 컨텍스트 된건가요? 흠.. - B
blisson
02.06 · 180.♡.182.86
거의 유일한 약점인 컨텍스트 윈도우 크기까지.. 좀 비싸도 클로드 애정합니다. - 런
런타임
02.06 · 71.♡.219.13
OpenAI에서는 GPT-5.3-Codex가 나왔는데 Terminal-Bench 2.0가 77.3%이네요. - J
January4th
→ 런타임
02.06 · 223.♡.45.213
벤치가 딱히 의미 없는 건 작년 부터 나오는 이야기라서… 써보니 단점도 어느정도 상쇄한 클로드가 낫네요 😁
얘는 아직 메이저 버전업도 안 나왔는데…. -
규규링
02.06 · 114.♡.121.91
지금까지 작업한 내용 업그레이드 된 4.6으로 좀 더 잘 만들어주면 좋겠네요. ㅎㅎ -
AACIDBURN
02.09 · 223.♡.99.206
아.. 오푸스는 관심없고 소넷 새 버전 나오기를 기다렸는데 말입니다..;;;
댓글을 작성하려면 이 필요합니다.