X에서 제공하는 Grok 챗봇, 업그레이드 Grok-1.5 모델 적용 예정
페이지 정보
본문
* X.ai 공식 블로그 - Announcing Grok-1.5
* TechCrunch 기사 - X’s Grok chatbot will soon get an upgraded model, Grok-1.5
https://techcrunch.com/2024/03/28/xs-grok-chatbot-will-soon-get-an-upgraded-model-grok-1-5/
(기사 일부 Claude 3 Opus 번역)
일론 머스크의 AI 스타트업 X.ai가 최신 생성형 AI 모델인 Grok-1.5를 공개했습니다. 머지않은 미래("앞으로 며칠 안/in the coming days"라고 블로그 글에서 설명)에 소셜 네트워크 X의 Grok 챗봇에 적용될 예정인 Grok-1.5는, 적어도 공개된 벤치마크 결과와 사양으로 판단했을 때 전작인 Grok-1보다 상당한 업그레이드로 보입니다.
X.ai 설명으로는 Grok-1.5가 특히 코딩과 수학 관련 작업에서 "추론 능력이 향상"되었다고 합니다. 해당 모델은 널리 알려진 수학 벤치마크인 MATH에서 Grok-1 점수보다 두 배 이상 끌어 올렸으며, 프로그래밍 언어 생성 및 문제 해결 능력을 평가하는 HumanEval 테스트에서도 10퍼센트 포인트 이상 높은 점수를 기록했다고 합니다.
이런 결과가 실제 사용 시 어떻게 나타날지 예측하기란 쉽지 않습니다. 최근 저희가 작성한 글처럼 [주1], 대학원 수준 화학 시험 문제 성적 같은 난해한 지표를 측정하는 일반적인 AI 벤치마크는 요즘 보통 사람들이 모델과 상호 작용하는 방식을 제대로 반영하지 못하고 있습니다. [중략]
Grok-1.5는 "몇 가지 새로운 기능"과 함께 조만간 X의 초기 체험 평가자들에게 공개될 예정입니다. 머스크는 앞서 스레드와 댓글 요약, 게시물 콘텐츠 제안 등을 시사한 바 있습니다. 이런 기능들이 충분히 빨리 등장할지 지켜보는 것이 좋겠습니다.
앞서 최근 X.ai가 Grok-1을 오픈 소스로 공개했으나, 파인 튜닝(fine tuning)이나 추가 학습에 필요한 코드는 제외된 채로 발표되었습니다. 머스크는 최근 X의 프리미엄 플랜(월 $8) 가입자들도 이전에는 X 프리미엄+ 고객(월 $16)만 이용할 수 있었던 Grok 챗봇에 접근할 수 있게 될 것이라고 말했습니다.
-----
[주석]
주1) TechCrunch 기사 - Why most AI benchmarks tell us so little
(제목 의역 - AI 벤치마크의 한계: 충분한 정보를 주지 못하는 이유)
https://techcrunch.com/2024/03/07/heres-why-most-ai-benchmarks-tell-us-so-little/