AI당

🔥 제목 시위는 [말머리] 또는 임시게시판(불타는앙)을 이용바랍니다.

Gemini 1.5 Pro 2M context 프리뷰버전이 나왔네요.

알림
|
X

페이지 정보

작성자 가사라 112.♡.211.243
작성일 2024.06.15 11:11
분류 정보
544 조회
3 추천
쓰기

본문

예전에 미리 2M waitlist 등록을 해두었는데, 지금 보니  Google AI Studio 에서 2M context 모델의 프리뷰버전을 쓸 수 있게 되었네요.



예시 동영상을 추가해보면, 30분 정도 영상이 0.5M 를 차지하는데, 영상 tokenizer 에 대해서는 잘 모르지만 아마 해상도나 비트레이트에는 크게 구애받지 않고 모델에 맞게 적절히 token화 하지 않을까 싶고요.


기존 1M 보다 2배 늘어난 용량인데, 이렇게 용량을 늘리려는건 명확하게 동영상 분석에 그 목적이 있다고 생각됩니다.

물론, NotebookLM 처럼 많은 문서를 모아놓고 RAG 처럼 활용하는 예도 있겠지만, 저는 AI 서비스의 승부는 보다 자연스러운 오디오챗과 주변 영상인식에 있다고 생각하기 때문에 연말에 이런 서비스가 OpenAI 와 Google 에서 나오는 때가 중요한 시점이 될 거라고 보고 있네요.


요즘 한참 말이 많은 AI 섹터의 주가쏠림현상도 GPT 4o 오디오챗(+비디오) 과 Project Astra 가 실질적인 매출을 낼만한 가능성이 있느냐의 판단에 따라 AI 섹터가 더 갈 수도 있고, 아니면 AI 섹터가 무너지면서 연말 대선 이후 주가가 크게 조정받을 것이라는 예측대로 갈 수도 있다고 봅니다.


멀티모달이 되지 않으면 지금 주가를 설명할 수가 없다는걸 부정할 수 없거든요.


ChatGPT 도 큰 문서파일을 업로드할 수는 있는데 명확하게 얼마의 context 를 차지하는지 보여주질 않아서 직접적으로 비교할 수는 없겠고요.

Claude 의 경우에는 파일 하나의 크기를 너무 작게 제한하고 있어서 몇 개 올릴 수는 있지만 그 전체용량자체가 너무 작습니다.

이 용량문제를 해결하지 못한다면, Claude 는 ChatGPT 와 Google 과의 경쟁에서 밀릴거 같네요.


개인적으로는 멀티모달 앱을 구상중인데 4o 다음 버전과 Project Astra 가 잘 나왔으면 하고 기대중입니다.


댓글 2 / 1 페이지

plaintext님의 댓글

작성자 plaintext (119.♡.120.4)
작성일 06.16 00:03
유용한 말씀 감사합니다..^^
넘쳐나는 서비스들을 더 잘 활용할 방법이 없을지
쓰는 것만 쓰게될지 여러모로 생각하게 만들어주시는 글이네요

TAMPA님의 댓글

작성자 TAMPA (143.♡.84.198)
작성일 06.22 02:51
좋은글 감사합니다.
자주 올려주세요~
쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색