Google I/O 2024 Keynote 정리
페이지 정보
본문
휴일 오전에 Google I/O 2024 Keynote 를 봤는데, 처음부터 끝까지 그냥 AI 네요.
보면서 메모해둔 내용을 정리해서 남깁니다.
Gemini 1.5
- 텍스트, 이미지, 오디오, 비디오 파일을 담을 수 있는 context (입력창) 크기를 1M 에서 2M 로 증가 (연말)
= PDF 1500페이지 x2
= 코드 30000라인 x2
= 오디오 9.5시간 x2
= 이미지 3600장 x2
= 비디오 1시간 x2
- 응답속도가 보다 빠르고 저렴한 경량모델 Gemini 1.5 Flash 출시
- Gemini 1.5 Pro 와 Flash 를 API 로 사용시 무료옵션 선택가능 (단, context 내용은 AI training 에 사용됨)
- Context caching 을 이용하면 반복적인 context 전송이 필요없음 (다음 달 적용)
Veo
- 1080p 품질의 실사 동영상 생성
- waitlist 등록중
Project Astra
- 추론, 계획, 기억: Astra는 여러 단계를 앞서 생각하고, 다양한 소프트웨어와 시스템에서 작동하며, 사용자의 감독 하에 작업을 수행하는 지능형 시스템
- 카메라 프리뷰로 들어오는 실시간 영상을 통해 코드 분석, 아까 지나쳐왔던 곳에 특정 물건이 있었는지 등의 질문에 응답 가능
- 연말출시
Gemini Advanced - Gemini Live
- 자연스러운 음성모델 탑재
- Gemini 가 응답하는 도중에 언제든지 말을 끊을 수 있음
- 여름출시
Gemini Advanced - Gems
- 예시) 너는 작문 코치야. 구글 드라이브에 있는 소설 초안을 읽고 건설적인 조언을 해줘.
- 미리 설정해둔 gem 을 불러서 계속 대화를 이어갈 수 있음.
Gemini Advanced - 여행 큐레이션
- 여행계획 수립과 조정을 위해 Gemini 에서 여러 구글제품들(Gmail, Maps...) 의 데이터를 통합검색취합
- 취합된 취향과 성향에 따른 일정기간내 방문지 설정 및 일정 추천
- 여름출시
Android - Circle to Search
- 수학문제 등의 기호가 포함된 내용에 답변가능
- 연말출시
Android - Gemini
- pdf 파일을 열어서 보는 상황에서 Gemini 를 호출하면 바로 pdf 파일을 첨부(Ask this PDF 버튼) 시켜서 질문을 할 수 있음.
Android - Gemini Nano with Multimodality
- On-device AI 기능으로 통화중에 보이스피싱이 의심되는 통화내용이 감지되면 사용자에게 경고를 해줌.
- 여름출시
PaliGemma
- Gemma 파생모델로 최초의 비전 언어 개방형 모델
- 이미지 라벨링 등에 적합
Gemma 2
- 270억 개의 매개변수를 가진 새로운 모델 추가
- 차세대 NVIDIA GPU 에 최적화
- 몇 주 내로 출시 예정
SynthID
- 기존에 이미지에 watermark 기능을 넣었었는데, 이제 텍스트와 비디오에도 적용
이 밖에도 Photos 에서 내 아이가 처음 수영을 한게 언제지? 같은 질문에 관련 사진들을 보여주면서 대답해주거나, Gmail 에서 내용요약 혹은 특정 내용들을 취합해서 보여달라고 하거나, Meet 녹화에서 주요 내용을 추출하거나, 전반적으로 AI 에 통합된 검색기능 및 새로운 TPU, ARM CPU, NVIDIA Blackwell 사용가능 등 Google 의 전반적인 서비스에 AI 가 녹아 들어가 있다는 내용을 강조했습니다.
개인적으로 Gemini Live 에서 언제든지 말을 끊을 수 있다고 하는 멘트가 좀 웃겼네요. ㅋ
어제 OpenAI 영상을 볼 때는 이건 애플이 가져다가 Siri 의 모습으로 만들겠구나 하는 생각이 들었는데요.
오늘 Google 영상은 Google 은 그냥 플랫폼 회사구나 하는 생각이 들었습니다.
아직은 초기이고 어느 쪽이 확실한 승기를 잡았다고 할만한 시기도 아니라고 보고요.
개인적으로는 개발자라면 양쪽 어느 하나를 선택해야 하는 때가 아니라 두루두루 써보면서 어떻게 하면 내가 AI 에게 먹히지 않고 살아남을 수 있는지를 살펴야 하는 때라고 보입니다.
Gemini 1.5 의 API 는 무료로 쓸 수 있는 길이 열렸으니 더 많은 개발자들이 뛰어들 거 같은데, 얼마나 저변이 확대될까 지켜봐야겠습니다.
진실된라면님의 댓글
내용적으로는 상당한 발전이 있었음에도 불구하고
발표형식이 기존의 구글과 다를바 없어서 임팩트가 적다는 느낌이드네요.
하나씩 살펴봐야겠습니다.