알림
|

구글이 영상에 맞는 효과음과 배경음악을 인공지능으로 만들어주는 기술을 발표

페이지 정보

작성자 no_profile 날씨는어때 149.♡.254.10
작성일 2024.06.18 19:16
분류 사회문화
1,705 조회
3 댓글
5 추천
글쓰기

본문

구글 비디오-오디오 리서치는 비디오 픽셀과 텍스트 프롬프트를 사용하여 풍부한 사운드트랙을 생성합니다.

비디오 생성 모델은 놀라운 속도로 발전하고 있지만, 현재 많은 시스템은 무음 출력만 생성할 수 있습니다. 생성된 동영상에 생동감을 불어넣기 위한 다음 주요 단계 중 하나는 이러한 무성 동영상에 사운드트랙을 만드는 것입니다.

오늘은 동기화된 시청각 생성을 가능하게 하는 비디오-오디오(V2A) 기술에 대한 진행 상황을 공유하고자 합니다. V2A는 비디오 픽셀과 자연어 텍스트 프롬프트를 결합하여 화면 속 액션을 위한 풍부한 사운드스케이프를 생성합니다.

V2A 기술은 Veo와 같은 비디오 생성 모델과 페어링하여 극적인 스코어, 사실적인 음향 효과 또는 비디오의 캐릭터와 톤에 맞는 대사가 포함된 장면을 만들 수 있습니다.

또한 아카이브 자료, 무성 영화 등 다양한 기존 영상의 사운드트랙을 생성할 수 있어 더욱 폭넓은 창작 기회를 열어줍니다.


-DeepL


https://youtu.be/JuuAVCOJKXE


https://youtu.be/9VvOocidgVk


https://youtu.be/gAc_PusvZkQ


더 많은 예시들은 링크를 참조하세요.

댓글 3 / 1 페이지

D10S님의 댓글

작성자 D10S (183.♡.92.89)
작성일 06.18 19:21
딥마인드 알파고 녀석!

가사라님의 댓글

작성자 가사라 (136.♡.34.112)
작성일 06.18 21:36
Veo 가 크리에이터 대상으로 waitlist 등록중이긴 하던데, 맞춤형 오디오효과 같은 걸로 홍보자료를 내는걸 보니 올해 내로 일반사용자 대상 서비스를 오픈하긴 하나 봅니다.
요즘 워낙 쟁쟁한 생성형 동영상 서비스들이 많이 나오던데, luma labs 도 이미 쓸만한 유료 서비스를 내놨고요.

어차피 Sora 같은 하이엔드 서비스는 일반인들 상대는 아닐거고 중간사용자층을 노려야 하는데 Google 에게는 연말이 마지막 반전기회가 될 거 같네요.
개인적으로는 개인들이 풍성한 서비스들을 쓸 수 있게 되는 방향으로 갔으면 좋겠습니다.

잠이좋아님의 댓글

작성자 잠이좋아 (182.♡.71.215)
작성일 06.19 06:50
어느정도 수준일지 대기자 명단 걸고 기다려 봐야겠네요
글쓰기
전체 검색