구글이 영상에 맞는 효과음과 배경음악을 인공지능으로 만들어주는 기술을 발표

알림

날씨는어때 149.♡.254.10

2024.06.18 19:16

사회문화

1,816

구글 비디오-오디오 리서치는 비디오 픽셀과 텍스트 프롬프트를 사용하여 풍부한 사운드트랙을 생성합니다.

비디오 생성 모델은 놀라운 속도로 발전하고 있지만, 현재 많은 시스템은 무음 출력만 생성할 수 있습니다. 생성된 동영상에 생동감을 불어넣기 위한 다음 주요 단계 중 하나는 이러한 무성 동영상에 사운드트랙을 만드는 것입니다.

오늘은 동기화된 시청각 생성을 가능하게 하는 비디오-오디오(V2A) 기술에 대한 진행 상황을 공유하고자 합니다. V2A는 비디오 픽셀과 자연어 텍스트 프롬프트를 결합하여 화면 속 액션을 위한 풍부한 사운드스케이프를 생성합니다.

V2A 기술은 Veo와 같은 비디오 생성 모델과 페어링하여 극적인 스코어, 사실적인 음향 효과 또는 비디오의 캐릭터와 톤에 맞는 대사가 포함된 장면을 만들 수 있습니다.

또한 아카이브 자료, 무성 영화 등 다양한 기존 영상의 사운드트랙을 생성할 수 있어 더욱 폭넓은 창작 기회를 열어줍니다.

-DeepL

https://youtu.be/JuuAVCOJKXE

https://youtu.be/9VvOocidgVk

https://youtu.be/gAc_PusvZkQ

더 많은 예시들은 링크를 참조하세요.

링크

https://deepmind.google/discover/blog/generating-audio-for-video/

84 회 연결

댓글 3 / 1 페이지

D10S (183.♡.92.89)

06.18 19:21

딥마인드 알파고 녀석!

가사라 (136.♡.34.112)

06.18 21:36

Veo 가 크리에이터 대상으로 waitlist 등록중이긴 하던데, 맞춤형 오디오효과 같은 걸로 홍보자료를 내는걸 보니 올해 내로 일반사용자 대상 서비스를 오픈하긴 하나 봅니다.
요즘 워낙 쟁쟁한 생성형 동영상 서비스들이 많이 나오던데, luma labs 도 이미 쓸만한 유료 서비스를 내놨고요.

어차피 Sora 같은 하이엔드 서비스는 일반인들 상대는 아닐거고 중간사용자층을 노려야 하는데 Google 에게는 연말이 마지막 반전기회가 될 거 같네요.
개인적으로는 개인들이 풍성한 서비스들을 쓸 수 있게 되는 방향으로 갔으면 좋겠습니다.