OpenAI, 음성 복제 AI 모델 발표...지금은 일부 파트너만 이용 가능

* OpenAI 공식 - Navigating the Challenges and Opportunities of Synthetic Voices
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

* VentureBeat 기사 - OpenAI unveils voice cloning AI model, but only for selected partners (for now)
https://venturebeat.com/ai/openai-unveils-voice-cloning-ai-model-but-only-for-selected-partners-for-now/

(기사 일부 GPT-4 번역)

단순히 텍스트 생성, 이미지, 비디오를 넘어서, ChatGPT 제작사인 OpenAI는 기존 디지털 미디어의 마지막 큰 분야인 오디오에도 발을 들여놓고 있습니다. 구체적으로는 음성 복제 기술에 관해서입니다.

회사는 오늘, 2022년부터 개발됐다고 밝힌 새로운 AI 모델인 Voice Engine을 발표했습니다. 이 모델은 현재 OpenAI의 텍스트-음성 변환 API와, 이번 달 초에 공개된 새로운 ChatGPT Voice와 Read Aloud 기능에 사용되고 있습니다.

이 모델은 음성 복제 기능도 가능합니다. 작동 원리는 이렇습니다: 사용자가 전화나 컴퓨터 마이크로 자신의 목소리로 15초 분량의 클립을 녹음합니다. 그런 다음 OpenAI의 Voice Engine이 원본 발화자의 목소리와 거의 똑같은 자연스러운 음성을 생성해내며, 이 음성은 사용자가 입력하는 모든 텍스트를 소리 내어 읽는 데 사용될 수 있습니다. [...]

하지만 지금은 이 기술에 제한이 있습니다. OpenAI의 강력하고 현실감 넘치며 생생한 비디오 생성 AI 모델 Sora처럼, OpenAI는 현재 Voice Engine을 일반 대중이 사용하도록 허용하지 않고 있습니다. 대신, OpenAI는 오늘 이 도구가 존재한다는 사실과 '소규모 미리 보기 과정에서 얻은 초기 분석 결과'를 '접근을 허락한 소수 신뢰할 수 있는 파트너들'과 간단히 공유하고 있습니다. [후략]

J

JohnP

24.03.30 · 162.♡.91.69

점점 이게 진짜 있는건지 만들어 진건지 구분하는 기술이 필요해지네요
컨

컨텍스트 → JohnP

24.03.30 · 172.♡.122.206

그러게요, 딥페이크 잡는 AI도 출현하는 것 같고 아마도 음성도 구분해주는 AI서비스가 탄생하지 않을까요~
외

외선이

24.03.30 · 172.♡.222.246

세상이 무서워지는군요.
E

ehangman

24.03.30 · 172.♡.63.186

잘 하면 동물하고 대화도 가능하겠네요
행

행인

24.03.30 · 172.♡.123.168

ai기술이 발전할수록 ai윤리도 중요해질듯 합니다.

댓글을 작성하려면 이 필요합니다.

추가 메뉴

댓글 (5)