OpenAI, 음성 복제 AI 모델 발표...지금은 일부 파트너만 이용 가능

알림

아름다운별 117.♡.24.205

2024.03.30 08:32

1,303

* OpenAI 공식 - Navigating the Challenges and Opportunities of Synthetic Voices
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

* VentureBeat 기사 - OpenAI unveils voice cloning AI model, but only for selected partners (for now)
https://venturebeat.com/ai/openai-unveils-voice-cloning-ai-model-but-only-for-selected-partners-for-now/

(기사 일부 GPT-4 번역)

단순히 텍스트 생성, 이미지, 비디오를 넘어서, ChatGPT 제작사인 OpenAI는 기존 디지털 미디어의 마지막 큰 분야인 오디오에도 발을 들여놓고 있습니다. 구체적으로는 음성 복제 기술에 관해서입니다.

회사는 오늘, 2022년부터 개발됐다고 밝힌 새로운 AI 모델인 Voice Engine을 발표했습니다. 이 모델은 현재 OpenAI의 텍스트-음성 변환 API와, 이번 달 초에 공개된 새로운 ChatGPT Voice와 Read Aloud 기능에 사용되고 있습니다.

이 모델은 음성 복제 기능도 가능합니다. 작동 원리는 이렇습니다: 사용자가 전화나 컴퓨터 마이크로 자신의 목소리로 15초 분량의 클립을 녹음합니다. 그런 다음 OpenAI의 Voice Engine이 원본 발화자의 목소리와 거의 똑같은 자연스러운 음성을 생성해내며, 이 음성은 사용자가 입력하는 모든 텍스트를 소리 내어 읽는 데 사용될 수 있습니다. [...]

하지만 지금은 이 기술에 제한이 있습니다. OpenAI의 강력하고 현실감 넘치며 생생한 비디오 생성 AI 모델 Sora처럼, OpenAI는 현재 Voice Engine을 일반 대중이 사용하도록 허용하지 않고 있습니다. 대신, OpenAI는 오늘 이 도구가 존재한다는 사실과 '소규모 미리 보기 과정에서 얻은 초기 분석 결과'를 '접근을 허락한 소수 신뢰할 수 있는 파트너들'과 간단히 공유하고 있습니다. [후략]