OpenAI, 음성 복제 AI 모델 발표...지금은 일부 파트너만 이용 가능

알림
|
X

페이지 정보

작성자 아름다운별 117.♡.24.205
작성일 2024.03.30 08:32
분류 IT
1,302 조회
6 추천
쓰기

본문

* OpenAI 공식 - Navigating the Challenges and Opportunities of Synthetic Voices
https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

* VentureBeat 기사 - OpenAI unveils voice cloning AI model, but only for selected partners (for now)
https://venturebeat.com/ai/openai-unveils-voice-cloning-ai-model-but-only-for-selected-partners-for-now/

(기사 일부 GPT-4 번역)

단순히 텍스트 생성, 이미지, 비디오를 넘어서, ChatGPT 제작사인 OpenAI는 기존 디지털 미디어의 마지막 큰 분야인 오디오에도 발을 들여놓고 있습니다. 구체적으로는 음성 복제 기술에 관해서입니다.

회사는 오늘, 2022년부터 개발됐다고 밝힌 새로운 AI 모델인 Voice Engine을 발표했습니다. 이 모델은 현재 OpenAI의 텍스트-음성 변환 API와, 이번 달 초에 공개된 새로운 ChatGPT Voice와 Read Aloud 기능에 사용되고 있습니다.

이 모델은 음성 복제 기능도 가능합니다. 작동 원리는 이렇습니다: 사용자가 전화나 컴퓨터 마이크로 자신의 목소리로 15초 분량의 클립을 녹음합니다. 그런 다음 OpenAI의 Voice Engine이 원본 발화자의 목소리와 거의 똑같은 자연스러운 음성을 생성해내며, 이 음성은 사용자가 입력하는 모든 텍스트를 소리 내어 읽는 데 사용될 수 있습니다. [...]

하지만 지금은 이 기술에 제한이 있습니다. OpenAI의 강력하고 현실감 넘치며 생생한 비디오 생성 AI 모델 Sora처럼, OpenAI는 현재 Voice Engine을 일반 대중이 사용하도록 허용하지 않고 있습니다. 대신, OpenAI는 오늘 이 도구가 존재한다는 사실과 '소규모 미리 보기 과정에서 얻은 초기 분석 결과'를 '접근을 허락한 소수 신뢰할 수 있는 파트너들'과 간단히 공유하고 있습니다. [후략]

댓글 5 / 1 페이지

JohnP님의 댓글

작성자 JohnP (162.♡.91.69)
작성일 03.30 08:51
점점 이게 진짜 있는건지 만들어 진건지 구분하는 기술이 필요해지네요

hamoni님의 댓글의 댓글

대댓글 작성자 hamoni (172.♡.122.206)
작성일 03.30 10:51
@JohnP님에게 답글 그러게요, 딥페이크 잡는 AI도 출현하는 것 같고 아마도 음성도 구분해주는 AI서비스가 탄생하지 않을까요~

외선이님의 댓글

작성자 외선이 (172.♡.222.246)
작성일 03.30 09:12
세상이 무서워지는군요.

ehangman님의 댓글

작성자 ehangman (172.♡.63.186)
작성일 03.30 09:40
잘 하면 동물하고 대화도 가능하겠네요

행인님의 댓글

작성자 행인 (172.♡.123.168)
작성일 03.30 12:06
ai기술이 발전할수록 ai윤리도 중요해질듯 합니다.
쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색