군중 속에서 한 사람의 목소리만 추적하여 듣는 기술이 개발돼

알림
|
X

페이지 정보

작성자 Phil2030 211.♡.217.192
작성일 2024.05.26 09:36
분류 IT
3,038 조회
12 추천
쓰기 분류

본문

워싱턴대학교 연구팀이 헤드폰 착용자가 3-5초 동안 화자를 응시하면 그 화자의 목소리만 실시간으로 들을 수 있게 해주는 인공지능 시스템을 개발했습니다. '타겟 스피치 청취(Target Speech Hearing)' 시스템은 주변의 다른 모든 소리는 제거하고 등록된 화자의 목소리만 재생합니다.



이 시스템을 사용하려면 마이크가 장착된 헤드폰을 착용하고 버튼을 누른 후 화자를 바라봅니다. 머신러닝 소프트웨어가 화자의 음성 패턴을 학습하여 그 목소리에 초점을 맞춥니다. 21명의 피실험자는 이 시스템의 청취 선명도를 훨씬 높게 평가했습니다.



현재 이 시스템은 한 번에 한 명의 화자만 등록할 수 있지만, 향후 이어버드와 보청기에도 적용될 예정입니다. 이 연구는 사용자가 원하는 소리만 선택적으로 듣고 다른 소리는 제거하는 '의미론적 청취' 기술에 기반합니다.



연구팀은 5월 14일 하와이에서 열린 ACM CHI 컨퍼런스에서 이 결과를 발표했으며, 프로토타입 코드를 공개하여 다른 연구자들의 기여를 기대하고 있습니다.


<<Claude에서 요약하고 번역했습니다>>


댓글 8 / 1 페이지

UrsaMinor님의 댓글

작성자 UrsaMinor (115.♡.248.122)
작성일 05.26 09:37
날리면.. 에 적용해보고 싶군요.

달짝지근님의 댓글

작성자 달짝지근 (125.♡.218.23)
작성일 05.26 09:55
잘 쓰면 정말 좋은 기술인데 좀 무섭습니다

통통한새우님의 댓글

작성자 통통한새우 (211.♡.35.102)
작성일 05.26 10:10
이런 기술로 수집한 음성 정보는 무조건 불법인거죠.
그래서 CCTV는 녹음이 금지인거구요.
물론 이렇게 수집한 정보를 법정에 들이밀진 않겠지만
독재자들이 써먹기에는 아주 좋은 기술이겠네요.

Woogler님의 댓글

작성자 Woogler (121.♡.4.75)
작성일 05.26 10:17
저 SIGCHI 참여했는데 이 발표를 놓쳤군요 ㅠㅠ 어떻게 사용될지는 모르겠지만, 이런 연구는 주로 Accessibility 관련 연구로 취급됩니다. 청각 장애를 가진 분들이 사용하는 보청기에 적용된다면 사람이 많은 곳에서도 청자의 목소리를 더 또렷하게 들을 수 있겠죠?

가을무렵님의 댓글

작성자 no_profile 가을무렵 (121.♡.10.106)
작성일 05.26 10:46
소식 알려주셔서 감사합니다.
그리고 현재 다모앙의 룰에는 없지만, 이전 클리앙에서는 뉴스 본문은 오직 뉴스 내용만 기재하고, 작성자의 의견이 있을 경우 댓글로 따로 적도록하는 암묵적인 양해가 있었습니다.    이는 뉴스를 보는 사람이 게시자의 생각에 의해 편파적인 시각으로 해석될 우려를 배제하기 위함이니 참고 부탁드립니다.  :)

Phil2030님의 댓글의 댓글

대댓글 작성자 Phil2030 (211.♡.217.192)
작성일 05.26 11:47
@가을무렵님에게 답글 알겠습니다 감사합니다.

ehangman님의 댓글

작성자 ehangman (211.♡.188.174)
작성일 05.27 07:54
아이돌 직캠용이군요!

Realtime님의 댓글

작성자 Realtime (75.♡.158.112)
작성일 05.27 08:46
AI를 응용하긴하지만 beamforming 이라는 DSP 기반으로 봐야하는게 아닐까요? 아마 소스 분류 및 추적까지 알아서 해주는 거겠죠?
쓰기 분류
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색