간과한 AI 시대의 그늘, 언어 격차
알림
|
페이지 정보
작성일
2024.07.29 09:37
분류
정보
579 조회
0 추천
본문
AI의 폭발적인 발전에 상응해 관련 폐해를 조사하는 것에도 그동안 상당한 노력을 기울였습니다. 하지만 한 가지 중요한 요소를 간과하고 있었습니다. 현재 주요 AI 모델이 영어에 국한돼 있다는 점입니다. 관련 글로벌 정책 논의에서 비영어권 언어를 무시하는 경우도 있었습니다.
스탠퍼드 연구진은 주요 생성 AI에 언어 테스트를 했습니다. 표준 미국 영어 이외의 언어를 잘못 인식하는 오류가 생겼습니다. AI 사용이 폭발적으로 증가했지만, 대부분 영어로 학습돼 있기 때문입니다. 나머지 언어 사용자가 소외되고 있습니다. 전문가들은 이러한 언어 격차로 인해 AI 기술 불평등이 생기고, 많은 지역과 문화가 뒤처질 수 있다고 우려합니다.
영어권을 제외한 대부분 언어가 학습에 필요한 디지털 데이터가 충분하지 않습니다. 저소득 국가이거나 사용자 수가 적기에 업계에서 지원할 동기도 없습니다. 일부 언어는 AI 모델이 학습하거나 대응하기 어려운 구조로 되어 있습니다. 예를 들어, 카자흐어와 같은 저자원 언어는 디지털 세계에 거의 존재하지 않습니다. 이는 AI 모델의 성능 저하로 이어집니다. (저 역시 생소한) 암하라어는 현재의 AI 도구로는 제대로 번역되지 않습니다
포스팅 전문 및 관련 정보 : https://naver.me/5fISPY9j
댓글 0