알림
|
한국어 AI가 안되는 이유: 한글 자료 부족(매불쇼-박태웅의장)
페이지 정보
작성일
2024.06.26 01:18
본문
https://www.youtube.com/watch?v=KwcLlLO71xo
바쁘신 분들은 9분부터 보시면 됩니다
결국은 쓰는사람이 적고
한글파일 호환성과
정부 정보공개 거부(판결문 사용건 0개)
댓글 6
/ 1 페이지
휘소님의 댓글의 댓글
@이자하님에게 답글
LLM은 포기하고 다른쪽 하는게 낫겠네요 ㅠㅠㅠ
우리는 같은 언어 쓰는 곳이 끽해야 북한말곤 없으니..
우리는 같은 언어 쓰는 곳이 끽해야 북한말곤 없으니..
브릿매력남님의 댓글의 댓글
@이자하님에게 답글
아.. 참 슬픈 현실이네요. 이런 돈과 시간이 많이 들어가는 작업은 나라에서 받춰줘야 할텐데
이미 정부에서는 손을 놓아버렸으니 훨씬 뒤쳐지겠네요;;
이미 정부에서는 손을 놓아버렸으니 훨씬 뒤쳐지겠네요;;
휘소님의 댓글의 댓글
@팡파파팡님에게 답글
와... 유튭 요약해서 플로우차트까지 만들어주는거에요?
ㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ
ㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷㄷ
이자하님의 댓글
초기 과정에서 데이터 만드는 작업이 상당히 오래걸리고 일일이 사람이 검증도 해야 합니다.
이러한 작업을 bootstrapping 이라 하는데
우리나라에서는 데이터에 절대 투자안합니다.
그리고 AI 전문가라는 교수들도 데이터에 별로 관심이 없습니다. 돈, 시간 많이 들어가기 때문에
관심이 절대 없습니다.
그리고 초기에 사람이 절대적으로 검증해야 하는 이유가 데이터 오염되면 학습이 제대로 안됩니다.
openai도 데이터 만들때 나이지리아에서 데이터 만들었다는 이야기가 있습니다.
영어를 알고 인건비가 싼 나라이기 때문에 나이지리아를 선택했다고 하죠
그만큼 돈과 시간이 많이 들어가는 작업인데
돈주는 사람들은 절대 기다리지 않습니다. 왜 결과 안나오냐
데이터 만드는데 그렇게 시간이 많이 들어가냐
개소리나 해대죠
우리나란 LLM 절대 못하고 못만듭니다.