조선왕조실록 OCR에 문제가 있나 보군요. - 자유게시판 | 다모앙 종합 커뮤니티 damoang

추가 메뉴

AD

다모앙 마을 만들기 ♡ 다모앙 후원하기

♡ 후원하기 · 벽돌한장 · 광고 제거

조선왕조실록 OCR에 문제가 있나 보군요.

니파 (116.♡.6.99)

2025년 3월 24일 AM 12:11 · 수정됨(01:30)

조회 3,809 공감 0

https://youtu.be/r5NqQKa8hnY?t=235

역사 유튜버라 해야 될까요...

여튼 영상의 저 사람이 찾은 오타만 서너 영상은 더 있는데...

한자 인식 OCR에 문제가 있나 봅니다.

아마, 오래전에 해서 그렇지 않을까...

최근 AI로 다시 돌리고 이런건 힘든가... 그런 생각을 해봅니다.

댓글 (4)

L

luq.

25.03.24 · 218.♡.215.30

오류신고 게시판 가면 오탈자 관련 신고가 엄청 많더라고요.
워낙 양이 많으니까 다시 하느니 차라리 이렇게 하는 게 더 낫다고 생각할지도 모르겠네요.
다시 하려면 이제는 돈도 많이 들거 같기도 하고요.
M

molla

25.03.24 · 121.♡.239.167

과거 OCR의 정확도는 문제가 있긴 했죠. (당시에도 정확도가 9x% 정도로 수치만 보면 높아 보이는데 막상 써 보면, 한 페이지의 글자가 보통 100자가 넘으니 사실상 매 페이지별로 오타가 몇개씩 보이는 수준이란 것이었죠.)
그런데 이미 이미지로 만들어둔 것이 있다면, 새로운 OCR로 다시 돌려보는 건 어렵지 않을 것 같네요.
이미지로 만드는 것 까지가 어렵지, 이미 만들어둔 이미지가 있다면 OCR을 돌리는건 상대적으로 쉽죠.
(문제는 최신 기술로 만든 과거 한자용 OCR 이 있느냐 겠네요. 아무래도 수요가 작다 보니...)
아

아빵쓰

25.03.24 · 118.♡.14.143

향아치 님이군요. ㅋㅋ
컨셉이겠지만 ㅋㅋ 재밋는 분이더군요.
가끔 추천되서 흥미가 생기는 중이에요.
P

PCBR

25.03.24 · 99.♡.253.50

고문서 OCR은 지금은 쓰지 않아서 코드와 폰트가 없는 한자들이 많다는겁니다. 없는 글짜마다 폰트 만들고 코드 할당도 해야 하고... 만만치 않은 작업입니다.

댓글을 작성하려면 이 필요합니다.

자유게시판