책->스캔->txt 작업 해보신분 있을까요?
알림
|
페이지 정보
작성일
2024.07.24 10:18
본문
독서를 좋아하는데 요새 눈도 좀 침침하고 해서 운전이나 이동시에 이북을 tts로 많이 듣습니다.
집에있는 책들을 스캔해서 txt 변환을 해볼까 하는데요
vflat 앱을 사용해보니 스캔도 잘되고 ocr도 잘 되는데 페이지별로 텍스트를 보여주니 좀 아쉽습니다
책 한권치 텍스트를 한번에 복사해서 txt 파일로 만들면 tts로 듣기 딱 좋을거같은데 관련 작업을 해보신 분 있을까요?
댓글 16
/ 1 페이지
Rubix님의 댓글의 댓글
@돌마루님에게 답글
경험담 공유 감사합니다
저는 모바일로 해볼 생각이라 괜찮으면 후기 남겨보겠습니다
저는 모바일로 해볼 생각이라 괜찮으면 후기 남겨보겠습니다
Rubix님의 댓글의 댓글
@블랙맘바님에게 답글
저도 눈으로 보는게 훨씬 편하긴 한데
운전이나 걸어가면서 듣는게 쏠쏠하더라구요
운전이나 걸어가면서 듣는게 쏠쏠하더라구요
JJunStyle님의 댓글
아주 예전에 스캔해서 OCR 돌려서 txt로 만든적이 있었는데 그땐 ABBYY FineReader 사용했는데 그럭저럭 잘 됐었어요
Rubix님의 댓글의 댓글
@JJunStyle님에게 답글
위 프로그램(혹은 앱) 검색해 보겠습니다 감사합니다
누가늦으래요님의 댓글
vflat 한글/영어 OCR 성능 최고죠. 다른 어떤 OCR 프로고램보다 확실히 뛰어냐다고 생각됩니다.
다만 우리나라 출판물은 어절 단위로 줄바꾸기를 하지 않고 줄 끝에 어절(단어+조사 등)이 걸리면 글자 단위로 쪼개기 때문에 OCR에 구조적이면서 치명적인 단점이 생깁니다. 따라서 종이책을 스캔한 후에 OCR을 한다면, 인식률 100%의 프로그램이 나온다 하더라도 매 줄마다 줄바꾸기가 된 곳이 단어가 잘린 곳인지(빈칸 하나 삭제) 두 어절인지(빈칸 유지) 확인해 줘야 하는데, 사람이 문맥을 읽어봐도 한 단어인지 두 단어인지 헷갈리는 경우마저 있습니다.
그래서 저는 종이책이 있다 하더라도 이잉크 기기에서 읽을 때는 그냥 속편하게 전자도서관에서 대출해서 읽는 게 편했어요.
그래도 OCR 후 만들어진 .txt 파일을 다듬어서 tts 기능으로 읽으려면, 정규식(?) 찾기/바꾸기 되는 텍스트 에디터에서 헤터/푸터 제거 후 .txt 파일을 [알라딘 ebook] 앱에서 바로 열면 tts로 들을 수 있어요.
가끔 페이지 시작을 찾지 못해서 1페이지부터 읽는 버그가 있는데, 그때는 페이지 중간에서 읽기 시작하려면 중간 단어 탭하면 나오는 팝업에서 [듣기] 선택하시면 선택된 곳부터 계속 읽기를 할 수 있어요.
참, 단 한 권 정도의 많은 분량의 스캔은 vflat보다는 엡슨 V39II 평판 스캐너가 당근에서 5~7만원쯤 하더군요. 이걸로 스캔하시는 것이 정신 건강에 좋을 겁니다^^
다만 우리나라 출판물은 어절 단위로 줄바꾸기를 하지 않고 줄 끝에 어절(단어+조사 등)이 걸리면 글자 단위로 쪼개기 때문에 OCR에 구조적이면서 치명적인 단점이 생깁니다. 따라서 종이책을 스캔한 후에 OCR을 한다면, 인식률 100%의 프로그램이 나온다 하더라도 매 줄마다 줄바꾸기가 된 곳이 단어가 잘린 곳인지(빈칸 하나 삭제) 두 어절인지(빈칸 유지) 확인해 줘야 하는데, 사람이 문맥을 읽어봐도 한 단어인지 두 단어인지 헷갈리는 경우마저 있습니다.
그래서 저는 종이책이 있다 하더라도 이잉크 기기에서 읽을 때는 그냥 속편하게 전자도서관에서 대출해서 읽는 게 편했어요.
그래도 OCR 후 만들어진 .txt 파일을 다듬어서 tts 기능으로 읽으려면, 정규식(?) 찾기/바꾸기 되는 텍스트 에디터에서 헤터/푸터 제거 후 .txt 파일을 [알라딘 ebook] 앱에서 바로 열면 tts로 들을 수 있어요.
가끔 페이지 시작을 찾지 못해서 1페이지부터 읽는 버그가 있는데, 그때는 페이지 중간에서 읽기 시작하려면 중간 단어 탭하면 나오는 팝업에서 [듣기] 선택하시면 선택된 곳부터 계속 읽기를 할 수 있어요.
참, 단 한 권 정도의 많은 분량의 스캔은 vflat보다는 엡슨 V39II 평판 스캐너가 당근에서 5~7만원쯤 하더군요. 이걸로 스캔하시는 것이 정신 건강에 좋을 겁니다^^
Rubix님의 댓글의 댓글
@누가늦으래요님에게 답글
주로 소설이나 인문서적 중심으로 볼거라 인식률 95%만 넘어도 충분할것 같습니다. 감사합니다 ^^
자유해결사님의 댓글
제가 제작한 ttreader 사용해 보세요.
스캔본을 바로 tts 로 읽어줘요
https://play.google.com/store/apps/details?id=com.khjde.opentextview
스캔본을 바로 tts 로 읽어줘요
https://play.google.com/store/apps/details?id=com.khjde.opentextview
자유해결사님의 댓글의 댓글
@자유해결사님에게 답글
아, 그리고 책을 스캔하고 버리실 거면 중고 양면 스캐너 + 다이소 재단기 구입 하셔서 작업 하시면 편하게 할 수 있어요.
저같은 경우 전세 집이라 사놓은책들 전부 스캔후 버렸어요.
스캐너는 위에서 급지 하는 걸로 사는게 좋아요. 밑에서 급지하는거는 오류가 잦아요.
저같은 경우 전세 집이라 사놓은책들 전부 스캔후 버렸어요.
스캐너는 위에서 급지 하는 걸로 사는게 좋아요. 밑에서 급지하는거는 오류가 잦아요.
Rubix님의 댓글의 댓글
@자유해결사님에게 답글
다모앙에서 ocr 검색하면서 이미 받았습니다!!
찬찬히 사용법 찾아볼게요 감사합니다
찬찬히 사용법 찾아볼게요 감사합니다
가을비님의 댓글
CZUR ET18Pro 제품으로 북스캔해서 사용해 보았는데요, 생각보다 스캔시간과 편집등 시간이 오래 걸려서 10권정도 스캔하다가 방출했습니다..
밀리의 서재나 지역 도서관 app으로 tts들으시는걸 추천드립니다.
밀리의 서재나 지역 도서관 app으로 tts들으시는걸 추천드립니다.
Rubix님의 댓글의 댓글
@가을비님에게 답글
경험담 공유 감사합니다
아무래도 지역도서관 이북이 젤 편하긴한데 아무래도 대여기간이 짧아서 다 못읽을때가 많더라구요 ㅜㅜ
아무래도 지역도서관 이북이 젤 편하긴한데 아무래도 대여기간이 짧아서 다 못읽을때가 많더라구요 ㅜㅜ
Noell님의 댓글
tts라면 저도 전자도서관 이용하시는 걸 추천해봅니다.
사실 저는 종이책 > 스캔(파괴) > OCR(kofax) > 애플 Books & 데본씽크 이용중인데,
레퍼런스 하려고 텍스트 복사하면 가끔 엉뚱한 글자로 붙여넣어지는 경우들이 있더라구요.
눈으로 볼 땐 아.. 하고 넘어갈 수 있는데 tts면 좀 애매할 수도 있겠단 생각이 살짝 드네요.
사실 저는 종이책 > 스캔(파괴) > OCR(kofax) > 애플 Books & 데본씽크 이용중인데,
레퍼런스 하려고 텍스트 복사하면 가끔 엉뚱한 글자로 붙여넣어지는 경우들이 있더라구요.
눈으로 볼 땐 아.. 하고 넘어갈 수 있는데 tts면 좀 애매할 수도 있겠단 생각이 살짝 드네요.
33 랜덤 럭키포인트 당첨을 축하드립니다.
마칼바람님의 댓글
예전에 책 많을땐 명함만드는 곳에 가서 한번에 재단해 갖고 와서 스캔스냅으로 스캔하곤 했어요.
돌마루님의 댓글
acrobat pro 로 ocr 돌리는데... 이것도 완벽하게 잘 되진 않더라구요.