책->스캔->txt 작업 해보신분 있을까요?

알림
|
X

페이지 정보

작성자 Rubix 211.♡.188.236
작성일 2024.07.24 10:18
511 조회
1 추천
글쓰기

본문

독서를 좋아하는데 요새 눈도 좀 침침하고 해서 운전이나 이동시에 이북을 tts로 많이 듣습니다.

집에있는 책들을 스캔해서 txt 변환을 해볼까 하는데요

vflat 앱을 사용해보니 스캔도 잘되고 ocr도 잘 되는데 페이지별로 텍스트를 보여주니 좀 아쉽습니다

책 한권치 텍스트를 한번에 복사해서 txt 파일로 만들면 tts로 듣기 딱 좋을거같은데 관련 작업을 해보신 분 있을까요?

  • 게시물이 없습니다.
댓글 16 / 1 페이지

돌마루님의 댓글

작성자 돌마루 (210.♡.188.248)
작성일 07.24 10:29
스캔 해놓은걸로 txt 만들어보니까... ocr 이 완벽하지 않아서 txt도 좀 깨지네요.

acrobat pro 로 ocr 돌리는데... 이것도 완벽하게 잘 되진 않더라구요.

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:23
@돌마루님에게 답글 경험담 공유 감사합니다
저는 모바일로 해볼 생각이라 괜찮으면 후기 남겨보겠습니다

블랙맘바님의 댓글

작성자 no_profile 블랙맘바 (203.♡.136.57)
작성일 07.24 10:36
전 사용해봤는데, 음성으로 듣는게 불편해서 그냥 봅니다.

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:24
@블랙맘바님에게 답글 저도 눈으로 보는게 훨씬 편하긴 한데
운전이나 걸어가면서 듣는게 쏠쏠하더라구요

JJunStyle님의 댓글

작성자 JJunStyle (118.♡.91.78)
작성일 07.24 10:43
아주 예전에 스캔해서 OCR 돌려서 txt로 만든적이 있었는데 그땐 ABBYY FineReader 사용했는데 그럭저럭 잘 됐었어요

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:25
@JJunStyle님에게 답글 위 프로그램(혹은 앱) 검색해 보겠습니다 감사합니다

누가늦으래요님의 댓글

작성자 누가늦으래요 (122.♡.0.202)
작성일 07.24 10:51
vflat 한글/영어 OCR 성능 최고죠. 다른 어떤 OCR 프로고램보다 확실히 뛰어냐다고 생각됩니다.

다만 우리나라 출판물은 어절 단위로 줄바꾸기를 하지 않고 줄 끝에 어절(단어+조사 등)이 걸리면 글자 단위로 쪼개기 때문에 OCR에 구조적이면서 치명적인 단점이 생깁니다. 따라서 종이책을 스캔한 후에 OCR을 한다면, 인식률 100%의 프로그램이 나온다 하더라도 매 줄마다 줄바꾸기가 된 곳이 단어가 잘린 곳인지(빈칸 하나 삭제) 두 어절인지(빈칸 유지) 확인해 줘야 하는데, 사람이 문맥을 읽어봐도 한 단어인지 두 단어인지 헷갈리는 경우마저 있습니다.

그래서 저는 종이책이 있다 하더라도 이잉크 기기에서 읽을 때는 그냥 속편하게 전자도서관에서 대출해서 읽는 게 편했어요.

그래도 OCR 후 만들어진 .txt 파일을 다듬어서 tts 기능으로 읽으려면, 정규식(?) 찾기/바꾸기 되는 텍스트 에디터에서 헤터/푸터 제거 후 .txt 파일을 [알라딘 ebook] 앱에서 바로 열면 tts로 들을 수 있어요.
가끔 페이지 시작을 찾지 못해서 1페이지부터 읽는 버그가 있는데, 그때는 페이지 중간에서 읽기 시작하려면 중간 단어 탭하면 나오는 팝업에서 [듣기] 선택하시면 선택된 곳부터 계속 읽기를 할 수 있어요.

참, 단 한 권 정도의 많은 분량의 스캔은 vflat보다는 엡슨 V39II 평판 스캐너가 당근에서 5~7만원쯤 하더군요. 이걸로 스캔하시는 것이 정신 건강에 좋을 겁니다^^

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:26
@누가늦으래요님에게 답글 주로 소설이나 인문서적 중심으로 볼거라 인식률 95%만 넘어도 충분할것 같습니다. 감사합니다 ^^

자유해결사님의 댓글

작성자 자유해결사 (1.♡.33.217)
작성일 07.24 12:25
제가 제작한 ttreader  사용해 보세요.
스캔본을 바로 tts 로 읽어줘요
https://play.google.com/store/apps/details?id=com.khjde.opentextview

자유해결사님의 댓글의 댓글

대댓글 작성자 자유해결사 (1.♡.33.217)
작성일 07.24 13:14
@자유해결사님에게 답글 아, 그리고 책을 스캔하고 버리실 거면 중고 양면 스캐너 + 다이소 재단기 구입 하셔서 작업 하시면 편하게 할 수 있어요.
저같은 경우 전세 집이라 사놓은책들 전부 스캔후 버렸어요.
스캐너는 위에서 급지 하는 걸로 사는게 좋아요. 밑에서 급지하는거는 오류가 잦아요.

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:27
@자유해결사님에게 답글 다모앙에서 ocr 검색하면서 이미 받았습니다!!
찬찬히 사용법 찾아볼게요 감사합니다

가을비님의 댓글

작성자 no_profile 가을비 (218.♡.145.116)
작성일 07.24 14:59
CZUR  ET18Pro 제품으로 북스캔해서 사용해 보았는데요, 생각보다 스캔시간과 편집등 시간이 오래 걸려서 10권정도 스캔하다가 방출했습니다..
밀리의 서재나 지역 도서관 app으로 tts들으시는걸 추천드립니다.

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:28
@가을비님에게 답글 경험담 공유 감사합니다
아무래도 지역도서관 이북이 젤 편하긴한데 아무래도 대여기간이 짧아서 다 못읽을때가 많더라구요 ㅜㅜ

Noell님의 댓글

작성자 no_profile Noell (220.♡.244.157)
작성일 07.24 23:55
tts라면 저도 전자도서관 이용하시는 걸 추천해봅니다.
사실 저는 종이책 > 스캔(파괴) > OCR(kofax) > 애플 Books & 데본씽크 이용중인데,
레퍼런스 하려고 텍스트 복사하면 가끔 엉뚱한 글자로 붙여넣어지는 경우들이 있더라구요.

눈으로 볼 땐 아.. 하고 넘어갈 수 있는데 tts면 좀 애매할 수도 있겠단 생각이 살짝 드네요.
33 랜덤 럭키포인트 당첨을 축하드립니다.

Rubix님의 댓글의 댓글

대댓글 작성자 Rubix (211.♡.188.236)
작성일 07.25 08:28
@Noell님에게 답글 경험담 공유 감사합니다

마칼바람님의 댓글

작성자 마칼바람 (175.♡.103.100)
작성일 07.26 18:40
예전에 책 많을땐 명함만드는 곳에 가서 한번에 재단해 갖고 와서 스캔스냅으로 스캔하곤 했어요.
글쓰기
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색