Chat GPT x DEEPL 조합

알림
|
X

페이지 정보

작성자 no_profile 0sRacco 164.♡.222.147
작성일 2024.07.29 09:37
분류 서비스·SW
2,931 조회
16 댓글
10 추천
글쓰기

본문

Chat GPT와 DEEPL을 유료로 쓰고 있습니다.

여러 외국어 텍스트를 봐야 해서 번역 작업을 시키는 데에 쓰고 있습니다.


DEEPL은 PDF 던져줘서 번역을 시키면 하기는 하는데, 결과물 편집도 어렵고 알잘딱깔센하고는 거리가 있지요. 문장을 끊는 위치도 명확하지 않아 이상한 번역이 나오는 경우, 텍스트 내용과 거리가 있는 용어 등등, 기대보다는 품질이 떨어지는 편입니다.

한편 GPT는 PDF 내용을 요약해주기는 해도 번역은 안 해주지요.  


그런데 DEEPL은 이미지에서 (pdf 파일 말고) OCR로 텍스트를 뽑아낼 수가 있습니다.

(GPT 앱 중에도 OCR 앱이 있는데, 성능이 떨어집니다)

그래서 PDF를 이미지 파일로 변환해서 DEEPL한테 읽힙니다.

텍스트가 추출되면 복붙으로 GPT한테 번역시킵니다. GPT 번역 잘 합니다. LLM이라 그런지 OCR에 실수가 있더라도 센스 있게 고쳐 읽어 줍니다. 추가로 텍스트 성향에 맞춰서 프롬프트를 짜주면 만족도가 높아집니다.

그리고 번역문에 대해서 GPT한테 '여기 이거 무슨 말이야?'라고 물어보면 설명도 잘 해줍니다(이거야 말로 DEEPL은 할 수 없는 서비스입니다. )


좀 노가다가 들어가지만 결과물에 만족도가 높아서 한동안 이 방법을 쓸 것 같습니다.


혹시 다른 방법으로 좋은 결과물 얻고 계신 분 있을런지요?


  • 게시물이 없습니다.
댓글 16 / 1 페이지

일리악님의 댓글

작성자 no_profile 일리악 (203.♡.180.14)
작성일 07.29 12:40
오...이런방법이 있군요....모델이 진화하면 이런 과정은 생략되겠지요?

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (180.♡.119.194)
작성일 07.29 13:05
@일리악님에게 답글 문서번역 세계관을 통합할 수 있는 엔진이 나와주면 세상 편할 것 같아요 ㅎㅎㅎ

paranso님의 댓글

작성자 no_profile paranso (223.♡.248.175)
작성일 07.29 13:17
저는 아크로뱃에서 OCR 한 후에 pdf 파일을 ChatGPT에 올려서 합니다
거의 같은 과정이네요. 다만 DeepL의 OCR을 사용하느냐, pdf 자체 OCR을 사용하느냐.
오타는 말씀 하신대로 ChatGPT가 어느정도 잡아서 번역해 주기에 차이가 의미가 없나 싶기도 하네요.

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 07.29 13:53
@paranso님에게 답글 네네. 스캔하면서 아크로뱃 OCR 과정을 거치는 방법도 있기는 하지요.
그런데 OCR 하지 않은 채로 수동으로 스캔한 파일은 아크로뱃에서 어떻게 할 수가 없어서리, DEEPL을 거칩니다.
IRIS사의 OCR 프로그램도 굴려봤는데, DEEPL보다 손이 더 가서 불편하더라구요.

paranso님의 댓글의 댓글

대댓글 작성자 no_profile paranso (118.♡.22.165)
작성일 07.29 15:34
@0sRacco님에게 답글 아 저도 수동으로 스캔을 한 후,  아크로뱃 프로?로 피씨에서 필요할때만 OCR을 돌립니다. 스캔할때 OCR을 하지 않은 것들이 많아서요.

뚱굴넓적님의 댓글

작성자 뚱굴넓적 (49.♡.212.131)
작성일 07.29 17:11
번역은 claude가 gpt보다 훨 낫습니다. 설명도 더 자세하고 정확히 해주구요.

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 07.30 18:36
@뚱굴넓적님에게 답글 엇. 그런가요? 함 시험해 봐야겠네요. 감사합니다.

humanitas님의 댓글

작성자 humanitas (78.♡.45.236)
작성일 07.29 17:31
그렇다면, 번역이 아니라 OCR로 뽑아낸 텍스트의 오자 수정에도 chatGPT 사용하면 괜찮겠네요.
영문으로 작성된 PDF든 한글로 장석된 PDF든 OCR 돌려 텍스트로 변환하면, 인식이 잘못된 글자들이 존재하는데, chatGPT가 번역시 이런 오자들까지 알아보면서 번역을 한다면, OCR로 변환된 텍스트의 수정 작업을 맡겨도 훌륭하지 않을까 하는 생각이 듭니다.

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 07.30 18:37
@humanitas님에게 답글 그게 좀 불안한 게 번역을 해 달라고 하는 건 읽으면서 번역을 확인하면 되는데, 오타 수정을 부탁하면 얘가 실제로는 오해해서 수정을 했을 때, 어디를 어떻게 바꿨는 지를 확인할 방도가 없는 게 아닐까? 라는 불안감이 생깁니다.

humanitas님의 댓글의 댓글

대댓글 작성자 humanitas (78.♡.45.236)
작성일 07.30 19:27
@0sRacco님에게 답글 아, 그렇군요. 말씀하신 부분 때문에 불안감이 생길 것 같습니다. 댓글 감사합니다.

사이버크림슨님의 댓글

작성자 no_profile 사이버크림슨 (223.♡.176.87)
작성일 07.30 15:15
비슷한 문제로 고민한 적이 있었는데, 팁을 주셔서 감사합니다.
900페이지 pdf 파일이 있는데, 한번 시도해볼까 합니다.
몇가지 궁금해서 그러는데, 혹시 답변 가능하실까요?

PDF 파일을 이미지 파일로 바꾸는 프로그램은 뭐 사용하셨나요?
이미지 파일 확장자는 어떤 것으로 하셨는지 궁금합니다.

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 07.30 18:44
@사이버크림슨님에게 답글 일단 이미지 확장자는 png를 쓰는데, 스캔 상태가 좋다면 jpg도 괜찮아 보입니다.
pdf 앱 중에서 ezpdf나 알pdf 둘 다 이미지 변환을 하면 jpg로 밖에 안 되는 듯 합니다(선택의 여지가 없어 보이더군요)
어도비는 png로도 변환이 가능합니다.

추가로 말씀드리면 900페이지면 이미지 파일이 900개가 되는데, 이걸 DEEPL에 하나하나 드랙으로 넣고 하는 건 정말 노가다가 될 것 같습니다. 그래서 이미지 파일을 세로로 통합하는 방법을 쓰면 여러 장을 하나의 파일로 해서 DEEPL에게 던져주면 됩니다. 다만 온라인에서 이미지를 통합할 수 있는데, 이게 몇 장까지 가능한지, 그리고 DEEPL이 읽어 낼 수 있는 이미지 용량이 어느 정도까지인지 아직 확인은 못 해 봤습니다.

(해 보시고 어디까지 잘 되나 알려주시면 좋겠어요 ㅎㅎㅎㅎㅎ)

세이드님의 댓글

작성자 세이드 (86.♡.21.59)
작성일 07.31 02:42
저도 그렇게 했는데 양이 많다보니, abbyy ocr 냐용 뽑아서 써서 deepl로 번역하거나 chat gpt로 작업 시키네요 ㅎㅎ

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 08.04 19:04
@세이드님에게 답글 오 첨보는 앱입니다. 써 보고 좋으면 사겠습니다 ㅎㅎ. 엌...근데 구독제군요. 고민 좀 해봐야겠네요 ㅎ

와싸다님의 댓글

작성자 no_profile 와싸다 (110.♡.98.240)
작성일 08.01 08:48
ocr기능은 구글 제미나이 써보세요

0sRacco님의 댓글의 댓글

대댓글 작성자 no_profile 0sRacco (164.♡.222.147)
작성일 08.04 19:03
@와싸다님에게 답글 넵 한 번 써 봤는데, 유저한테 요구하는 게 많네요...제가 아직 제미나이를 잘 못 쓰는 것 같습니다.
글쓰기
전체 검색