종이책 스캔 – Acrobat으로 OCR 입히기

  • Post author:
  • Post category:칼럼
  • Post comments:0 Comments
  • Post last modified:February 8, 2020

책 스캔하기에서 문자 광학 인식(OCR)을 직접 처리해 종이책 스캔 비용을 절약하면 된다고 했습니다. 이번에는 Acrobat의 OCR 메뉴가 어디 있는지 어떤 옵션이 있는지 간단히 알아봅니다.

우선 메뉴부터 찾아봅시다.

Recognize

지금 열린 문서를 처리할지 다른 여러 문서를 한꺼번에 처리할지 선택합니다. 보통 종이책을 여러 권 보내서 스캔하므로 후자를 선택해봅니다.

한꺼번에

이렇게 책을 여러 권 선택하고 OK 버튼을 누르면 OCR 옵션이 나옵니다.

옵션

한국어 책이므로 언어는 당연히 Korean입니다. 그 다음이 중요한데 알고리즘은 Searchable Image (Exact)를 권장합니다. 경험을 토대로 각 옵션을 비교하자면,

  • Searchable Image
    • Searchable Image (Exact)보다 결과가 덜 정확합니다.
    • 원본의 손상이 없습니다.
  • Searchable Image (Exact)
    • 정확하지만 처리 과정이 느립니다.
    • 원본의 손상이 없습니다.
  • ClearScan
    • 정확하고 빠릅니다.
    • 원본이 손상 당할 위험이 있습니다.

이게 전부입니다. OCR은 시간을 많이 잡아먹기 때문에 5권이 넘으면 자기 전에 작업을 걸어놓는 편이 좋습니다.

글쓴이
Kubernetes, DevSecOps, AWS, 클라우드 보안, 클라우드 비용관리, SaaS 의 활용과 내재화 등 소프트웨어 개발 전반에 도움이 필요하다면 도움을 요청하세요. 지인이라면 가볍게 도와드리겠습니다. 전문적인 도움이 필요하다면 저의 현업에 방해가 되지 않는 선에서 협의가능합니다.
트위터
  • Jul 31, 2021
    RT @ecolibertas: 前주한미군 사령관 파격제안 “北을 동맹으로 만들자” – 노컷뉴스 – 美 외교전문지 6페이지 ‘일괄타결’ 장문기고 – 군사관계 정상화→충돌제어→유엔사축소 – 평화협정 체결후 北을 한미동맹에 편입 – 남한=北 주요투자국,…
  • Jul 31, 2021
    이런 글에 댓글 달며 혐오에 동조하는 양반들아. 계속 그렇게 커밍아웃해라. 네 주변사람과 세상 모두가 네 본모습을 알 수 있게
  • Jul 31, 2021
    https://t.co/fvLmVzzR34 요새는 사내다운 사내가 없네. 잘못했으면 사과하면 될 일이지 말도 안 되는 변명을 하고 사실을 왜곡하며 문제를 지적한 사람에게 역공을 가하려 하다니 한심하군. “… https://t.co/Ndpz28Gvo6

Leave a Reply