Posted in Bash CLI CMD Powershell

OCR .PDF datoteke

ocrmypdf -O 3 –tesseract-oem=3 –language=hrv –force-ocr –output-type pdf –sidecar OCR.txt inputFile.pdf temp.pdf Po završetku će datoteka “OCR.txt” imati tekst iz datoteke “inputFile.pdf”. Datoteka “temp.pdf” je…

Posted in CMD Windows

tesseract i ocrmypdf – Instalacija – Windows

Preuzmi i instaliraj tesseract: https://github.com/UB-Mannheim/tesseract/wiki (instaliraj sve module za željene jezike) ocrmypdf: https://ocrmypdf.readthedocs.io/en/latest/installation.html#native-windows Dodatne podesidbe Preuzmi novi language pack za sve jezike odabrane tijekom instalacije…

Posted in CLI

OCR tesseract ocrmypdf

Tema OCRiranje programom tesseract (slike) ili ocrmypdf (pdf). tesseract OCR-ira u tekstualne datoteke. ocrmypdf kreira PDF datoteke u kojima je moguće (bolje) pretraživati tekst (ako…