Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

OCR und max_dimesions dürfen nicht zusammen verwendet werden #2

Open
karkraeg opened this issue Dec 9, 2022 · 0 comments
Open

OCR und max_dimesions dürfen nicht zusammen verwendet werden #2

karkraeg opened this issue Dec 9, 2022 · 0 comments

Comments

@karkraeg
Copy link
Member

karkraeg commented Dec 9, 2022

Wenn OCR erzeugt werden soll, schaut das Programm zunächst ob es ursprünglich TIFFs gab. Wenn das der Fall ist, dann nutzt Tesseract die TIFF Datei. Ansonsten wird die JPG Datei genutzt. Wenn aber mit der Option max_dimensions die Bilder verkleinert werden, passen die Koordinaten der Texterkennung im ALTO nicht.

if OCR == True:
if len(alltiffs) != 0:
# Wenn es TIFFs waren, dann OCR auf die TIFFs - dann dürfen die JPGs aber nicht kleingerechnet werden...
helpers.ocr(
alltiffs,
logger,
tesseract_language,
outputfolder,
renameimages,
identifier,
)
else:
helpers.ocr(
jpgs,
logger,
tesseract_language,
outputfolder,
renameimages,
identifier,
)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Development

No branches or pull requests

1 participant