Hvad er det bedste Python OCR-bibliotek?


Bedste svar

Jeg kom også til at anbefale pytesseract (som andre allerede anbefalede), det er super sejt.

Ofte afhænger det ofte af dit domæne, så det kan være værd at gøre det “internt”.

Hvis du holder dig til python, er det ret ligetil at bruge skimage-funktionerne regionprops , label , clear\_border , threshold\_otsu og hog (Histogram af gradienter) for at føde en Chars74k klassifikator. I nogle domæner passer de tilgængelige OCR-libs ikke for godt, da der i nogle OCR-tilfælde er specifikke funktioner i dit datasæt, der er lidt niche til dit domæne (skæve gadeskilt fra bindestregkameraer, animeoversættelse med lav p-ramme værdi under komprimering eller interlacing fra DVD-klon, jpeg-artefakter i pdf-scanninger osv.).

Jeg hørte, at OCRopus måske også er værd at undersøge (har ikke brugt det personligt), da det “ bruger tesseract-ocr, men tilføjer layoutanalyse.

Svar

Dette afhænger virkelig af, hvor detaljeret / klart dit billede er.

Et tilbagevendende problem med hensyn til mønstergenkendelse generelt er billedets klarhed.

En konstant udfordring, der stadig vender tilbage, er det faktum, at mens vi kan have moderat / stor succes med klare billeder ..

Dette er ikke tilfældet med billeder, der ikke er klare.

Betydning, det er derfor, vi skal have Machine Learning og Deep Learning, så vi kan “filtrere ud”, fejlmargen hvor korrekt vores vurdering er.

Men hvis dit billede er et klart billede, kan jeg anbefale Tesseract OCR.

Bortset fra det kan du også, prøv 4.2. Ekstraktion af funktioner

Skønt jeg vil gerne understrege, at der som altid sjældent er nogen “clear cut” let vej.

Det vil altid være i forhold til hvilken slags tilgang du tager, hvor matematisk, hvor detaljeret og hvilke værktøjer du har til din rådighed.

Held og lykke.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *