Hva er det beste Python OCR-biblioteket?


Beste svaret

Jeg kom også til å anbefale pytesseract også (som andre allerede anbefalte), det er superkult.

Ofte avhenger det av domenet ditt, så det kan være verdt å gjøre det «hjemme».

Hvis du holder deg til python, er det ganske greit å bruke skimage-funksjonene regionprops , label , clear\_border , threshold\_otsu og hog (Histogram av gradienter) for å mate en Chars74k klassifisering. På noen domener passer ikke de tilgjengelige OCR-libene for godt siden det i noen OCR-tilfeller er spesifikke funksjoner i datasettet som er litt nisje til domenet ditt (skjevt gateskilt fra dash-kameraer, anime-oversettelse med lav p-ramme verdi under komprimering eller interlacing fra DVD-klone, jpeg-gjenstander i pdf-skanninger osv.).

Jeg hørte at OCRopus kan være verdt å se på også (har ikke brukt det personlig), siden det “ bruker tesseract-ocr, men legger til layoutanalyse.

Svar

Dette avhenger virkelig av hvor detaljert / klart bildet ditt er.

Et tilbakevendende spørsmål når det gjelder mønstergjenkjenning, generelt, er klarhet i bildet.

En konstant utfordring som stadig kommer tilbake, er det faktum at mens vi kan ha moderat / stor suksess med klare bilder ..

Dette er ikke tilfelle med bilder som ikke er klare.

Betydning, det er derfor vi må ha maskinlæring og dyp læring, slik at vi kan «filtrere ut», feilmarg i hvor korrekt vår vurdering er.

Men jeg antar at hvis bildet ditt er et klart bilde, kan jeg anbefale Tesseract OCR.

Annet enn det, kan du også, prøv 4.2. Ekstraksjon av funksjoner

Riktignok vil jeg understreke at det som alltid er sjelden noen «tydelig» enkel vei.

Det kommer alltid til å være i forhold til hva slags tilnærming du tar, hvor matematisk, hvor detaljert og hvilke verktøy du har til din disposisjon.

Lykke til.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *