Wat is de beste Python OCR-bibliotheek?


Beste antwoord

Ik ben ook pytesseract gaan aanbevelen (wat anderen al hebben aanbevolen), het is super gaaf.

Hoewel het vaak van je domein afhangt, is het misschien de moeite waard om het “in huis” te doen.

Als je je aan Python houdt, is het vrij eenvoudig om de skimage-functies te gebruiken regionprops , label , clear\_border , threshold\_otsu en hog (histogram van verlopen) om een ​​ Chars74k classificator. In sommige domeinen passen de beschikbare OCR-libs niet zo goed, aangezien er in sommige OCR-gevallen specifieke functies in uw dataset zijn die een beetje niche zijn voor uw domein (scheve straatnaamborden van dashcams, anime-vertaling met een laag p-frame waarde tijdens compressie of interliniëring van dvd-kloon, jpeg-artefacten in pdf-scans, enz.).

Ik heb gehoord dat OCRopus misschien ook de moeite waard is om naar te kijken (heb het niet persoonlijk gebruikt), aangezien het “ gebruikt tesseract-ocr maar voegt lay-outanalyse toe.

Antwoord

Dit hangt er echt van af hoe gedetailleerd / duidelijk je afbeelding is.

Een terugkerend probleem in termen van patroonherkenning is over het algemeen de duidelijkheid van het beeld.

Een constante uitdaging die steeds weer terugkomt, is het feit dat, hoewel we gematigde / groot succes met duidelijke plaatjes.

Dit is niet het geval met plaatjes die niet duidelijk zijn.

Dit betekent dat we Machine Learning en Deep Learning moeten hebben, zodat we de foutmarg in hoe correct onze beoordeling is.

Ik denk echter dat als je foto een duidelijke foto is, ik Tesseract OCR kan aanbevelen.

Anders dan dat, zou je ook kunnen, probeer 4.2. Feature-extractie

Hoewel ik zou willen benadrukken dat er, zoals altijd, zelden een “duidelijk” gemakkelijk pad is.

Dat zal altijd zo zijn ten opzichte van wat voor soort benadering u kiest, hoe wiskundig, hoe gedetailleerd en welke tools u tot uw beschikking heeft.

Veel succes.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *