Vad är det bästa Python OCR-biblioteket?


Bästa svaret

Jag kom också att rekommendera pytesseract (som andra redan rekommenderade), det är supercool.

Ofta beror det dock på din domän, så det kan vara värt att göra det ”in house”.

Om du håller fast vid python är det ganska enkelt att använda skidfunktionerna regionprops , label , clear\_border , threshold\_otsu och hog (Histogram över gradienter) för att mata en Chars74k klassificering. I vissa domäner passar de tillgängliga OCR-libs inte så bra eftersom det i vissa OCR-fall finns specifika funktioner i din datamängd som är lite nischade för din domän (snedställda gatuskyltar från streckkameror, animeöversättning med låg p-ram värde vid komprimering eller sammanflätning från DVD-klon, jpeg-artefakter i pdf-skanningar, etc.).

Jag hörde att OCRopus kan vara värt att titta på också (har inte använt det personligen), eftersom det “ använder tesseract-ocr men lägger till layoutanalys.

Svar

Detta beror verkligen på hur detaljerad / tydlig din bild är.

En återkommande fråga när det gäller mönsterigenkänning, övergripande, är bildens tydlighet.

En ständig utmaning som fortsätter att komma tillbaka är faktumet att även om vi kan ha måttlig / stor framgång med tydliga bilder …

Detta är inte fallet med bilder som inte är tydliga.

Det betyder, det är därför vi måste ha maskininlärning och djupinlärning, så att vi kan ”filtrera bort”, fel marg hur korrekt vårt bedömning är.

Men jag antar att om din bild är en tydlig bild kan jag rekommendera Tesseract OCR.

Förutom det kan du också, försök 4.2. Funktionsextraktion

Även om jag vill betona att det, som alltid, sällan finns någon ”tydlig” enkel väg.

Det kommer alltid att vara i förhållande till vilken typ av tillvägagångssätt du tar, hur matematiskt, hur detaljerat och vilka verktyg du har till ditt förfogande.

Lycka till.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *