Jaká je nejlepší knihovna OCR v Pythonu?


Nejlepší odpověď

Přišel jsem doporučit také pytesseract (což už ostatní doporučili), je to super.

Často to však závisí na vaší doméně, takže by stálo za to to udělat „doma“.

Pokud se držíte pythonu, je docela jednoduché použít funkce skimage regionprops , štítek , clear\_border , threshold\_otsu a prase (histogram přechodů) ke krmení Klasifikátor Chars74k . V některých doménách dostupné knihovny OCR příliš dobře nesedí, protože v některých případech OCR jsou ve vaší datové sadě specifické funkce, které jsou pro vaši doménu trochu výklenkem (šikmé názvy ulic z dash dashů, překlad anime s nízkým rámcem p hodnota během komprese nebo prokládání z DVD klonu, artefakty jpeg ve skenování PDF atd.).

Slyšel jsem, že by OCRopus mohl být také hodný prozkoumat (nepoužíval jsem to osobně), protože „ používá tesseract-ocr, ale přidává analýzu rozložení.

Odpověď

To opravdu záleží na tom, jak je váš obrázek zrnitý / jasný.

Opakujícím se problémem, pokud jde o rozpoznávání vzorů, je celkově jasnost obrazu.

Neustálým problémem, který se stále vrací, je skutečnost, že i když můžeme mít mírný / velký úspěch s jasnými obrázky ..

To neplatí pro obrázky, které nejsou jasné.

To znamená, že proto musíme mít strojové učení a hluboké učení, abychom mohli „odfiltrovat“ chybovou marži do jaké míry je naše hodnocení správné.

Myslím si však, že pokud je váš obrázek jasný, mohu doporučit Tesseract OCR.

Kromě toho můžete také zkuste 4.2. Extrakce funkcí

I když bych chtěl zdůraznit, že jako vždy existuje zřídka nějaká „jasná“ snadná cesta.

Vždy to bude vzhledem k tomu, jaký přístup zvolíte, jak matematický, granulární a jaké nástroje máte k dispozici.

Hodně štěstí.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *