Quelle est la meilleure bibliothèque Python OCR?


Meilleure réponse

Jai également recommandé pytesseract (ce que dautres ont déjà recommandé), cest super cool.

Bien que cela dépende souvent de votre domaine, cela peut valoir la peine de le faire «en interne».

Si vous vous en tenez à python, il est assez simple dutiliser les fonctions skimage regionprops , label , clear\_border , threshold\_otsu et porc (Histogramme des dégradés) pour nourrir un Chars74k classificateur. Dans certains domaines, les bibliothèques OCR disponibles ne correspondent pas trop bien car dans certains cas OCR, il y a des fonctionnalités spécifiques dans votre ensemble de données qui sont un peu niches à votre domaine (panneaux de signalisation asymétriques des caméras de tableau de bord, traduction danime avec un p-frame bas valeur lors de la compression ou de lentrelacement à partir du clone de DVD, des artefacts jpeg dans les scans PDF, etc.).

Jai entendu dire quOCRopus pourrait valoir la peine dêtre examiné également (je ne lai pas utilisé personnellement), car il «  utilise tesseract-ocr mais ajoute une analyse de mise en page. »

Réponse

Cela dépend vraiment de la granularité / netteté de votre image.

Un problème récurrent en termes de reconnaissance de formes, dans lensemble, est la clarté de limage.

Un défi constant qui revient sans cesse est le fait que, bien que nous puissions avoir des / grand succès avec des images claires ..

Ce nest pas le cas avec des images qui ne sont pas claires.

Ce qui veut dire, cest pourquoi nous devons avoir le Machine Learning et le Deep Learning, afin que nous puissions « filtrer », lerreur marg à quel point notre évaluation est correcte.

Cependant, je suppose que si votre image est claire, je peux recommander Tesseract OCR.

À part cela, vous pourriez aussi, essayez 4.2. Extraction de fonctionnalités

Bien que je voudrais souligner que, comme toujours, il y a rarement une voie facile « claire ».

Cela va toujours être par rapport au type dapproche que vous adoptez, au degré de mathématique, à la granularité et aux outils dont vous disposez.

Bonne chance.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *