Was ist die beste Python-OCR-Bibliothek?

Beste Antwort

Ich habe auch Pytesseract empfohlen (was andere bereits empfohlen haben), es ist super cool.

Obwohl dies oft von Ihrer Domain abhängt, lohnt es sich möglicherweise, dies „im eigenen Haus“ zu tun.

Wenn Sie sich an Python halten, ist es ziemlich einfach, die Skimage-Funktionen regionprops , label , clear\_border , schwellenwert\_otsu und hog (Histogramm der Farbverläufe), um ein Chars74k Klassifikator. In einigen Domains passen die verfügbaren OCR-Bibliotheken nicht so gut, da in einigen OCR-Fällen bestimmte Funktionen in Ihrem Datensatz eine Nische für Ihre Domain darstellen (verzerrte Straßenschilder von Dash-Cams, Anime-Übersetzung mit niedrigem p-Frame) Wert während der Komprimierung oder Interlacing von DVD-Klonen, JPEG-Artefakte in PDF-Scans usw.)

Ich habe gehört, dass OCRopus ebenfalls einen Blick wert sein könnte (habe es nicht persönlich verwendet), da es „ verwendet tesseract-ocr, fügt jedoch eine Layoutanalyse hinzu. „

Antwort

Dies hängt wirklich davon ab, wie detailliert / klar Ihr Bild ist.

Ein wiederkehrendes Problem bei der Mustererkennung ist insgesamt die Klarheit des Bildes.

Eine ständige Herausforderung, die immer wieder auftritt, ist die Tatsache, dass wir zwar moderat sein können / großer Erfolg mit klaren Bildern.

Dies ist nicht der Fall bei Bildern, die nicht klar sind.

Das heißt, deshalb müssen wir maschinelles Lernen und tiefes Lernen haben. damit wir den Fehlerrand „herausfiltern“ können Wie richtig unsere Einschätzung ist.

Wenn Ihr Bild jedoch ein klares Bild ist, kann ich Tesseract OCR empfehlen.

Abgesehen davon könnten Sie auch Versuchen Sie 4.2. Feature-Extraktion

Allerdings möchte ich betonen, dass es wie immer selten einen „eindeutigen“ einfachen Weg gibt.

Es wird immer so sein in Bezug darauf, welche Art von Ansatz Sie wählen, wie mathematisch, wie detailliert und welche Werkzeuge Ihnen zur Verfügung stehen.

Viel Glück.

Beste Antwort

Antwort

Related Post

Schreibe einen Kommentar Antworten abbrechen