Migliore risposta
Sono venuto a consigliare anche pytesseract (che altri hanno già consigliato), è fantastico.
Anche se spesso dipende dal tuo dominio, quindi potrebbe valere la pena farlo “in casa”.
Se ci si attiene a Python, è abbastanza semplice utilizzare le funzioni di skimage regionprops , label , clear\_border , threshold\_otsu e hog (Istogramma delle sfumature) per alimentare un Chars74k . In alcuni domini, le librerie OCR disponibili non si adattano troppo bene poiché in alcuni casi OCR ci sono caratteristiche specifiche nel tuo set di dati che sono un po di nicchia per il tuo dominio (segnali stradali distorti dalle dash cam, traduzione anime con p-frame basso valore durante la compressione o linterlacciamento dal clone di DVD, artefatti jpeg nelle scansioni pdf, ecc.).
Ho sentito che vale la pena esaminare anche OCRopus (non lho usato personalmente), poiché “ utilizza tesseract-ocr ma aggiunge lanalisi del layout. “
Risposta
Questo dipende davvero da quanto è granulare / Cancella la tua immagine.
Un problema ricorrente in termini di riconoscimento del pattern, nel complesso, è la chiarezza dellimmagine.
Una sfida costante che continua a tornare, è il fatto che, sebbene possiamo avere un moderato / grande successo con immagini chiare ..
Questo non è il caso di immagini che non sono chiare.
Significa che è per questo che dobbiamo avere Machine Learning e Deep Learning, in modo da poter “filtrare” lerrore marg per capire quanto sia corretta la nostra valutazione.
Tuttavia, immagino, se la tua immagine è unimmagine chiara, posso consigliare Tesseract OCR.
Oltre a questo, potresti anche, prova 4.2. Estrazione delle funzionalità
Anche se, vorrei sottolineare che, come sempre, raramente esiste un percorso facile “chiaro”.
Sarà sempre rispetto al tipo di approccio che adotti, quanto matematico, quanto granulare e quali strumenti hai a disposizione.
Buona fortuna.