Mi a legjobb Python OCR könyvtár?


Legjobb válasz

Javasoltam a pytesseract-ot is (amit mások már ajánlottak), nagyon klassz.

Bár gyakran a domainjétől függ, érdemes lehet ezt „házon belül” megcsinálni.

Ha ragaszkodunk a pythonhoz, akkor a skimage függvények használata nagyon egyszerű. regionprops , címke , clear\_border , threshold\_otsu és hog (Átmenetek hisztogramja) egy Betűk74k osztályozó. Bizonyos tartományokban az elérhető OCR lib-ek nem illenek túl jól, mivel egyes OCR esetekben az adatkészletben vannak olyan sajátosságok, amelyek kissé rést jelentenek a domain számára (ferde utcatáblák kötőjeles bütykökből, anime fordítás alacsony p-frame-sel érték tömörítés vagy átlapolás közben DVD-klónból, jpeg-leletek pdf-beolvasásokból stb.).

Úgy hallottam, hogy az OCRopust is érdemes lehet megvizsgálni (személyesen nem használtam), mivel ez „ a tesseract-ocr-t használja, de hozzáadja az elrendezés elemzését.

Válasz

Ez valóban attól függ, hogy mennyire szemcsés / tiszta a kép.

A mintafelismerés szempontjából általában visszatérő kérdés a kép tisztasága.

Állandó kihívás, amely folyamatosan visszatér, az a tény, hogy bár mérsékeltek lehetnek / nagy siker tiszta képekkel ..

Ez nem így van a nem egyértelmű képek esetén.

Jelentés, ezért rendelkezünk gépi tanulással és mély tanulással, hogy „kiszűrhessük” a hiba margót abban, hogy mennyire helytálló a felmérésünk.

Azt hiszem azonban, ha a képe tiszta kép, ajánlhatom a Tesseract OCR-t.

Ettől eltekintve azt is megteheti, próbáld ki 4.2. Funkciókivonás

Bár szeretném hangsúlyozni, hogy mint mindig, ritkán van „egyértelmű vágású” könnyű út.

Mindig ez lesz ahhoz képest, hogy milyen megközelítést alkalmaz, milyen matematikai, mennyire szemléletes és milyen eszközök állnak rendelkezésére.

Sok szerencsét.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük