最高のPythonOCRライブラリは何ですか？

ベストアンサー

私もpytesseractを推奨するようになりました（他の人はすでに推奨しています）、それはとてもクールです。

ドメインによって異なる場合が多いので、「社内」で行う価値があるかもしれません。

Pythonに固執する場合は、skimage関数を使用するのは非常に簡単です regionprops 、 label 、 clear\_border 、 threshold\_otsu と hog （勾配のヒストグラム）を使用して、 Charles74k 分類子。一部のドメインでは、利用可能なOCRライブラリがうまく適合しない場合があります。これは、一部のOCRの場合、ドメインに少しニッチな特定の機能がデータセットにあるためです（ダッシュカムからの斜めの道路標識、低pフレームのアニメ翻訳圧縮中またはDVDクローンからのインターレース中の値、pdfスキャンのjpegアーティファクトなど）。

OCRopusも調べる価値があると聞きました（個人的には使用していません）。 = “a60d4e3bda”>

tesseract-ocrを使用しますが、レイアウト分析を追加します。 “

回答

全体として、パターン認識の観点から繰り返し発生する問題は、画像の明瞭さです。

繰り返し発生し続ける課題は、適度なものを使用できる一方で、 /鮮明な画像で大成功..

つまり、機械学習とディープラーニングが必要です。エラーマーグを「フィルターで除外」できるようにします

しかし、あなたの写真が鮮明な写真であれば、TesseractOCRをお勧めできます。

とはいえ、いつものように、「明確な」簡単な道はめったにないことを強調したいと思います。

常にそうなるでしょう。どのようなアプローチをとるか、どのように数学的で、どれだけきめ細かく、どのツールを自由に使えるかと比較して。

ベストアンサー

回答

Related Post

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル