最高のPythonOCRライブラリは何ですか?


ベストアンサー

私もpytesseractを推奨するようになりました(他の人はすでに推奨しています)、それはとてもクールです。

ドメインによって異なる場合が多いので、「社内」で行う価値があるかもしれません。

Pythonに固執する場合は、skimage関数を使用するのは非常に簡単です regionprops label clear\_border threshold\_otsu hog (勾配のヒストグラム)を使用して、 Charles74k 分類子。一部のドメインでは、利用可能なOCRライブラリがうまく適合しない場合があります。これは、一部のOCRの場合、ドメインに少しニッチな特定の機能がデータセットにあるためです(ダッシュカムからの斜めの道路標識、低pフレームのアニメ翻訳圧縮中またはDVDクローンからのインターレース中の値、pdfスキャンのjpegアーティファクトなど)。

OCRopusも調べる価値があると聞きました(個人的には使用していません)。 = “a60d4e3bda”>

tesseract-ocrを使用しますが、レイアウト分析を追加します。 “

回答

これは、画像の粒度/鮮明度によって異なります。

全体として、パターン認識の観点から繰り返し発生する問題は、画像の明瞭さです。

繰り返し発生し続ける課題は、適度なものを使用できる一方で、 /鮮明な画像で大成功..

これは、鮮明でない画像には当てはまりません。

つまり、機械学習とディープラーニングが必要です。エラーマーグを「フィルターで除外」できるようにします

しかし、あなたの写真が鮮明な写真であれば、TesseractOCRをお勧めできます。

それ以外にも、 4.2をお試しください。特徴抽出

とはいえ、いつものように、「明確な」簡単な道はめったにないことを強調したいと思います。

常にそうなるでしょう。どのようなアプローチをとるか、どのように数学的で、どれだけきめ細かく、どのツールを自由に使えるかと比較して。

幸運を祈ります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です