최고의 Python OCR 라이브러리는 무엇인가요?


최상의 답변

저는 pytesseract도 추천하러 왔는데 (다른 사람들이 이미 추천 한) 정말 멋지네요.

종종 도메인에 따라 다르기 때문에 “내부”에서 수행 할 가치가있을 수 있습니다.

python을 고수한다면 skimage 함수를 사용하는 것이 매우 간단합니다. regionprops , 라벨 , clear\_border , iv Chars74k 분류 자. 일부 도메인에서는 사용 가능한 OCR 라이브러리가 너무 잘 맞지 않습니다. 일부 OCR의 경우 데이터 세트에 도메인에 약간의 틈새가있는 특정 기능이 있기 때문입니다 (대시 캠의 비뚤어진 도로 표지판, 낮은 p- 프레임의 애니메이션 번역 DVD 클론에서 압축 또는 인터레이스하는 동안 값, pdf 스캔의 jpeg 아티팩트 등).

OCRopus도 살펴볼 가치가 있다고 들었습니다 (개인적으로 사용하지 않았 음). “는 tesseract-ocr을 사용하지만 레이아웃 분석을 추가합니다.

답변

이것은 사진의 세분화 / 지우기 정도에 따라 다릅니다.

전체적으로 패턴 인식 측면에서 반복되는 문제는 그림의 명확성입니다.

계속 반복되는 끊임없는 도전은 사실입니다. / 명확한 그림으로 대성공 ..

명확하지 않은 그림에서는 그렇지 않습니다.

의미, 이것이 우리가 기계 학습과 딥 러닝을 가져야하는 이유입니다. “필터링”할 수 있도록 오류 마그 우리의 평가가 얼마나 정확한지.

그러나 당신의 사진이 선명한 사진이라면 Tesseract OCR을 추천 할 수있을 것 같습니다.

그 외에는, 를 사용해보세요. 특징 추출

항상 그렇듯이 “명확한 컷”쉬운 경로는 거의 없다는 점을 강조하고 싶습니다.

항상 그럴 것입니다. 어떤 접근 방식을 취하고 있는지, 수학적 방식, 세분화 방식, 사용할 수있는 도구가 무엇인지에 따라 다릅니다.

행운을 빕니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다