최상의 답변
저는 pytesseract도 추천하러 왔는데 (다른 사람들이 이미 추천 한) 정말 멋지네요.
종종 도메인에 따라 다르기 때문에 “내부”에서 수행 할 가치가있을 수 있습니다.
python을 고수한다면 skimage 함수를 사용하는 것이 매우 간단합니다. regionprops , 라벨 , clear\_border , iv Chars74k 분류 자. 일부 도메인에서는 사용 가능한 OCR 라이브러리가 너무 잘 맞지 않습니다. 일부 OCR의 경우 데이터 세트에 도메인에 약간의 틈새가있는 특정 기능이 있기 때문입니다 (대시 캠의 비뚤어진 도로 표지판, 낮은 p- 프레임의 애니메이션 번역 DVD 클론에서 압축 또는 인터레이스하는 동안 값, pdf 스캔의 jpeg 아티팩트 등).
OCRopus도 살펴볼 가치가 있다고 들었습니다 (개인적으로 사용하지 않았 음). “는 tesseract-ocr을 사용하지만 레이아웃 분석을 추가합니다. ”
답변
이것은 사진의 세분화 / 지우기 정도에 따라 다릅니다.
전체적으로 패턴 인식 측면에서 반복되는 문제는 그림의 명확성입니다.
계속 반복되는 끊임없는 도전은 사실입니다. / 명확한 그림으로 대성공 ..
명확하지 않은 그림에서는 그렇지 않습니다.
의미, 이것이 우리가 기계 학습과 딥 러닝을 가져야하는 이유입니다. “필터링”할 수 있도록 오류 마그 우리의 평가가 얼마나 정확한지.
그러나 당신의 사진이 선명한 사진이라면 Tesseract OCR을 추천 할 수있을 것 같습니다.
그 외에는, 를 사용해보세요. 특징 추출
항상 그렇듯이 “명확한 컷”쉬운 경로는 거의 없다는 점을 강조하고 싶습니다.
항상 그럴 것입니다. 어떤 접근 방식을 취하고 있는지, 수학적 방식, 세분화 방식, 사용할 수있는 도구가 무엇인지에 따라 다릅니다.
행운을 빕니다.