2010-11-23 40 views

Répondre

1

Cela dépend des exigences de votre application.

Généralement, le moteur OCR ne peut renvoyer que des caractères, des polices, des mots, des lignes ou des régions. Vous devez ajouter de nombreux autres modules et les ajuster pour obtenir les meilleurs résultats.

D'abord, un prétraitement d'image est nécessaire pour l'application OCR de la caméra. L'arrière-plan, l'élimination du bruit, la binarisation, le redimensionnement ... doivent être ajoutés pour nettoyer l'image autant que possible.

Deuxièmement, vous devez localiser la zone de texte. L'algorithme ne dépend pas seulement des caractéristiques de l'image mais aussi de votre objectif OCR. Par exemple, si vous avez besoin d'un numéro de plaque OCR, vous pouvez utiliser la longueur, la largeur ou la hauteur du numéro de plaque pour une localisation plus précise. Après l'OCR, vous pouvez ajouter un post-traitement pour corriger certaines erreurs d'OCR. Les moteurs OCR communs tels que Abyy, ExperVision, Omnipage, GOCR, Tesseract sont tous formés selon des documents communs, des magazines ou du papier de bureau. Si vos documents sont spéciaux, vous pouvez établir votre logique d'analyse ou d'extraction de données de haut niveau sur la couche ROC.

0

Vous pouvez essayer l'API OCR au http://www.wisetrend.com/wisetrend_ocr_cloud.shtml - c'est une API REST qui devrait être très simple à utiliser depuis n'importe quelle plate-forme mobile, et basée sur le moteur ABBYY OCR, idéal pour les images de basse qualité comme celles des mobiles caméras de téléphone. Avis de non-responsabilité: WiseTrend est le client de ma société.