J'utilise Tesseract OCR (via pytesser) et PIL (Python Image Library) pour le test automatique d'une application.Comment donner les meilleures chances de succès à un logiciel OCR?
Je vérifie que le texte affiché est correct en faisant une capture d'écran et en obtenant le texte grâce à tesseract.
J'ai eu quelques problèmes au début et cela semble fonctionner mieux puisque j'ai augmenté la taille de la capture d'écran grâce à l'interpolation bicubique de PIL.
Malheureusement, j'ai encore quelques erreurs comme la confusion entre '0' et 'O'. Je peux imaginer que j'aurai d'autres problèmes similaires à l'avenir.
Je voudrais savoir s'il existe des techniques pour préparer une image afin d'aider l'OCR. Toute idée est la bienvenue.
Merci à l'avance
Si cette question est toujours d'actualité: Est-ce que cela a à être Tesseract? Il existe des moteurs OCR (tels que ABBYY) qui sont parfaits pour les images d'entrée de basse qualité et effectuent automatiquement le prétraitement des images pour vous. Il y a une API REST pour l'OCR qui utilise le moteur ABBYY sur http://www.wisetrend.com/wisetrend_ocr_cloud.shtml - il y a un essai gratuit pour que vous puissiez essayer quelques images par vous-même –