2010-10-02 4 views
2

J'utilise Tesseract dans l'une de mes applications et j'ai de la difficulté à obtenir des résultats parfaits. Lorsque j'utilise la bibliothèque sur une capture d'écran parfaite, elle reçoit la plus grande partie du texte et c'est très bien. Mais quand je l'utilise sur une photo par exemple, il a du mal à le faire fonctionner, et parfois il ne retourne rien.Tesseract Training sur iPhone

Je sais que vous pouvez former Tesseract, y at-il un bon didacticiel de formation ou quelque chose pour la reconnaissance de photos iPhone? Ou y a-t-il des modifications que je devrais apporter à mon image source avant de le traiter?

Merci!

Répondre

2

Publier une image d'échantillon. Voici quelques choses à regarder:

Comment obtenez-vous l'image à 1 bit? En fin de compte OCR est fait en images N/B - peut-être que vous pouvez faire un meilleur travail que la bibliothèque.

Quel est le DPI de l'image? Les numérisations sont généralement de l'ordre de 200 à 300 DPI, mais les photos peuvent être de 72 ou 96. Les moteurs OCR se servent du DPI pour avoir une idée de la taille des lettres. Vous devrez peut-être changer le DPI et rééchantillonner (redimensionner) l'image de sorte que le DPI correspond aux attentes. Les moteurs OCR attendent des documents numérisés, pas des photographies.

+0

Donc, si je comprends bien, je devrais convertir l'image à environ 200 dpi et noir et blanc pour attendre de meilleurs résultats? Y a-t-il une bonne bibliothèque pour le faire sur iPhone? – elliottbolzan

+2

Faites-le manuellement d'abord pour voir si cela fait une différence. Vous pouvez utiliser GIMP. Si c'est mieux, CoreImage fait partie de la bibliothèque IOs. La conversion N/B doit se faire dans le bon sens - il existe plusieurs algorithmes de seuillage - vous devrez peut-être jouer avec. Regardez ceci: http://sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html –

+0

Merci beaucoup! – elliottbolzan