2009-12-15 18 views
7

J'ai cherché autour de l'open source OCR pour le chinois. Mais sans chance, il semble qu'il y ait rarement une OCR open source (pour le chinois) qui soit utilisable.Open source OCR pour le chinois

Je suis ici demandais:

  1. Y at-il open source OCR pour le chinois qui pourrait être utilisé pour l'environnement de production? Quelles sont les principales différences lors de la mise en œuvre d'un ROC pour les langues latines et pour le chinois?

  2. Je connais un bon OCR comme Tesseract ou Ocropus, que dois-je faire si je veux le faire supporter en chinois?

Toute aide est appréciée et merci à l'avance ~

Répondre

4

Vous pouvez choisir:

  • Tesseract 3.0 soutien chinois/japonais
  • soutien NHOCR japonais
+0

Tesseract 3.0 est-il disponible au téléchargement maintenant? Où puis-je trouver sa source? –

+0

Vous pouvez consulter http://code.google.com/p/tesseract-ocr/source/checkout. –

0

chinois a beaucoup plus de caractères que les langues latines. Il y a des produits commerciaux. Une des façons est de les contacter et obtenir de l'aide.

Je ne pense pas qu'il existe une source ouverte pour les caractères chinois ou japonais. Dans le domaine de l'OCR, il y a beaucoup de techniques au-delà des algorithmes de reconnaissance de formes, où une entreprise est bonne, pas la communauté open source.

+0

Je ne trouve une open source OCR pour le japonais. Il semble qu'il n'y a pas beaucoup de choix pour le chinois. Encore merci ~ –