Je pense que cela est très difficile à automatiser. Le problème est simplement parce que vous avez besoin d'un très bon logiciel OCR. Et même si tu as eu ça, que se passe-t-il si ça lit quelque chose de mal, cause de l'écriture frouzy de quelqu'un? Si la pièce d'identité est erronée, le salaire est réservé au mauvais employé et si le montant est erroné, il a reçu le mauvais salaire!
Les deux sont des choses que vous n'arriverez pas vraiment. Juste pour vous montrer à quel point il est difficile de trouver un OCR, jetez un oeil sur la façon dont fonctionne un captcha. Le principe n'est rien de plus qu'une image d'un texte difficile à lire.
Donc, mon opinion serait, que vous ne pouvez pas vraiment automatiser ce processus. Au moins, vous pouvez écrire un programme pour aider un être humain en entrant les valeurs (aussi jeter un oeil à Amazon Mechanical Turk) manuellement:
- Montrer à droite l'image avec les valeurs écrites à la main, ou si elles sont toujours sur le même position ou spécialement marqué (avec une boîte autour d'eux, etc.), essayez de trouver ces endroits automatiquement et montrez-les à l'utilisateur.
- Sur la gauche offrent deux zones de texte, où l'utilisateur peut entrer les valeurs.
Pour obtenir ce à un processus rapide et fluide, vous devez prendre soin de la façon dont l'utilisateur peut saisir facilement les valeurs en utilisant simplement le clavier:
- la présentation d'une nouvelle image, réglez le focus sur la zone de texte identifiant
- Si l'ID utilisateur est toujours une longueur spécifique, passer à la case suivante si tous les numéros sont entrés
- (Si vous permettez à cela, un backspace dans le vide case devrait se concentrer en arrière au précédent)
- permettent Sinon un changement à la prochaine zone de texte en appuyant sur l'onglet ou retour
- Normalement, ces zones de texte sont disposés au-dessus les uns des autres (pas côte à côte), donc vous devez soutenir la commutation entre eux en utilisant le haut vers le bas Touches directionnelles.
- Après avoir terminé l'entrée dans la dernière zone de texte, affichez automatiquement l'image suivante.
- également dans ce cas d'une nouvelle nouvelle entrée (rien déjà entré) permettent un changement facile de retour à l'ancienne entrée en utilisant la touche Retour arrière ou flèche gauche)
En utilisant un tel traiter une seule personne peut entrer de nombreuses entrées dans votre base de données et les coûts sont beaucoup moins chers que de trouver de mauvaises entrées dans votre base de données par la suite. Juste une dernière suggestion:
Parce qu'il s'agit d'un processus ennuyeux pour un être humain qui peut facilement conduire à des erreurs, peut-être laisser deux personnes entrer ces valeurs et seulement si les deux entrées sont identiques à prendre cette valeur comme approuvé. Cela devrait conduire à un taux correct quelque part au-dessus de 99%. Si vous avez absolument besoin de 100%, pensez à laisser 4-5 personnes vérifier une entrée et seulement si toutes les valeurs sont identiques. Pour obtenir également une comparaison sur la qualité de votre logiciel ocr, laissez-le également parcourir vos images et comparez ces résultats aux valeurs saisies par l'utilisateur pour avoir une idée, quand vous pouvez vraiment compter uniquement sur votre ocr.
+1 en soulignant que l'OCR est pas si fiable. Je voudrais un autre +1 pour l'idée de turk mécanique;) – zerm