2010-10-11 13 views
2

Existe-t-il un moyen de vérifier plusieurs phrases dans mysql?Requête MySQL pour vérifier certaines phrases (article en double, plagiat)

Je dois vérifier si un article a une version dupliquée stockée dans mysql.

C'est l'algorithme je crée d'abord un tableau de phrases qui devait être vérifier (enlever tous les caractères non alphanumériques) puis construire la requête (comment?) Après avoir obtenu le résultat que je compare si 50 % des phrases sont en double que je considère que l'article est en double. Les articles de la table sont stockés avec des caractères non alphanumériques supprimés. Exemple:

iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered 

Toutes les suggestions?

Répondre

1

Oui, regardez dans "Programming Collective Intelligence" pour en savoir plus sur ces algorithmes. Ils ont à voir avec le regroupement.