Meilleur algorithme de correspondance floue?

Quel est le meilleur algorithme de correspondance floue (Fuzzy Logic, N-Gram, Levenstein, Soundex ....) pour traiter plus de 100 000 enregistrements en moins de temps?Meilleur algorithme de correspondance floue?

Source

2009-01-29 Dhana

J'imagine que ce que @Mitch Wheat * voulait dire était qu'il serait très difficile de donner une réponse définitive à cette question, puisque la meilleure solution sera dépend fortement des caractéristiques de votre entrée et de l'architecture du système. Comme Tim mentionné dans sa réponse, vous devriez lire sur les forces et les faiblesses de ces algorithmes, puis tester ceux qui vous semblent appropriés. – DougW

Je vous suggère de lire les articles de Navarro mentionnés dans la section Refences de l'article Wikipedia intitulé Approximate string matching. Prendre votre décision basée sur la recherche réelle est toujours mieux que sur des suggestions par des étrangers aléatoires .. Surtout si la performance sur un ensemble d'enregistrements connus est important pour vous.

Source

2009-01-29 11:34:16 Tim

Cela dépend massivement de vos données. Certains enregistrements peuvent être mieux adaptés que d'autres. Par exemple, le code postal est un format défini qui peut donc être comparé différemment aux chaînes normales. Les gens peuvent être appariés sur les initiales et la DOB, ou d'autres combinaisons, etc.

Source

2009-01-29 12:30:22 cjk

Meilleur algorithme de correspondance floue?

Répondre

Questions connexes