2010-07-21 11 views
1

Quelqu'un peut-il m'expliquer comment fonctionne l'algorithme de recherche de texte? Je comprends que c'est un domaine énorme, mais j'essaie de le comprendre à partir d'un niveau élevé pour que je puisse consulter des documents académiques à ce sujet. Par exemple, les fautes d'orthographe est un problème difficile à résoudre et bien sûr Google le résout. Lorsque je recherche un terme et que je l'orthographie sur Google, il suggère automatiquement l'orthographe correcte. Comment l'indexation est-elle faite pour cela? En utilisant MapReduce je peux voir qu'ils indexent diverses entités. Qu'est-ce qu'ils ou quelqu'un d'autre indexent et stockent? Peut-être que je suis à la recherche d'une implémentation pratique de MapReduce si je pense du tout dans la bonne direction.Question de recherche de texte sur la mise en œuvre

  • Pav

Répondre

0

Je crains que cette question est vraiment trop grand, ce qui explique sans doute pourquoi il n'a pas encore vu une réponse. En ce qui concerne le vérificateur d'orthographe de Google, Peter Norvig explique comment cela est fait:

L'implémentation exacte dans un usage productif chez Google semble certainement un peu différente et beaucoup plus compliquée, mais cela pourrait vous aider à démarrer.