2010-10-24 15 views
4

Je me demandais si quelqu'un pouvait me désigner un très grand dictionnaire de mots aléatoires qui pourrait être utilisé pour tester certaines structures de données de chaînes de hautes performances? J'en trouve quelques-uns qui sont dans la gamme ~ 2MB ... mais j'aimerais en avoir un plus grand si possible. Je suppose qu'il doit y avoir un grand ensemble de données de chaîne standard quelque part qui pourrait être utilisé. Merci!Grand dictionnaire de fichiers de mots aléatoires à des fins d'analyse comparative?

Répondre

1

je recommande de jeter un oeil à travers le matériel disponible à la TREC (Texte REtrieval Conference). Quelques bons jeux de données qui pourraient répondre à vos besoins.