Je souhaite compter les occurrences de mots dans un ensemble de fichiers texte. Tout comme ici http://doc.trolltech.com/4.5/qtconcurrent-wordcount-main-cpp.htmlC++ Qt WordCount et grands ensembles de données
Le problème est que j'ai besoin de traiter une très grande quantité de fichiers en texte brut - donc mon résultat dans QMap ne peut pas rentrer dans la mémoire.
Je ai googlé l'algorithme de tri de fusion de la mémoire externe (basé sur des fichiers), mais je suis trop paresseux pour m'implémenter. Donc, je veux diviser le résultat défini par des parties pour s'adapter à chacun d'eux en mémoire. Puis stocker ces parties dans des fichiers sur le disque. Ensuite, appelez la fonction magique mergeSort (QList, result_file) et obtenez le résultat final dans result_file.
Est-ce que quelqu'un connaît l'implémentation compatible Qt de cet algo? En bref, je suis à la recherche de pythons heapq.merge (http://docs.python.org/library/heapq.html#heapq.merge) analogique mais pour les conteneurs Qt.