Je souhaite fusionner 2 fichiers bzip2'ed. J'ai essayé d'ajouter l'un à l'autre: cat file1.bzip2 file2.bzip2 > out.bzip2
qui semble fonctionner (ce fichier décompressé correctement), mais je veux utiliser ce fichier comme un fichier d'entrée Hadoop, et je reçois des erreurs sur les blocs corrompus.Comment fusionner 2 fichiers bzip2'ed?
Quelle est la meilleure façon de fusionner 2 fichiers bzip2 sans les décompresser?
Les fichiers compressés sont divisés correctement, mais je n'arrive toujours pas à comprendre comment exécuter la tâche de mappage sur des fichiers concaténés. (Mais après les décompresser tous, puis 'cat', puis compresser ce gros fichier d'entrée fonctionne) – wlk