Existe-t-il un moyen de contrôler les noms de fichier de sortie d'un travail Hadoop Streaming? Spécifiquement, je voudrais que le contenu et le nom des fichiers de sortie de mon travail soient organisés par le ket les sorties du réducteur - chaque fichier ne contiendrait que des valeurs pour une clé et son nom serait la clé.Comment contrôler le nom et le contenu des fichiers de sortie d'un travail de diffusion Hadoop?
Mise à jour: Vous venez de trouver la réponse - L'utilisation d'une classe Java dérivée de MultipleOutputFormat comme format de sortie des jobs permet de contrôler les noms des fichiers de sortie. http://hadoop.apache.org/core/docs/current/api/org/apache/hadoop/mapred/lib/MultipleOutputFormat.html
Je n'ai pas vu des échantillons pour ce là-bas ... Quelqu'un peut-il indiquer à un échantillon en continu Hadoop qui utilise un format de sortie personnalisé classe Java?
Lien brisé vers de nouveaux documents –