J'ai une rapide question Hadoop Streaming. Si j'utilise le streaming Python et que j'ai des paquets Python dont mes mappeurs/réducteurs ont besoin mais qui ne sont pas installés par défaut, dois-je le
J'utilise Dumbo pour certains travaux Hadoop Streaming. J'ai un tas de dictionnaires JSON contenant chacun un article (texte multiligne) et quelques méta-données. Je sais qu'Hadoop fonctionne mieux av