Je travaille sur un script Pig (mon premier) qui charge un gros fichier texte. Pour chaque enregistrement dans ce fichier texte, le contenu d'un champ doit être envoyé à un service RESTful pour traitement. Rien n'a besoin d'être évalué ou filtré. Capturez des données, envoyez-les et le script n'a plus besoin de rien.Appelez le service RESTful dans le script Pig
Je suppose qu'un UDF est requis pour ce genre de fonctionnalité, mais je suis assez nouveau pour Pig que je n'ai pas une image claire de ce que type de la fonction que je devrais construire. Ma meilleure estimation serait un Store Function puisque les données sont finalement stockées quelque part, mais je pense que la quantité de conjectures impliquées dans cette conclusion est plus élevée que je le voudrais.
Toute idée ou direction serait grandement appréciée.