Je dois écrire un moteur de balayage pour extraire des informations de quelques sites Web pré-sélectionnés seulement.Exécution d'un robot d'indexation Web pour les sites sélectionnés sur google app engine?
Je sais que c'est un travail qui va de soi, mais je pense utiliser google app engine pour y arriver.
Peut-être que je peux essayer Nutch de le faire pour moi.
Dans quelle mesure est-ce faisable?
1) l'hébergement d'un robot sur google infrastructure 2) Nutch + app engine- sera-t-il possible?
il écrirait essentiellement un crawler à partir de zéro, n'est ce pas? – simpatico
@simpatico oui, plus ou moins. –