Actuellement j'utilise Mechanize et la méthode get() pour obtenir chaque site, et vérifier avec la méthode content() chaque page principale pour quelque chose. J'ai une connexion ordinateur + 10Mbit très rapide, et encore, il a fallu 9 heures pour vérifier les sites 11K, ce qui n'est pas acceptable, le problème est, la vitesse de la fonction get(), qui, évidemment, doit obtenir la page , existe-t-il un moyen de le rendre plus rapide, peut-être de désactiver quelque chose, car j'ai seulement besoin de vérifier la page principale html.Visiter un demi-million de pages avec Perl
Merci,
Parfait !!!! Merci beaucoup!. Je ne savais pas que vous pouvez multithread avec Perl, jamais vraiment cherché ce type de fonctionnalité lors de l'utilisation de Perl, il est vraiment utile dans ce cas. – snoofkin
@soulSurfer: Les fourchettes et les fils sont des choses différentes. –
Eh bien, mon erreur. Je voulais dire des processus. – snoofkin