Je voudrais vérifier périodiquement ce que les sous-domaines sont répertoriés par Google.Résultats de la recherche Google
Pour obtenir la liste des sous-domaines, type I « site: example.com » dans la case de recherche Google - cette liste tous les résultats sous-domaine (plus de 20 pages pour notre domaine).
Quelle est la meilleure façon d'extraire uniquement l'URL des adresses renvoyées par le « site: example.com » recherche?
Je pensais à écrire un petit script python qui va faire la recherche ci-dessus et regex les URL des résultats de recherche (répéter sur toutes les pages de résultats). Est-ce un bon début? Pourrait-il y avoir une meilleure méthodologie?
Cheers.
merci pour cela – Roch
y a-t-il quelque chose comme ça pour JavaScript? – pcx
je viens de googlé "javascript racler écran", mais [pjscrape] (http://nrabinowitz.github.com/pjscrape/#quickstart) semble prometteur. – danneu