J'ai cherché un bon moyen d'implémenter ceci. Je travaille sur un simple crawler de site Web qui ira autour d'un ensemble spécifique de sites Web et explorera tous les liens mp3 dans la base de données. Je ne veux pas télécharger les fichiers, il suffit d'explorer le lien, de les indexer et de pouvoir les rechercher. Jusqu'à présent, pour certains des sites, j'ai réussi, mais pour certains, ils utilisent des redirections d'URL et des trucs qui confond le crawler ..MP3 link Crawler
des idées? Comment beemp3.com indexe-t-il tous ces liens?
grâce
cela ne recherchera pas les mp3, mais uniquement les pages contenant la liste des répertoires, y compris les fichiers mp3. –
ouais et ce n'est pas vraiment rampant non plus .. je veux voir si un script peut faire le tour et indexer X nombre de sites uniquement pour les fichiers mp3. Merci pour la réponse si :) –