2010-11-28 30 views

Répondre

9

Vous pouvez utiliser Beautiful Soup. Je sais que vous avez dit sans un module tiers. Cependant, c'est un outil idéal pour analyser le HTML.

import urllib2 
from BeautifulSoup import BeautifulSoup 
page = BeautifulSoup(urllib2.urlopen("http://www.url.com")) 
page.findAll('img') 
+1

OK. On dirait que cela va aider beaucoup, donc je vais vérifier. Merci! – user377419

+1

Je pense que Russell a raté 'BeautifulSoup (page)' –

10

seulement en utilisant PSL

from html.parser import HTMLParser 
class MyParse(HTMLParser): 
    def handle_starttag(self, tag, attrs): 
     if tag=="img": 
      print(dict(attrs)["src"]) 

h=MyParse() 
page=open("index.html").read() 
h.feed(page) 
+1

Vous pouvez augmenter cela avec urllib pour ouvrir une page web et télécharger les images. –

+1

Pour moi cela ne fonctionne qu'avec "from HTMLParser import HTMLParser" – nvrandow