2010-09-18 12 views
1

Je fais une application vb.net et je suis en train d'utiliser htmlagilitypack. J'ai besoin hap pour obtenir les liens de profil de yellowpages.caObtenir des liens de la page Web vers la zone de texte (vb.net + html agility pack)

Voici un exemple du html:

<a href="/bus/Ontario/Brampton/A-Safe-Self-Storage/17142.html?what=af&amp;where=Ontario&amp;le=1238793c7aa%7Ccf8042ceaa%7C2ae32e5a2a" onmousedown="utag.link({link_name:'busname', link_attr1:'in_listing_left', listing_link:'18063_lpp|busname_af', headdir_link:'01252110|092202,00891210|092202,00184200|092202', position_address:'l_y', position_number:'l_6'});" id="mapLink5" title="See detailed information for A Safe Self Storage"><span class="listingTitle">A Safe Self Storage</span></a> 

C'est le lien, «/bus/Ontario/Brampton/A-Safe-Auto- Stockage/17142.html? What = af & où = Ontario & le = 1238793c7aa% 7Ccf8042ceaa% 7C2ae32e5a2a ".

Un petit coup de pouce serait apprécié.

Répondre

2

Vous devez examiner la documentation.

Voici un échantillon de la lecture d'un fichier HTML stocké sur le PC

HtmlDocument doc = new HtmlDocument(); 
doc.Load("file.htm"); 
foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) 
{ 
    HtmlAttribute att = link["href"]; 
    att.Value = FixLink(att); 
} 
doc.Save("file.htm"); 

Utilisez un convertisseur pour convertir en VB.NET. Cette ligne est la clé

lien HtmlNode dans doc.DocumentElement.SelectNodes ("// a [@href"])

Encore une fois, vous avez besoin de lire la documentation et comprendre comment analyser le DOM HTML.

Here est un exemple de chargement et d'analyse d'une page Web. Vous devrez utiliser "HttpWebRequest" pour diffuser la page Web à partir d'un serveur Web.

Autres lectures here