2010-09-11 8 views
0

En utilisant ce lien http://www.yellowpages.ca/search/?stype=si&what=sh&where=Ottawa,+ON&x=0&y=0 et en demandant à HtmlAgilityPack d'extraire à la fois l'adresse et le nom de lieu ("// span [@ class = 'listingTitle'] | // div [@class (.) = 'adresse']/texte() [normaliser l'espace] »), je peux obtenir une liste des noms de lieux et adresses comme celle-ci dans un richtextbox:Supprime les lignes de la zone richtext qui tombent sous la condition

  1. jh machines ryder limitée
  2. stockage de proximité ltd 3344 rideau
  3. rd, gloucester, on, k1g3n4
  4. intérieurs de cuisine 146 colonnade rd,
  5. nepean, sur, k2e7y1

La première ligne est mauvaise, il ne marche pas avoir une adresse. Les lignes 2 et 4 sont bonnes, elles ont des adresses. Donc ce que je pouvais faire est:

Vérifiez chaque ligne,

si la ligne suivante ne marche pas « contient les numéros + sur » Supprimer puis la ligne. Cela me laissera avec PlaceNames suivi par des adresses, que je vais ensuite diviser chaque autre ligne dans une nouvelle zone de texte, (donc j'ai une zone de texte avec des noms de lieux, et une autre avec des adresses).

J'espère que je me suis fait clair.

-dd,

Répondre

0

Je pense que vous pouvez également ajouter une condition dans la Xpath pour vérifier si le texte « ON, » est là. Ainsi, la liste est pré-filtrée.