2009-07-26 7 views
0

J'ai un document contenant des liens ahref que je veux extraire. Le lien que je veux peut être identifié par une partie de l'URL à laquelle ils sont liés. Il y a d'autres liens qui sont similaires que je veux jeter.Utiliser ruby ​​et nokogiri pour sélectionner ahrefs basé sur une partie de l'URL

Les urls des liens que je veux sont au format

http://www.xxxxxxxxxxxxxxxxxxx.com/index.php?showtopic=44&hl=

Je veux rechercher des liens contenant le h1 =. Est-ce possible?

Répondre

2

Vous pouvez simplement faire un find normal sur le jeu de A-tags du document.

document.search('a').find {|link| link['href'].include? 'h1='}