2010-03-31 12 views
12

J'ai une page mal formée à gratter, et j'ai eu du mal à obtenir le bon XPath pour YQL. Je peux gratter les champs individuels que j'ai besoin à l'aide, par exemple:YQL Comment utiliser un caractère générique dans XPath

//*[@id="cell_12345"] 

Mais ce que je dois vraiment faire est de récupérer tous les éléments qui commence par son ID cell_. Quelque chose comme:

//*[@id="cell_"*] 

Comment faire?

Aussi, si quelqu'un peut me diriger vers une bonne référence XPath, ce serait très utile.

Merci!

Répondre

27

Quelque chose comme

//*[starts-with(@id, 'ceil_')] 

devrait faire bien.

Comme pour une référence xpath, une fois que vous connaissez la syntaxe et l'axe, n'importe quelle ancienne référence de fonction devrait vous aider. C'était le premier google: http://www.w3schools.com/xpath/xpath_functions.asp

+0

Merci Paul. Cela marche. :) – user191688

+0

J'ai trouvé contains() a travaillé pour moi. merci Paul. –

+0

Une idée de comment fecth image et méta description de amazon.in/Seiko-Premier-Analog-Blue-Watch/dp/...? –