tout en utilisant beautifulsoup pour analyser une table en html tous les rangs commence parComment puis-je empêcher une belle soupe de sauter des rangs pendant l'analyse?
<tr class="row_k">
au lieu d'une balise tr sans classe
Exemple HTML
<tr class="row_k">
<td><img src="some picture url" alt="Item A"></td>
<td><a href="some url"> Item A</a></td>
<td>14.8k</td>
<td><span class="drop">-555</span></td>
<td>
<img src="some picture url" alt="stuff" title="stuff">
</td>
<td>
<img src="some picture url" alt="Max llll">
</td>
</tr>
<tr>
<td><img src="some picture url" alt="Item B"></td>
<td><a href="some url"> Item B</a></td>
<td>64.9k</td>
<td><span class="rise">+165</span></td>
<td>
<img src="some picture url" alt="stuff" title="stuff">
</td>
<td>
<img src="some picture url" alt="max llll">
</td>
</tr>
<tr class="row_k">
<td><img src="some picture url" alt="Item C"></td>
<td><a href="some url"> Item C</a></td>
<td>4,000</td>
<td><span class="rise">+666</span></td>
<td>
<img src="some picture url" title="stuff">
</td>
<td>
<img src="some picture url" alt="Maximum lllle">
Le texte que je souhaite extraire est 14.8k, 64.9k et 4.000J'ai l'impression que ce code est mal écrit. Existe-t-il un outil plus flexible que je puisse utiliser tel qu'un analyseur XML? que quelqu'un pourrait suggérer.
toujours ouvert à toutes les réponses qui utilisent encore beautifulsoup.
Ce serait plus facile si vous aviez inclus plus de html. Je pense que vous dites qu'il y a une balise d'ancrage dans le corps d'une table et la colonne suivante dans la table après l'ancre a les données que vous voulez. – PyNEwbie
J'ai fait un échantillon. J'utilise beautifulsoup pour faire cela mais le problème est que toutes les autres colonnes de la table ont tr class = "row_k" donc il l'ignore et ne me donnera pas l'information des balises tr. Je vais mettre à jour ma question. – Pevo