J'utilise BeautifulSoup pour extraire les balises TableData d'une table. Les TD ont une classe de 'a', 'u', 'e', 'disponible-indisponible' ou 'indisponible-disponible'. (Oui, je sais que les noms de classes originales mais bon ...)modèle Regex avec des exceptions Python (toujours manipuler)
Voici un exemple:
<tr>
<td class="u">4</td>
<td class="unavailable-available">5</td>
<td class="a'>6</td>
<td class="available-unavailable">7</td>
<td class="u">8</td>
...
Je travaille avec une ligne qui intègre un re.compile():
tab = [int(tag.string) for tag in soup.find('table',{'summary':tableSummary}).findAll("td", attrs = {"class": re.compile('\Aa')})]
je besoin d'extraire tout le td est avec un nom de classe « a » et «indisponible-disponible. J'ai essayé quelques assertions négatives-lookahead mais sans beaucoup de chance. Je les légendes valeur regex qui peut produire la regex correcte ...
Ha ha! Fait cela je pense. – timbo
Avez-vous vraiment html avec des guillemets dépareillées comme '" a'' entrée montre? – PaulMcG