J'ai vue index web d'un dossier ...L'écriture d'un Python RegEx pour sélectionner un sous-ensemble d'éléments de liste en HTML
<ul><li><a href="/sustainabilitymedia/pics/s5/"> Parent Directory</a></li>
<li><a href="n150850_.jpg"> n150850_.jpg</a></li>
<li><a href="n150850_ss.jpg"> n150850_ss.jpg</a></li>
<li><a href="n150850q.jpg"> n150850q.jpg</a></li>
<li><a href="n150858_.jpg"> n150858_.jpg</a></li>
<li><a href="n150858_ss.jpg"> n150858_ss.jpg</a></li>
<li><a href="n150858q.jpg"> n150858q.jpg</a></li>
<li><a href="n150906_.jpg"> n150906_.jpg</a></li>
<li><a href="n150906_ss.jpg"> n150906_ss.jpg</a></li>
...
La liste est longue et ainsi de suite. Mon but est de saisir uniquement les éléments de la liste se terminant par _ss.jpg
afin que je puisse rendre mes résultats et les afficher correctement sur une page pour la présentation.
Je peux saisir la page avec BeautifulSoup mais à partir de là, je ne sais pas comment filtrer uniquement les éléments de la liste correspondant à un motif particulier. La page est derrière Basic Auth que j'ai résolu dans une question précédente concernant BeautifulSoup. Je suis heureux de ne pas l'utiliser non plus.
Des idées?
Je suppose qu'une autre façon d'aborder ce problème est en quelque sorte de saisir le nom de fichier avec OUT la différence, puis d'appliquer chaque différence pour générer des listes de chaque type (?) ... – Flowpoke