Je souhaite supprimer les URL d'une chaîne et les remplacer par leurs titres du contenu d'origine.Python: remplace les URLs par les noms de titre d'une chaîne
Par exemple:
mystring = "Ah I like this site: http://www.stackoverflow.com. Also I must say I like http://www.digg.com"
sanitize(mystring) # it becomes "Ah I like this site: Stack Overflow. Also I must say I like Digg - The Latest News Headlines, Videos and Images"
Pour remplacer url avec le titre, je l'ai écrit snipplet:
#get_title: string -> string
def get_title(url):
"""Returns the title of the input URL"""
output = BeautifulSoup.BeautifulSoup(urllib.urlopen(url))
return output.title.string
Je dois en quelque sorte d'appliquer cette fonction aux chaînes où il attrape les urls et convertis aux titres via get_title.
et votre question? – msw
J'ai mis à jour la question, désolé :) – Hellnar