12
J'essaie le code suivant avec un fichier HTML particulierBelle erreur encode soupe Unicode
from BeautifulSoup import BeautifulSoup
import re
import codecs
import sys
f = open('test1.html')
html = f.read()
soup = BeautifulSoup(html)
body = soup.body.contents
para = soup.findAll('p')
print str(para).encode('utf-8')
Je reçois l'erreur suivante:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 9: ordinal not in range(128)
Comment puis-je débugger?
Je n'obtiens aucune erreur lorsque je supprime l'appel à la fonction d'impression.