Pour un programme de traduction, j'essaie d'obtenir un texte précis à 95% à partir d'un fichier HTML afin de traduire les phrases et les liens.Extraire tout le texte d'une page HTML sans perdre le contexte
Par exemple:
<div><a href="stack">Overflow</a> <span>Texts <b>go</b> here</span></div>
devrait me donner 2 résultats à traduire:
Overflow
Texts <b>go</b> here
Toutes les suggestions ou les logiciels commerciaux disponibles pour ce problème?
Vous aurez besoin de beaucoup plus d'informations sur vos besoins, car l'exemple que vous avez posté n'a pas de sens. Vous semblez traiter votre balise 'span' comme un élément de niveau bloc, mais ce n'est pas le cas. – ceejayoz