est là dans un double octet codant un caractère que l'un de ses octets a la même valeur des caractères ASCII '<' ou '>'? je ne peux pas semble trouver un, mais je dois vous assurer qu'il n'y a pas de tels cas, puisque ces caractères à double octet peut provoquer des erreurs sur parseurs html.caractère double octet dont l'un de ses octets est un '<' or '>'
Répondre
Dans tout codage? Presque certainement oui. En fait, il y a des centaines de caractères qui ont 0x3c ou 0x3e (les valeurs de <
et >
en ASCII) comme l'un des octets de leurs codages UTF-16, par exemple "☼", dont la représentation UTF-16le ressemble ASCII pour <&
. Mais il n'est pas approprié de fournir du HTML dans un jeu de caractères aléatoires sans spécifier également hors bande (par exemple via les en-têtes HTTP) le codage utilisé et éventuellement en utilisant d'autres signaux tels qu'une nomenclature (qui est requise pour HTML5) ou un spécificateur d'encodage XML (qui est nécessaire pour XHTML dans certains cas, comme dictée par la norme XML).
Et si l'encodage est spécifié correctement, alors il devrait y avoir aucun problème, parce que les personnages <
et >
sont spéciaux en HTML, pas octets 0x3c et 0x3E. Tout "analyseur" qui pense différemment est brisé.
bien, je veux dire dans tout encodage, mais, le caractère qui a le 0X3c devrait être un caractère valide dans une langue. ma question est s'il est possible de voir un html comme celui-ci: "du texte ... un caractère qui a 0X3e, mais un caractère valide dans une certaine langue" dans ce cas un analyseur pourrait soulever des problèmes majeurs – Oded
Et ma réponse est, lisez ma réponse. – hobbs