2010-12-13 66 views

Répondre

1

Identifier ou détecter le codage de caractères et convertir les données en UTF-8 si nécessaire.

Pour HTML (par exemple text/html) il y a three ways to specify the character encoding:

  1. HTTP paramètre "charset" dans un champ "Content-Type".
  2. Une déclaration META avec "http-equiv" défini sur "Content-Type" et une valeur définie pour "charset". L'attribut charset est défini sur un élément qui désigne une ressource externe.

Si aucun d'entre eux est présent, vous pourriez faire un peu renifler contenu ou de passer à un codage de caractères par défaut (par exemple ISO 8859-1).

Si le codage de caractères identifié/détecté n'est pas UTF-8, vous pouvez convertir les données en UTF-8 avec iconv ou mb_convert_encoding.