UCS2 plus facile à utiliser dans Visual C++, que le codage UTF. Quelles langues je ne peux pas supporter dans l'encodage UCS2?UCS2 vs UTF. Quelles langues ne peuvent pas être affichées dans l'encodage UCS2?
4
A
Répondre
4
Rien ne vous êtes susceptible de se soucier ou, plus au point, avoir des polices pour. UCS2 vous donne le plan multilingue de base; vous trouverez un aperçu des plans attribués sur le site Unicode
- 0 - Basic Multilingual Plane
- 1 - Supplementary Multilingual Plane (symboles anciens, Klingon, etc.)
- 2 - Supplementary Ideagraphic Plane (extensions CJC de idéogrammes unifiés)
- 3 - Tertiary Ideographic Plane (anciens caractères chinois)
- 14 - Supplementary Special-Purpose Plane (caractères tag et variations -)
Bien sûr, si vous avez vraiment le support UTF-16, vous pouvez accéder à tout cela, mais si vous demandez si vous pouvez ignorer ceux-là, en pratique, probablement oui.
1
Le site comprend un Unicode.org index of code blocks in code order à partir de laquelle vous pouvez voir que d'Unicode 6.0, le plan 1 comprend:
- syllabaire linéaire B
- linéaire B idéogrammes
- Numbers Aegean
- Vieil Italique
- Gothique
- 0garage
- Deseret
- Shavian
- Osmanya
- Syllabary Chypre
- symboles musicaux byzantines
- symboles musicaux
- Tai Xuan Jing Symboles
- mathématique alphanumériques symboles
et plan 2 comprend:
- idéogrammes unifiés CJC Extension B
- idéogrammes de compatibilité CJC Supplément
- Mots
- Variation Selectors Supplément
1 Je ne suggérerais pas d'ignorer les plans non-BMP comme par exemple pour le japonais ces caractères ne sont pas si rares dans les noms et ignorer les non-BMP est généralement très mauvais et jamais recommandé. – Artyom
@Artyom OK, merci - Je suppose que ce sont les caractères dans le SIP alors? Oui, je suis d'accord qu'il est préférable de supporter tout correctement mais sans support de police pour le SIP (et encore je n'en ai jamais vu) si vous ignorez la zone d'extension UTF-16 alors vous vous retrouverez avec deux caractères inconnus plutôt qu'un affiché qui ne semble pas être un compromis terrible pour le temps de développement supplémentaire. – Rup
UCS-2 est un codage antémillénaire ancienne et embarrassante de 1/17ème du répertoire Unicode. Utilisez uniquement un encodage UTF: tout le reste est juste cassé. UTF-8 est habituellement meilleur pour l'espace requis, UTF-32 est habituellement meilleur pour l'adressabilité directe. UTF-16 est le pire des deux mondes, parce que les gens le confondent avec UCS-2. – tchrist