Je dois prendre une chaîne de caractères asiatiques mixtes (pour l'instant, supposons seulement kanji chinois ou japonais kanji/hiragana/katakana) et "Alphanumérique" (ie , Enlgish, French), et comptez-le de la façon suivante:en utilisant javascript, comment puis-je compter un mélange de caractères asiatiques et mots anglais
1) comptez chaque caractère asiatique comme 1; 2) comptez chaque MOT alphanumérique comme 1;
quelques exemples:
株式会社 MyCompany = 4 caractères + 1 mot = 5 au total 株式会社 Afficher la イ コ = 7 caractères
ma seule idée est à ce jour à utiliser:
var wordArray=val.split(/\w+/);
puis de vérifier chaque élément pour voir si son contenu est alphanumérique (comptez donc 1) ou non (prenez donc la longueur du tableau). Mais je ne pense pas que ce soit vraiment très intelligent et le texte compté pourrait être jusqu'à 10.000 mots, donc pas très rapide.
Des idées?
Vous ne pouvez pas distinguer un caractère asiatique d'autres caractères codés sur plusieurs octets. – shinkou
Bien sûr, vous pouvez. Ils ont des valeurs différentes, après tout. – Annabelle
Merci à tous. Nous avons en fait choisi: var charArray = val.match (/ \ w + | [^., \ UFF10- \ uFF19, \ uFF9E, \ uFF9F]/g); alert (charArray.length); Nous n'étions pas intéressés par le nombre de mots asiatiques, nous avions besoin du nombre de caractères plus le nombre de mots alphanumériques. Nous aurons besoin d'ajouter quelques codes d'exclusion, je pense, mais c'est un bon début. – user224513