Mon application Web stocke les segments d'URL dans une base de données. Ces segments d'URL sont basés sur le contenu soumis par l'utilisateur.Codage/classement des caractères appropriés pour stocker les URL?
Quel collation dois-je utiliser pour les chaînes de caractères qui apparaîtront dans les URL?
Mon hypothèse est ASCII générale CI basée sur cette question (?): Which characters make a URL invalid?
Alors, y a-t-il un facteur de performance pour utiliser, disons, UTF-8 General CI au lieu d'un encodage "plus simple" qui pourrait stocker les mêmes données (ASCII General CI)? – Dolph
Je ne suis pas un gourou de la base de données, donc je ne peux pas dire avec certitude, mais la logique me dit non, car les caractères que vous mentionnez occupent un octet dans les classements ASCII et UTF-8 standard. Je suis sûr que les frais généraux * doivent être minuscules. –
Je crois que l'encodage insensible à la casse (** ascii_general_ci **) est plus lent que ** ascii_bin **, car le moteur db doit convertir les deux valeurs dans le même cas avant d'effectuer une comparaison réelle. – vitsoft