Codage/classement des caractères appropriés pour stocker les URL?

Mon application Web stocke les segments d'URL dans une base de données. Ces segments d'URL sont basés sur le contenu soumis par l'utilisateur.Codage/classement des caractères appropriés pour stocker les URL?

Quel collation dois-je utiliser pour les chaînes de caractères qui apparaîtront dans les URL?

Mon hypothèse est ASCII générale CI basée sur cette question (?): Which characters make a URL invalid?

Source

2010-02-26 Dolph

Il n'a pas vraiment d'importance dans la mesure où je peux voir. Les caractères valides dans une URL sont représentés dans n'importe quel jeu de caractères que je connais, et je n'utiliserais pas de classements différents entre les tables et les colonnes - vous obtiendrez des problèmes de "mélange illégal de classements" lors de toute tentative de type d'opération cross-column ou cross-table (voir mon problème récent here). Corrigez-moi si je me trompe bien sur.

Source

2010-02-26 19:32:15

Alors, y a-t-il un facteur de performance pour utiliser, disons, UTF-8 General CI au lieu d'un encodage "plus simple" qui pourrait stocker les mêmes données (ASCII General CI)? – Dolph

Je ne suis pas un gourou de la base de données, donc je ne peux pas dire avec certitude, mais la logique me dit non, car les caractères que vous mentionnez occupent un octet dans les classements ASCII et UTF-8 standard. Je suis sûr que les frais généraux * doivent être minuscules. –

Je crois que l'encodage insensible à la casse (** ascii_general_ci **) est plus lent que ** ascii_bin **, car le moteur db doit convertir les deux valeurs dans le même cas avant d'effectuer une comparaison réelle. – vitsoft

Codage/classement des caractères appropriés pour stocker les URL?

Répondre

Questions connexes