2009-02-18 11 views
0

La plupart des régions du monde utilisent des caractères non-ASCII. Mais certains idiomes utilisent des choses comme é, ö, á, ã, õ etc., qui peuvent être "converties" en ascii.Représenter des caractères non-ASCII dans les URLs donne un meilleur classement dans les moteurs de recherche?

Supposons que le titre du poste est:

Configuração é fácil!

Comment représenter que dans une URL?

www.myblog.com/post/1200/Configura__o-_-f_cil

Une meilleure representantion est

www.myblog.com/post/1200/Configuracao-e-facil

Wikipédia font que, comme dans http://en.wikipedia.org/wiki/Deja_vu

cela améliorera-t rang de page dans les moteurs de recherche?

Comment faire ça dans votre langue préférée?

+0

Vérifiez les articles liés: [http://stackoverflow.com/questions/331279/how-to-change-diacritic-characters-to-non- diacritiques-ones] (http://stackoverflow.com/questions/331279/how-to-change-diacritic-characters-to-non-diacritic-ones) [http://stackoverflow.com/questions/285228/how -to-convertir-utf-8-en-nous-ascii-en-java/285890 # 285890] (http://stackoverflow.com/questions/285228/how-to-convert-utf-8-to-us- ascii-in-java/285890 # 285890) – LicenseQ

+0

Alors, qu'allez-vous faire à propos des caractères chinois? Ou japonais kana? Ou les scharfes allemands S (ß)? Je pense que vous devez penser à ces choses avant d'implémenter cette fonctionnalité. –

+0

Peut-être que l'on peut simplement ignorer un caractère non-ascii convertible. –

Répondre

1

En Perl

Utilisation Text::Unidecode:

#!/usr/bin/perl -w 

use utf8; 
use Text::Unidecode; 
print unidecode(
    "áéíóú\n" 
); 

# That prints: aeiou