2010-12-09 23 views
5

Quelle est la bonne façon de faire correspondre un identifiant de C#, en particulier une propriété ou nom de champ, en utilisant les modèles .Net Regex?match C# Identifier Unicode en utilisant Regex

Contexte. Je l'habitude d'utiliser l'ASCII centrée sur @ "[_ a-zA-Z] [_ a-zA-Z0-9] *" Mais maintenant les caractères majuscules et minuscules unicode sont légitimes, par exemple "AboöДЖem". Comment dois-je les inclure dans le motif?

Merci, Max

Répondre

1

Est-ce que le problème est résolu par les classes prédéfinies dans regex \ w correspondra à öД.

+1

Merci. Maintenant, je peux faire une programmation mixte en glagolitique et en hiéroglyphes. ;) –

+1

Vous ne pouvez pas simplement utiliser @ "\ w +" pour faire correspondre un identifiant - il inclurait des mots commençant par des nombres - par ex. il correspondrait sur "12abc" qui est un identifiant invalide. Je propose @ "[\ w- [0-9]] \ w *" comme une solution à cela. –

+0

-1 parce que la réponse est fausse. –

5

Selon http://msdn.microsoft.com/en-us/library/aa664670.aspx, et en ignorant le mot-clé et unicode-évasion-séquence choses,

@?[_\p{Lu}\p{Ll}\p{Lt}\p{Lm}\p{Lo}\p{Nl}][\p{Lu}\p{Ll}\p{Lt}\p{Lm}\p{Lo}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}\p{Cf}]* 
+0

Je pense que vous pouvez simplifier '\ p {Lu} \ p {Ll} \ p {Lt} \ p {Lm} \ p {Lo} 'juste' '\ p {L}'. Idem pour certaines des autres classes de char utilisées ici. Je suppose que si c'est ce que Microsoft a mis dans leurs standards, il pourrait être plus simple de faire la même chose. – Rich

7

est ici une version qui prend en compte les premiers chiffres non admissibles:

^(?:((?!\d)\w+(?:\.(?!\d)\w+)*)\.)?((?!\d)\w+)$ 

Et voici quelques essais dans PowerShell:

[regex]$regex = '(?x: 
    ^      # Start of string 
    (?: 
     (     # Namespace 
      (?!\d)\w+  # Top-level namespace 
      (?:\.(?!\d)\w+)* # Subsequent namespaces 
     ) 
     \.     # End of namespaces period 
    )?      # Namespace is optional 
    ((?!\d)\w+)    # Class name 
    $      # End of string 
)' 
@(
    'System.Data.Doohickey' 
    '_1System.Data.Doohickey' 
    'System.String' 
    'System.Data.SqlClient.SqlConnection' 
    'DoohickeyClass' 
    'Stackoverflow.Q4400348.AboöДЖem' 
    '1System.Data.Doohickey' # numbers not allowed at start of namespace 
    'System.Data.1Doohickey' # numbers not allowed at start of class 
    'global::DoohickeyClass' # "global::" not part of actual namespace 
) | %{ 
    ($isMatch, $namespace, $class) = ($false, $null, $null) 
    if ($_ -match $regex) { 
     ($isMatch, $namespace, $class) = ($true, $Matches[1], $Matches[2]) 
    } 
    new-object PSObject -prop @{ 
     'IsMatch' = $isMatch 
     'Name'  = $_ 
     'Namespace' = $namespace 
     'Class'  = $class 
    } 
} | ft IsMatch, Name, Namespace, Class -auto 
+0

Est-ce que cela permet de mener le trait de soulignement? –

+1

@ rory.ap C'est le cas. (permettre un soulignement principal) –