2010-09-11 23 views
1

Je suis en train d'analyser les réponses de Yahoo RSS - http://answers.yahoo.com/rss/allq Le problème est que les titres ontRegexp pour simplifier Yahoo Answers RSS Titre

[Catégorie]: Question ouverte:

dans chaque titre que je fais Je ne veux pas ... Je veux écrire une regexp pour supprimer ce ...

tout ce que nous pouvons faire pour supprimer toutes les lettres dans le début [et le premier: devrait le faire.

il ya un espace après le : aussi, nous devons supprimer cela aussi.

Merci pour cela à l'avance, je vais aussi essayer de trouver une solution moi-même.

Répondre

1

Avez-vous envisagé d'utiliser le service YQL de Yahoo pour analyser ce flux (ou d'autres pages Web)?

Ils ont déjà des exemples de requêtes pour vous d'obtenir des données avec Yahoo Réponses:

(Juste un FYI au cas où vous n'êtes pas au courant de ce service pratique Je l'utilise au lieu de gratter l'écran avec les RegEx.)

+0

Génial. Merci beaucoup! Les deux réponses sont superbes! – foxybagga

+0

Merci pour le conseil John. C'était utile! – foxybagga

1

l'expression rationnelle suivante doit faire le travail:

^\[.*?: 

Exemple d'utilisation en C#:

string resultString = Regex.Replace(subjectString, @"^\[.*?: ", ""); 

Ce qu'il fait est de commencer avec un support [ et prendre des caractères jusqu'à ce qu'il correspond à un : et prenez l'espace suivant.

Espérons que cela aide, Tom.

Merci @cmptrgeekken pour pointer la chose non gourmande!

+1

Peut-être que vous voulez faire ce '. *?', Donc c'est une correspondance non-gourmande. Sinon, si le titre lui-même a un deux-points, cette regex enlèverait tout jusqu'au deuxième colon – cmptrgeekken

+0

merci de le signaler! – RoXX