2009-03-30 14 views
1

Je cherche un moyen d'identifier le texte cité dans les courriels. L'objectif est d'ajouter quelque chose dans la ligne de la fonctionnalité "Afficher le texte cité" de Gmails à mon application web qui implique un robot gestionnaire de messagerie.Outil existant ou code pour identifier le texte cité dans les courriels

Il existe des questions similaires sur stackoverflow, mais elles demandent un algorithme. Je pourrais l'implémenter si je le devais, mais je préférerais grandement une solution éprouvée.

Exigences:

1) Prise en charge HTML et des e-mails en texte brut

2) Fonctionne sur le fil complet (qui est, il a le texte original de comparer le texte cité contre, pas besoin de deviner)

3) Poignées ajouts liés à la quote-communs tels que « Le 10 mai 2008 à 18:35 Brandon a écrit: »

Une bibliothèque python serait idéal super magie génial, mais je ne vous attendez pas pour avoir cette chance. Un outil de ligne de commande simple qui peut le faire serait assez proche de l'idéal, mais je ne m'attends pas à cela aussi chanceux. Je m'arrêterais volontiers sur une bonne implémentation bien connue d'un client de messagerie open source qu'il serait raisonnablement possible d'extraire dans un outil.

Est-ce que quelqu'un a une suggestion quel serait mon meilleur pari?

Je suis un peu surpris qu'il n'y ait pas de "kit de construction de bot de gestionnaire d'email".

Répondre

2

Juste suite à un courriel que j'ai reçu concernant cette question.

Sup a un peu de logique pour extraire cela. J'ai porté les fonctions pertinentes sur Python et je l'ai modifié pour mes besoins.

Sup est client de messagerie basé sur un terminal écrit en Ruby: http://sup.rubyforge.org/

+0

Avez-vous arrivé à publier votre port? – pfctdayelise

+2

http://gist.github.com/504232 –

+0

Aussi disponible: https://github.com/github/email_reply_parser –