2010-10-17 9 views
0

C'est une semaine que j'essaie de trouver une réponse à ma question, j'apprécierais que quelqu'un puisse vous aider. J'ai une liste de chaînes (à l'origine la liste des séquences qui peuvent être vues comme une liste de chaînes) et je voudrais trouver un modèle (qui est une chaîne elle-même) avec des chaînes de cette liste, y at-il une bibliothèque java qui puis-je utiliser ou est-il un outil (comme weka, qui ne fait pas ça!) qui peut m'aider ??Chaîne/Sequence Pattern Mining

+0

Voulez-vous une correspondance exacte ou approximative? –

+0

& je devrais déjà noter que nous n'avons aucun modèle prédéfini, je veux détecter un modèle qui se reproduit dans la liste –

+0

que voulez-vous dire d'exact ou approximatif? –

Répondre

2

Semble que vous voulez trouver le longest common subsequence de ces chaînes. C'est un problème algorithmique bien connu qui est généralement résolu en utilisant la programmation dynamique. Voir here pour diverses implémentations en plusieurs langues.

0

Si vous voulez trouver des motifs se produisant fréquemment dans un ensemble de séquences, alors vous pouvez essayer "l'extraction séquentielle séquentielle" ou "les algorithmes séquentiels d'exploration de règles". Il existe plusieurs implémentations de ces algorithmes dans mon SPMF Java open-source data mining library.