2010-12-14 80 views
0

Je suis suivi des changements dans une page Web en utilisant Ruby. Après avoir supprimé toutes les balises html et lignes vides, j'obtiens un tableau de lignes qui doit être vérifié pour les ajouts/suppressions en supposant qu'il peut y avoir des répétitions. Pourriez-vous recommander un bon bijou si cela a déjà été fait?Comparez deux versions d'un fichier texte et trouvez des ajouts/suppressions avec Ruby?

Je pourrais rendre les lignes de tableau uniques et ensuite le problème est évité. Mais que faire si j'ai besoin de suivre les lignes répétées aussi bien par rapport à leur position dans le texte?

Répondre

2

Cela ressemble à un cas d'école où vous voudriez utiliser l'algorithme Diff.

Il y a un gem 'diff', mais pour être honnête je ne l'ai jamais utilisé: http://rubygems.org/gems/diff