Puis-je ouvrir des formats de fichier avec Word interop que Microsoft Word lui-même prend en charge?Lire des documents dans .NET
Ma tâche semble très simple, j'ai besoin de lire du texte, uniquement du texte, à partir de tout type de documents couramment utilisés (pour comparer les documents en fonction du contenu). Y at-il un moyen que je peux faire cela plus facilement que le Word Iterop mentionné ci-dessus? Existe-t-il des bibliothèques libres pour ce faire? Ou pour ouvrir tous les types de documents (.doc, .docx, .pdf, .rtf, docs openoffice, etc.)? Je suis occupé à chercher, mais je n'ai pas encore trouvé beaucoup de solutions, et je ne peux pas me permettre d'étudier les spécifications de 800 pages de tous les formats.
P.S .: Manipuler pdf séparément est OK, en plus d'avoir des bibliothèques pour tous les types.