2009-07-21 12 views
4

J'essaie de créer un programme qui lit un fichier .docx et publie le contenu sur un blog/forum pour un usage personnel. J'ai finalement compris comment utiliser libcurl pour faire (ce que je pensais) était la partie la plus difficile du programme. Maintenant, je dois juste lire le fichier .docx, mais je suis tombé sur un problème. Je n'arrive pas à trouver de documentation sur la façon de le faire. Des idées?Lecture .docx en C++

Répondre

8

La méthode la plus simple consiste à utiliser Word pour cela. Il a des limitations sur les licences.

La question SO Creating, opening and printing a word file from C++ a de bonnes références.

Edit:

Selon ces questions/réponses peuvent décompressez le fichier Open XML et traiter le fichier XML directement:

Si vous utilisez il .NET sont plus (C#) questions à lire:

+0

J'ai examiné cela, mais depuis .docx est Open XML je me suis dit qu'il y aurait un moyen sans avoir de mot impliqué. – mcFreid

1

Si vous voulez rester sur le monde open source, OpenOffice 3 devrait être en mesure de traiter les fichiers .docx. Il y a un projet pour implémenter une API pour de nombreuses langues, je ne sais pas vraiment à quel point c'est complet ou complexe.

Il existe un script en PHP qui peut convertir de .docx en texte brut. Autrement dit, si vous n'avez pas peur que tous les docs sont en russe). Cela pourrait être une autre option (déclencher le script php avec un appel système et analyser les résultats d'un fichier)