2009-05-26 13 views

Répondre

2

Si vous cherchez à obtenir un ensemble spécifique d'articles, alors vous pourriez être en mesure d'utiliser la page Exporter (http://en.wikipedia.org/wiki/Special:Export) pour obtenir un vidage XML des pages concernées; Vous pouvez exporter plusieurs pages à la fois, bien que vous souhaitiez espacer vos demandes.

Vous pouvez importer les vidages XML dans MediaWiki en utilisant Special:Import ou l'un des scripts d'importation dans maintenance/.

+0

Inclut-il des images? Sinon, existe-t-il une méthode automatique pour obtenir des images? – Paradius

+0

Il n'inclut pas les images à cause des droits d'auteur. – l2mt

+0

Il n'inclut pas les images car il s'agit d'un vidage XML direct des informations de page, des métadonnées de révision et du texte, et le format n'a pas été étendu pour inclure les données d'image binaire. Strictement parlant, c'est une limitation technique. En théorie, vous pouvez importer un texte contrevenant aux droits d'auteur et le logiciel ne l'arrêtera pas. – Rob

2

La base de données Wikipedia est disponible pour download

0
+0

Sur SO, lors de la fourniture d'un lien vers un site externe, il est souvent préférable de donner au moins un résumé de haut niveau de ce que sont les contenus dans le cas où le lien externe change ou est supprimé. Les futurs visiteurs de SO auront encore * quelque chose * à travailler avec. – Fluffeh