Je veux utiliser PHP (éventuellement avec Curl/XPath?) Pour extraire des données de pages Wikipedia. Quel serait le meilleur moyen d'y parvenir? J'utiliserai CakePHP pour ce projet, bien qu'il me suffise de comprendre comment le faire fonctionner en premier.Extraction de données de Wikipedia JSON ou XML avec PHP
1
A
Répondre
1
Vous pouvez chercher des données avec cette fonction PHP qui utilise CURL:
http://www.barattalo.it/2010/08/29/php-bot-to-get-wikipedia-definitions/
0
Cela a déjà été demandé, voir Is there a Wikipedia API? où quelques options sont listées pour interagir avec Wikipedia.
0
Vous pouvez télécharger des instantanés de la base de données wikipedia et gérer cela dans l'espace disque. Ce faire par alternative peut-être une meilleure solution.
instantanés de base de données Wikipédia, vous pouvez trouver à l'adresse: http://dumps.wikimedia.org/
0
Plusieurs options: (recherche sur Google pour eux)
1. DBPedia
2. Freebase Wikipedia Extracs (WEX)
3. Il y a lien Wikipedia ensemble de données ainsi