2010-12-13 29 views
0

Bonjour à tous,Obtenir des informations mises à jour à partir d'autres sites et les publier sur votre site en PHP

J'ai un site existant construit. Je me demandais, comment mon site peut-il se mettre à jour automatiquement lorsqu'un autre site web est mis à jour? Cela signifie essentiellement que mon site existant obtiendra des informations comme le coût, la description, les images de l'autre site lors de la mise à jour.

Je réfléchissais aux services Web, mais l'autre site ne l'a pas.

S'il vous plaît aviser!

Merci!

+0

Je suppose que vous ne pouvez rien changer sur * l'autre * site, juste sur le vôtre? – deceze

+0

Est-ce que l'autre site possède une API de quelque type que ce soit? –

+0

@deceze - Yup ne peut rien changer – aHaH

Répondre

2

Si l'autre site n'a pas d'API, votre seule option est le scrapage de page, c'est-à-dire le téléchargement du code HTML et son analyse pour extraire les informations souhaitées.

S'ils ont une structure de page qui ne change pas souvent, c'est généralement fiable.

Vous voudrez probablement utiliser PHP DomDocument pour extraire l'information.

Généralement, les gens n'aiment pas parce que les outils mal conçus peuvent taxer leurs ressources système, car générer une page HTML entière demande plus de ressources que de générer une réponse API.

La mise en page est assez répandue, même si certaines personnes la déconseillent. Il peut être refusé par les conditions d'utilisation d'un site, pouvant avoir des implications juridiques. Ou, votre site cible peut ne pas avoir de problème avec cela. Il y a bien sûr de grandes entreprises construites sur le raclage de la page (voir "Google").

+0

Heh Mark, merci beaucoup! Je vais essayer ça! – aHaH

+0

Hrm ... Je suppose que Google * serait * considéré comme un grattoir de page. Je n'y ai jamais pensé comme ça avant. Je pense que je serais plus préoccupé par les gens qui volent mon contenu que de taxer mon serveur. – mpen