2010-07-26 10 views

Répondre

4

Vous pouvez établir une connexion TCP sur le port 80, puis créer manuellement la requête GET pour la recherche google. Vous devrez ensuite analyser le code HTML résultant pour extraire les résultats de la recherche. Pour plus d'informations, consultez RFC 2616.

-

Dev, je ne sais pas ce langage de programmation que vous utilisez, il est donc difficile pour moi de donner un exemple, mais le concept est facilement démontrée en utilisant un client Telnet. Vous pouvez utiliser telnet pour se connecter à Google sur le port 80.

telnet www.google.com 80

A partir de là, vous pouvez saisir vos demandes. Si nous faisons une recherche rapide Google dans votre navigateur pour quelque chose et vérifiez l'URL, nous voyons quelque chose le long des lignes de

http://www.google.com/search?q=stack+overflow

Cela nous donne la forme générale de la demande de recherche, et de ce modèle, nous pouvons construire n'importe quelle requête en remplaçant simplement "stack + overflow" par notre requête désirée. Donc, retour dans le client telnet, nous pouvons saisir une requête GET, après la connexion, en tapant

GET http://www.google.com/search?q=stack+overflow HTTP/1.0 puis appuyez sur Entrée deux fois, pour signifier la fin de la requête GET, en tant que double sauts de ligne indiquent la fin de la demande. Il y a beaucoup de différentes options pour les requêtes GET, qui varient en fonction de vos besoins. Ces options sont détaillées dans la RFC.

Après avoir appuyé deux fois sur Entrée, vous devriez voir html. C'est le html de la page de résultats de recherche google qui serait normalement rendu dans votre navigateur Web.

Espérons que cela aide.

+0

une démo ou un exemple? –

+0

Cet ancien article pourrait être utile: ** [Obtenir les résultats Google dans un fichier texte] (http://goohackle.com/get-google-results-in-a-text-file/) **. Il n'y a pas un exemple de code mais des informations intéressantes sur la façon de le faire et aussi quelques très bons conseils dans les commentaires. – Lix