2009-06-04 10 views
2

Il y a quelques jours, j'ai vu que happn.in offrait désormais un service où les tweets (messages sur twitter.com) sont regroupés et analysés pour les zones locales. Pour plusieurs villes, ils vous donnent une liste de termes tendances.Twitter: Messages locaux via API

Je sais que vous ne pouvez pas exactement savoir comment ils font cela, mais peut-être que vous pouvez m'aider, cependant: Comment puis-je faire cela aussi? J'ai plusieurs approches. L'un d'entre eux est-il utile?

  • APPROCHE 1

Utilisez le REST API public_timeline et passer par tous les tweets à chaque fois. Faites une liste des motifs et des emplacements de montage, par ex. "New York" et "NY" vont à "New York City", "Los Angeles" et "LA" vont à "Los Angeles" etc. Si vous ne trouvez pas un modèle connu, vous continuez avec le prochain tweet.

  • APPROCHE 2

Utilisez l'API de recherche fonction de géocodage, par exemple "http://search.twitter.com/search.atom?geocode=##LAT##%2C##LONG##%2C##radius##km". Malheureusement, je ne sais pas si les résultats sont fiables/bons!

  • APPROCHE 3

utilisateurs Suivez qui ont un nom de ville dans leur champ d'emplacement et d'analyser l'API REST friends_timeline

Avez-vous d'autres idées?

J'espère que vous pouvez m'aider. Merci d'avance!

Répondre

4

APPROCHE 1 - Interroger de façon répétée la chronologie publique ne vous donnera pas tous les tweets, il y en a trop. Vous en obtiendrez 20, et les serveurs Twitter les mettront en cache pendant un certain temps, donc même si vous continuez à les marteler, vous obtiendrez les mêmes résultats. Ils ont un flux XMPP qui vous enverra des mises à jour, mais vous devez demander l'accès.

APPROCHE 2 & APPROCHE 3 - Dans l'un de ces cas, vous comptez sur les utilisateurs pour fournir des informations véridiques. Rien n'empêche un utilisateur de l'exclure ou de le mentir.

Quelle que soit votre approche, vous devez également surveiller les limites de l'API si vous effectuez des requêtes répétées. Pensez à postuler pour un compte en liste blanche qui vous donnera 20 000 reqs/heure au lieu des 100 que tout le monde reçoit par défaut. Cela dit, 2 & 3 vous donnera de meilleurs résultats que 1. Obtenir l'accès à la source xmpp "firehose" et utiliser l'emplacement ou le géocodage vous donnera probablement les meilleurs résultats possibles. Vous n'aurez probablement jamais une information parfaite et fiable à 100%, même avec cela, mais c'est probablement ce que vous pouvez faire de mieux.

Vous pouvez également regarder gnip.com. Ils ont accès à Twitter firehose et je crois qu'ils peuvent filtrer et reconditionner pour vous en quelque sorte. J'avoue que je ne connais pas grand-chose à leur service, mais c'est sur ma liste de choses à voir. Vous devrez peut-être payer pour cela.

1

happn.in est en fait très simple:

Ils ont des utilisateurs pour chaque ville (à savoir happn_in_ny) qui suivent les gens dans cette ville, et ils utilisent simplement la chronologie des amis de cet utilisateur à analyser.

+0

Merci, apparemment, vous avez raison. Je viens de voir tous ces comptes. Mais c'est un peu spammé de le faire de cette façon. Certains de leurs comptes ont été suspendus, par ex. happn_in_tor pour Toronto. – caw