2010-12-08 62 views

Répondre

1

Vous pouvez read here (citation pertinente ci-dessous) pour une réponse à la partie ToS de cela. Fondamentalement, sans une clé d'API et leur permission, ce n'est probablement pas une bonne idée. Cependant, en raison du volume qu'ils traitent, vous pourriez être en mesure de s'en tirer si vous ne faites pas de tonnes de requêtes. PageRank est une autre chose que les gens essaient souvent de faire, mais ils ne mettent pas autant de poids sur ce mérite (la rumeur l'a), et les anciennes clés d'API de style sont vraiment difficiles à trouver.

Ne pas utiliser des programmes informatiques non autorisé à soumettre des pages, vérifier classement, etc. Ces programmes consomment ressources informatiques et violent notre Terms of Service. Google ne recommande pas l'utilisation de produits tels que WebPosition Gold ™ qui envoie des requêtes automatiques ou des requêtes programmatiques à Google.

+0

Merci, je ne ferai rien contre leur ToS, donc ce n'est plus nécessaire (pour moi). –

1

Eh bien, pas explicitement. Mais vous pouvez vérifier toutes les vues de page à l'aide:

$agent = $_SERVER['HTTP_USER_AGENT']; 

if (strstr($agent, 'googlebot')){ 

    // tell the database that google has crawled this page. 
} 
+0

il vérifiera seulement si google a déjà visité cette page, ne confirmera pas le temps qu'il a indexé. –

1

Pour ce faire sans API est contre le TOS. Pour un faible volume, vous pouvez:

// CHECK IF PAGE IS IN GOOGLE INDEX 
$domain = 'stackexchange.com'; 
if (strstr(file_get_contents("http://www.google.com/search?q=site:$domain"), 'did not match any documents')) { 
    // Page is not in the index 
    print 'No Go!'; 
} 
else { 
    print 'All Good!'; 
} 
exit; 
0

Pour la langue polonaise, vous devriez essayer de vérifier entre UTF-8 et ISO-8859-2 comme ceci:

$encAry = array('ISO-8859-2', 'UTF-8'); 
$contentEncoding = mb_detect_encoding($content, $encAry); 
$googleSearchResult = mb_convert_encoding($content, 'UTF-8', $contentEncoding); 

Works pour moi.