2010-07-27 10 views
0

J'ai quelques doutes sur les crawlers web basés sur PHP, peut-il fonctionner comme le thread basé sur Java? Je le demande parce que, en java le thread peut être exécuté encore et encore, je ne pense pas, PHP a quelque chose comme la fonction de thread, pouvez-vous dire s'il vous plaît, quel robot d'exploration sera plus utiliser? Un PHP ou un JavaCrawler Web basé sur PHP ou Web Crawler basé sur JAVA

Répondre

3

Au lieu d'écrire votre propre utilisation, utilisez l'un des éléments suivants. BTW, les crawlers Web basés sur Java sont préférés. Mon préféré Nutch.

Java: Nutch, Heritrix, JSpider, JoBo (de chenilles simples)

basé sur PHP: PHPCrawl

+0

Ce qui est bon? Basé sur Java ou basé sur PHP? –

+0

Basé sur Java! Utilisez Nutch, il vient avec Lucene. – ankitjaininfo

+0

Quelle est l'utilisation de Lucene? –

0

En général, vous aurez besoin de sauter à travers plus de cerceaux pour exécuter des tâches à long en cours d'exécution en PHP, comme c'est beaucoup plus d'une configuration basée sur la requête/réponse.

+0

Je ne comprends pas –