J'ai quelques doutes sur les crawlers web basés sur PHP, peut-il fonctionner comme le thread basé sur Java? Je le demande parce que, en java le thread peut être exécuté encore et encore, je ne pense pas, PHP a quelque chose comme la fonction de thread, pouvez-vous dire s'il vous plaît, quel robot d'exploration sera plus utiliser? Un PHP ou un JavaCrawler Web basé sur PHP ou Web Crawler basé sur JAVA
0
A
Répondre
3
Au lieu d'écrire votre propre utilisation, utilisez l'un des éléments suivants. BTW, les crawlers Web basés sur Java sont préférés. Mon préféré Nutch.
Java: Nutch, Heritrix, JSpider, JoBo (de chenilles simples)
basé sur PHP: PHPCrawl
0
En général, vous aurez besoin de sauter à travers plus de cerceaux pour exécuter des tâches à long en cours d'exécution en PHP, comme c'est beaucoup plus d'une configuration basée sur la requête/réponse.
+0
Je ne comprends pas –
Ce qui est bon? Basé sur Java ou basé sur PHP? –
Basé sur Java! Utilisez Nutch, il vient avec Lucene. – ankitjaininfo
Quelle est l'utilisation de Lucene? –