2009-04-16 7 views
0

..givé une URL en entrée (langage de programmation C). (Spécifications de sitemap de sitemap.org).Algorithme le plus efficace pour générer une carte de site?

+0

Pourriez-vous être plus précis sur ce que vous demandez s'il vous plaît? Vous voulez une stratégie et un algorithme qui catégorise les liens? Vous voulez un algorithme qui gratte les liens du HTML? Tu veux –

Répondre

0

Comme indiqué dans les commentaires par apphacker nous ne savons pas vraiment ce que vous essayez de faire. Si vous envisagez de simplement racler des liens à partir d'un site Web HTML, alors je recommanderais une sorte de générateur de scanner lexical: comme flex.

Si vous obtenez une URL de site Web en entrée, vous devrez utiliser le code réseau pour lire les pages Web. Si vous ne savez rien sur le réseautage en C alors je vous recommande de googler les guides de beej et d'aller à partir de là.

Si vous obtenez juste un fichier XML droit comme vos balises suggèrent encore une fois je recommanderais flex si vous devez absolument utiliser C. Si vous n'avez pas besoin d'utiliser C alors je recommanderais Perl ou Python; ils sont probablement mieux adaptés au travail.

De toute façon, nous avons besoin de vous pour nous donner plus d'informations mais j'espère que cela aide pour le moment.