je regarde des choses qui peuvent distinguer un blog d'un site web normal. Ce sont des choses qu'un programme doit être en mesure d'identifier à partir du code HTML d'un site Web ou des fonctionnalités particulières qu'un site prend en charge. Par exemple. pings. La même chose pour les sites d'information. Je travaille sur un programme de blog/moniteur de nouvelles et il indexe les sites pour déterminer automatiquement s'il s'agit d'un blog ou d'un site de nouvelles, puis surveille les commentaires des utilisateurs dans les commentaires sur les messages des sites qu'il juge être un blog ou une nature de nouvelles.caractéristiques Distingushing d'un blog, i.e. déférence entre un blog et un site normal
donc ce que je suis est vraiment après des suggestions sur ce que je peux utiliser ou chercher dans l'identification de ces sites.
Il va être une application de bureau écrit en Java, donc si vous avez des spécificités de code en Java qui va être génial.
merci à l'avance
J'ai amélioré le balisage sur cette question. J'ai enlevé 'java' car cela n'a vraiment rien à voir avec java. Si vous trouvez une solution qui fonctionne, faites des recherches sur Java et soumettez une question spécifique aux problèmes que vous rencontrez. J'ai également ajouté l'analyse et la détection html. –