Supposons que plusieurs sites externes collectent/récupèrent votre contenu et l'affichent comme le leur. Disons également que vous conservez une seule URL unique/permanente pour chaque contenu, de sorte que l'alias de contenu (sur votre site) ne pose jamais de problème. Y at-il une valeur d'un point de vue SEO pour inclure un canonical link dans votre en-tête de toute façon, de sorte que lorsque votre site est "gratté", l'indication canonique est injectée dans quel site vole votre contenu (en supposant qu'ils récoltent le HTML brut plutôt que d'entrer par RSS, etc.)? J'ai entendu différentes choses sur le comportement des liens canoniques inter-sites, de «ils sont ignorés» à «comportement indéfini» à «ça ne peut pas faire de mal» à «sûr que c'est exactement ce à quoi est destiné canonique ". Mon impression était que canonique était un bon moyen de traiter intra site mais pas nécessairement inter aliasing.Lien canonique comme moyen de lutter contre les racloirs?
Répondre
Je ne peux pas répondre à votre question directement. Vous (quelqu'un dans votre entreprise) devez contacter les parties qui sont en train de syndiquer votre contenu sans autorisation, et essayez de le faire avec la permission. Vous devriez clarifier votre politique sur la syndication non autorisée. Il s'agit bien sûr d'une décision commerciale et vos spécialistes en développement des affaires/processus et en propriété intellectuelle devront probablement s'impliquer.
S'ils continuent à le faire de façon persistante et que vous avez absolument besoin de les faire arrêter, vous pouvez commencer à servir de la malbouffe à leurs robots. Détecter leurs robots peut être non trivial, car ils vont probablement forger un "vrai" en-tête d'utilisateur et utiliser différentes adresses IP (la plupart des mécréants semblent utiliser EC2 ces jours-ci), cependant, si vous réussissez, leurs sites web seront remplis de jonque. Une fois que leurs sites Web sont remplis de déchets (ou pire), vous pouvez les contacter à nouveau pour leur demander s'ils souhaitent arrêter leur comportement désagréable.
+1 pour nourrir les robots indésirables. tout le monde sait que c'est leur nourriture préférée. –
Normalement, je ne préconise pas de robots d'alimentation, dans le meilleur des cas vous devriez persuader les utilisateurs de robot d'arrêter par eux-mêmes. Nourrir les robots indésirables peut avoir de mauvais effets que vous ne voulez pas. – MarkR
Je doute fortement que les sites qui volent du contenu d'ailleurs incluent également l'URL canonique. La plupart du temps, ils reposent * contenu * (c'est-à-dire extrait de RSS), pas la source HTML complète du site d'origine (y compris les en-têtes). – Joey
les robots ne se soucient pas des canoniques, ils les ignorent. Vous devez utiliser des chemins absolus, donc si quelqu'un vole votre contenu au moins, vous pouvez les suivre par le backlink – Ben