Duplicate content
Définition
On emploie le terme Duplicate Content (contenu dupliqué) pour désigner un contenu présent sur plusieurs pages d’un même site ou de plusieurs sites. Il peut s’agir d’un article entier ou seulement d’un passage. Il s’agit d’une technique que l’on retrouve dans le domaine du SEO en terme de référencement naturel afin d’obtenir une meilleure place sur les pages des résultats des moteurs de recherche. Ce terme est également utilisé pour évoquer un même contenu présent sur plusieurs sites différents, et ce, lorsqu’il y a eu plagiat ou que des citations ou des extraits ont été repris à la virgule près.
Un frein pour un référencement web de qualité
L’objectif du Duplicate Content, en matière de référencement naturel, est d’intégrer une plus grande quantité de mots au sein d’un site sans faire appel à des rédacteurs en vue d’être mieux référencé par les moteurs de recherche. Néanmoins, les moteurs de recherche détectent le Duplicate Content lorsqu’il est trop évident. Au final, le moteur ne va donc prendre en compte qu’une seule page, à savoir celle qu’il trouvera la plus pertinente ou bien celle qui est à l’origine du contenu. Cette technique est donc de moins en moins utilisée par les sites internet, car les pénalités sont nombreuses.
Lorsqu’un duplicate content est détecté par un moteur de recherche, c’est la page jugée la plus pertinente qui sera mis en avant dans les résultats. Ainsi, une page disparaitra au profit de l’autre.
Quand y a-t-il duplicate content ?
Un contenu dupliqué est vite arrivé. Par exemple, on peut générer un duplicate content en envoyant un même communiqué de presse qui sera publié sur deux sites différents.A l’intérieur d’un même site, il arrive également que certaines pages soit dupliquées, au sens où une même page peut avoir plusieurs adresses (voir l’exemple de google ici : https://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html).Il peut même parfois arriver qu’un site ayant produit un contenu original le publie, se fasse plagier par un autre site utilisant des techniques « blackhat », et que ce soit le copieur qui soit référencé sur ce contenu. Tout dépend de l’autorité (au sens SEO) du site émetteur.
Solutions pour empêcher le duplicate content
Deux types de solutions sont possibles :
- Ne jamais mettre les même texte sur son site et sur des sites tiers
- Pour le duplicate content interne, utiliser l’attribut « canonical » afin d’indiquer aux moteurs de recherche quelle est la page de référence pour un même contenu.
Pour cela, insérer le code suivant dans la section <head> du code html de votre site :
<link rel="canonical" href="https://www.monsite.com/adresse-preferee" />
« adresse-preferee » étant l’adresse de référence que vous souhaitez voir afficher dans les moteurs de recherche.
Technique pour créer du contenu
Si le Duplicate Content ne fonctionne pas vraiment pour optimiser son site internet, une autre technique reste encore efficace, il s’agit du Duplicate Spinning. La technique consiste à dupliquer le contenu, mais en reformulant les phrases et en changeant certains mots par des synonymes ou des mots ayant le même sens. Il existe des logiciels qui réalisent cette opération automatiquement, mais une retouche manuelle est généralement nécessaire pour que Google ne détecte pas le Duplicate Spinning. Cette alternative est notamment utile pour créer des pages satellites au sein desquelles de nombreux mots-clés seront intégrés (pour un meilleur référencement naturel).
- Notre livre blanc pour bien délimiter la ligne éditoriale d’un site web
- Tout savoir sur le marketing de contenu
Pour aller plus loin, nous vous invitons à découvrir notre agence SEO et à télécharger notre livre blanc « Placez le Search Engine Marketing au cœur de votre Stratégie d’Acquisition »