Comment vous protéger du duplicate content

Le contenu dupliqué, ou « duplicate content » en anglais, est une véritable plaie ! En effet, si certaines pages de votre site ou de votre blog se retrouvent en doublon sur le net, cela aura de forts impacts négatifs pour votre entreprise. Comment lutter contre ce phénomène pernicieux ? 

Pour avoir une bonne vision d’ensemble du problème, je vous propose de voir ensemble :

  • Pourquoi la lutte contre le duplicate content est importante
  • Qui pratique le duplicate content
  • Les deux types de duplicate content : interne et externe
  • Quels outils pour vous aider à éviter le duplicate content
  • Comment réagir face à un cas de duplicate content.

C’est parti !

1. Pourquoi la lutte contre le duplicate content est importante

Pour les internautes et pour votre notoriété

Lutter contre les contenus dupliqués est un travail fastidieux mais essentiel pour garantir du contenu de qualité aux internautes. Quoi de plus pénible pour l’internaute que de tomber sur plusieurs sites qui lui proposent un contenu identique ? Cela lui fait tout simplement perdre son temps ! Si vous déjà vécu une expérience du duplicate content, vous comprendrez facilement de quoi je veux parler.

Je vous donne un exemple : personnellement, je repère fréquemment des cas de contenus dupliqués lorsque je cherche des recettes de cuisine en ligne. C’est très frustrant car je crois cliquer sur plusieurs recettes (pour choisir ensuite celle qui me semble la meilleure !), et je me retrouve en fait avec une unique recette, reprise à l’identique sur plein de blogs ou sites différents… Quand cela arrive, je note mentalement le nom de ces sites pour ne plus les visiter et je leur attribue l’étiquette « sites peu fiables ».

On le voit bien : le duplicate content est source de mauvaises expériences utilisateurs sur internet et se révèle déceptif pour l’internaute. Du coup, il porte atteinte à la notoriété du site qui le pratique. Au final, personne n’y gagne, car nous avons tous intérêt à faire du web un endroit sympathique et générateur de bonnes expériences 😉

Pour votre référencement web

La lutte contre le duplicate content se justifie également au niveau de votre référencement web. Grâce à ses robots, Google s’emploie en effet à scanner les pages des sites web et pénalisent ceux dont le contenu est dupliqué (Google Pingouin et Panda sont à l’oeuvre !). Cette démarche est justifiée par plusieurs raisons :

  • le but d’un moteur de recherche étant de faire ressortir les résultats les plus pertinents, il est logique que Google oeuvre contre le contenu dupliqué
  • le duplicate content complexifie le travail des moteurs de recherche (ils ne savent plus quelle page afficher dans les résultats de recherche, doivent tenter d’identifier qui est le copieur et le copié, etc) et se paye donc pas un malus.

La baisse de trafic observée peut-être très sévère, alors prudence !

2. Qui pratique le duplicate content

Pour lutter contre un ennemi, il faut le connaître. C’est pourquoi je vous propose de faire la liste des personnes qui pratiquent le duplicate content. Je vous préviens : vous risquez d’avoir quelques surprises !

Les plagieurs

Les plagieurs sont à redouter particulièrement. Généralement sans scrupules, ils pillent le contenu des sites web pour alimenter leur propre site en fournissant le minimum d’efforts. Ils opèrent généralement de la façon la plus simple qui soit : le copier-coller.

Les scrapers

Ils agissent un peu plus intelligemment que les plagieurs car ils se donnent la peine de maquiller leur méfait. Ils peuvent par exemple changer le titre, le chapô ou le visuel de l’article de base, et le compiler avec d’autres contenus.

Les insouciants

Eh oui, les personnes qui pratiquent le duplicate content ne sont pas toujours mal intentionnées. Certains n’y connaissent tout simplement rien aux droits d’auteur, et emballés par un article, ils vont vouloir le recopier sur leur blog personnel. Si l’intention n’est pas mauvaise, la portée de l’acte est par contre la même…

Vous-même (ou votre webmaster)

Je vous surprends ? Pourtant, c’est plus fréquent qu’il n’y paraît. Si vous faites appel à un prestataire peu fiable pour la création de contenus, il se peut que celui-ci vous arnaque et vous fournisse du contenu dupliqué. Vous êtes alors dans l’illégalité sans le savoir ! Par ailleurs, vous ou votre webmaster pouvez également commettre certaines erreurs sur votre site internet, qui seront interprétées par les moteurs de recherche comme du duplicate content. Il s’agit généralement dans ce cas de duplicate content interne. On y vient justement !

3. Les deux types de duplicate content : interne et externe

On distingue deux types de duplicate content :

  • le duplicate content interne, qui se situe comme son nom l’indique à l’intérieur même de votre site web (plusieurs pages de votre site sont repérées comme identiques). Il est souvent dû à une mauvaise organisation de votre site et fréquent sur les sites d’e-commerce, qui ont parfois plusieurs pages dédiées à un même produit.
  • le duplicate content externe, qui indique qu’un même contenu se retrouve dupliqué sur plusieurs sites. Il peut s’agir de contenu copié par malveillance… ou par des admirateurs !

Ne laissez pas le contenu de votre site se faire dupliquer par un autre !

4. Quels outils pour vous aider à éviter le duplicate content

Dans le cas de duplicate contente interne, vous pouvez vous référer aux consignes publiées par Google pour être certain de ne pas faire de bêtises ou réparer celles commises ! Si ce n’est pas vous qui gérez votre site web, pensez à envoyer le lien vers cette page à votre webmaster : il connaît sans doute déjà, mais mieux vaut être trop prudent que pas assez.

Concernant le duplicate content externe, des outils en ligne permettent de le repérer. Les plus connus sont Copyscape et Positeo. Ils vous proposent d’entrer l’URL d’une page de votre site (ou un extrait de cette page pour Positeo) et analysent ensuite s’ils trouvent des contenus semblables ou très proches au vôtre sur le web. Un autre outil peut s’avérer pratique si vous avez des doutes sur un site en particulier : il s’agit de Webconfs, qui vous donne un indice de similarité entre deux URL.

Un exemple de résultat obtenu par Webconfs

(je me suis amusée à comparer deux recettes de canard à l’orange. Tout va bien, les recettes n’ont que 14% de similitude – sans doute les ingrédients !)

5. Comment réagir si votre contenu est dupliqué

Si un site externe copie votre contenu, il va falloir mettre les points sur les « i ». Inutile d’être d’emblée agressif, car il s’agit peut-être d’un simple « insouciant » ou d’une personne qui n’a pas pensé à vérifier les contenus fournis par ses prestataires. Il faut par contre exprimer votre mécontentement. Soyez ferme en exigeant la suppression du contenu dupliqué, ou bien une citation moins importante de votre contenu avec un lien qui renvoie vers votre site. Dans la mesure du possible, essayez que cela se règle à l’amiable. Et si par malheur vous êtes face à une impasse, pas de panique : avant d’appeler votre avocat (solution extrême et coûteuse…), vous pouvez demander à Google de se charger de la suppression du contenu dupliqué.

Et vous, avez-vous déjà été confronté à un cas de duplicate content ?

Si cet article vous a plu, nous vous invitons à découvrir notre agence SEO et à télécharger notre livre blanc « Placez le Search Engine Marketing au cœur de votre Stratégie d’Acquisition »

Gabriel Dabi-Schwebel

Ingénieur de formation j’ai commencé ma carrière dans le conseil en télécom et en média. J’ai aussi monté de multiples projets entrepreneuriaux, marque de bijoux, bar à jus de fruits, éditeurs de logiciel avant de créer 1min30 en 2012, la première agence en Inbound Marketing en France. Avec 1min30, nous avons piloté les stratégies digitales de centaines d’entreprises mais aussi développé un blog qui a plus de 300K lecteurs par mois, une communauté de plus de 100K abonnés sur l’ensemble des nos réseaux sociaux et une maison d’édition dans laquelle nous publions nos livres et ceux de nos clients. Depuis 2017, je suis ainsi l’auteur et coauteur de 8 livres sur le marketing et la vente, dont 5 de méthodes basées sur l’intelligence collective : Acquisition Strategy Design, Customer eXperience ReDesign, Brand Strategy Design, Q2C Selling et 3 méthodes marketing pour les RHs Aujourd’hui, 1min30 fait partie des 3 plus grandes agences HubSpot en France. Nous avons fait des intégrations les plus complexes notre spécialité et proposons à nos clients un accompagnement complet sur la solution alliant conseil, intégration, formation et agence. Contactez moi si vous souhaitez dépasser les objectifs de leur investissement CRM.

Voir les commentaires

  • bonjour Le 15 Aout 2014 j ai vérifié que je n avais pas de contenu dupliqué j ai eu la très désagréable surprise de constater que les voleurs de contenu avaient de nouveau frappés ... Obligé de les appeler un par un afin de demander que le contenu soit modifié ...cest une perte de temps monumentale quand on n a ni inspiration ni idée on vole le travail des autres grrrr je suis furax.

  • Bonjour Stéphane, Je comprends que vous soyez furax, on est désolé d'apprendre cette nouvelle ! J'espère que tout rentrera très vite dans l'ordre pour vous... N'hésitez pas à nous tenir au courant de la suite de cette affaire : votre témoignage pourra sans doute aider d'autres vicitimes du duplicate content. Bon courage et mort au duplicate content ! Pauline

  • Aprés avoir passé quelques coup de fil pour protester contre ce vol de contenu j ai reussi à faire modifier le contenu volé (présent sur plusieurs sites web)...pour les plus recalcitrants obligé de les menacer de les poursuivre en justice....que d ennergie gaché pour rien ! Pour la petite annecdote un stagiaire indelicat chargé de travailler sur le contenu dd un site pro informatique c est juste contenté d un copié collé. Quand vous etes dans ce cas n hesitez pas à appeler le voleur et à protester ennergiquement.

  • Pourquoi faut il vérifier qu il n y a pas de contenu dupliqué ? Tout simplement parce que sa majesté Google premier déteste les contenu dupliqué et qu'à cause de ceux ci mon site risque d être sanctionné ou déclassé (à cause d un vol de contenu ça mérite bien un petit coup de gueule non ?) J ai constaté que sur le mot clé " informatique Rouen " mon site web à perdu deux places ...j ai donc cherché la cause ... Pour vérifier qu il n y avait pas de contenu dupliqué j utilise principalement ces trois outils :Positeo.com ,Copyscape et Plagium normalement je vérifie les contenus dupliqués tous les 2 à trois mois... ce ne sont pas une phrase ou deux qui ont été dérobées mais des dizaines de phrases appartenant à mon site pro ... Je pense a ce stagiaire chargé de mettre du contenu sur un site pro de la même thématique que le mien ..celui ci manque surement de professionnalisme et d inspiration... Ce genre de pratique fait froid dans le dos... (façon de parler ) on peu s inspirer d un contenu pour créer son propre contenu mais en aucun cas se contenter d un simple et vulgaire copier collé ....... Cela n arrive pas qu'aux autres ....si vous être confronté à ce genre de désagrément je vous encourage à appeler le ou les indélicats en demandant de supprimer ce contenu dupliqué ....soyer ferme et ne lâchez rien ... à suivre Certains se contentent de copier une ou deux phrases, d autres n hesitent pas à copier des passages entier de mon site web ... -- NOTE D'ALESIACOM : Retrouvez le témoignage complet de Stéphane dans cet article : https://www.1min30.com/blog/une-victime-du-duplicate-content-temoigne-pour-vous

  • Bonjour,

    Et si le but est de récupérer le catalogue d'un fournisseur qui n'a pas de fichier csv ou de lien xml ? Parce qu'ils vous disent : "oui vous pouvez récupérer les photos" mais quand il y a des centaines et que vous avez plusieurs fournisseurs...Est-ce que cela est mal perçu?

    Après dans mon cas, j'enlève ce robot car le but n'est pas de me faire "assister". Je veux juste faire ma première importation, ensuite il suffit de surveiller les ajouts de produit qui logiquement se trouve sur la page nouveauté et là ce n'est pas énorme, c'est faisable.

    Dès fois je me demande si cela ne va pas mettre le site de mon fournisseur en panne :) :)