Referrer spam ou referral spam
Définition
Le referrer spam (parfois appelé referral spam) est une technique frauduleuse dont l’objectif est d’envoyer de fausses données dans les systèmes de webanalytics d’un site web.
Symptômes de la maladie
En général, on découvre ce type de spam lorsque, en analysant ses statistiques web, on observe des données curieuses, comme ici :Par exemple, dans la liste des sites référents, on voit apparaître des choses comme : free-traffic.xyz. On voit aussi apparaître des mots-clefs et des pages d’entrée qui n’ont aucun rapport avec la thématique du site, voire qui sont parfois écrits dans une autre langue.Ce fléau peut potentiellement toucher tous les sites web, les « attaques » étant essentiellement menées à l’aveugle ou par crawling.
Différents types de referrer spam
Ghost spam (spam fantôme)
C’est la technique la plus répandue et la plus agressive : les spammeurs attaquent vos rapports directement sans même passer par votre site web. Dans Google Analytics, cela est rendu possible par l’utilisation d’une fonction pour les développeurs appelée « Analytics Measurement protocol » que les pirates ont détourné. Ils peuvent injecter n’importe quel type de données : site référent, mots-clefs, hostname, etc.Pour cela, il utilisent des combinaisons totalement aléatoire de profil Google Analytics (de la forme UA-XXXXXX-Y) : ils ne ciblent donc personne en particulier.Du fait de la nature de cette attaque, celle-ci peut potentiellement toucher n’importe quel site web, quel que soit le CMS utilisé, et même si le site est codé en dur. On comprend donc que, dans ce cas, les solutions côté serveur sont inefficaces, sachant qu’aucune donnée ne transite via le site web.
Crawler Referrer spam
L’autre technique consiste à utiliser des robots qui crawl les sites web de la même manière qu’un bot de moteur de recherche. Dans ce cas, le robot passe effectivement par votre site web. Ce type de spam est moins répandu, dans la mesure où il nécessite plus de moyens. Les solutions de blocages côté serveur sont efficaces dans ce cas (par exemple via un fichier .htaccess).
Quel est l’objectif des spammeurs ?
Selon Wikipédia, l’objectif du referrer spam est essentiellement d’améliorer le positionnement de sites web dans les moteurs de recherche en générant des backlinks. Pour nous, cette explication ne tient pas la route. Il est plus probable que les spammeurs cherchent à inciter les internautes qui voient un lien inconnu dans leurs statistiques à visiter cette page par curiosité. Considérant les millions de sites infectés, ils doivent générer avec cette méthode un trafic très important, qui peut ensuite être monétisé avec de l’affiliation ou de la publicité display.
Conséquence pour les sites web victimes
Contrairement à ce qu’on peut parfois lire, il n’y a aucune conséquence sur le SEO des sites victimes : Google n’utilise pas les informations de Google Analytics. En revanche, cette « pollution » fausse les statistiques et donc l’analyse qui en découle.
Comment se prémunir ?
Les réponses à apporter sont différentes selon la nature du spam :
- Pour le ghost spam, on privilégiera la mise en place de filtres dans Google Analytics.
- Pour le crawler spam, on pourra utiliser des filtres et/ou des blocages coté serveur, par exemple via un fichier .hataccess.
Pour aller plus loin, nous vous invitons à découvrir notre agence SEO et à télécharger notre livre blanc « Placez le Search Engine Marketing au cœur de votre Stratégie d’Acquisition »