Méthodologie de l’Observatoire 1min30
Comme vous le savez nous allons présenter les résultats de notre Observatoire 1min30 des sites Internet professionnels français demain à l’occasion d’une conférence de presse au Forum des Médias Mobiles.
Dans l’attente de cet événement et avant de vous dévoiler l’ensemble des résultats, je vous propose aujourd’hui de vous présenter la méthodologie de l’étude qui a été conduite sur plus de 10000 entreprises françaises, pour analyser leur présence sur Internet.
Nous sommes partis d’un fichier de 10000 entreprises fourni gracieusement par la société Email Brokers qui loue des fichiers d’adresse mail. Elle avait déjà réalisée un premier travail de découverte manuelle du site Internet associée à l’entreprise, ce qui nous a permis de partir d’une base représentative avec numéro SIRET, secteur d’activité, taille et région de chacune des entreprises.
En parallèle nous avons développé d’abord avec Jean-Marie Hermelin, mon associé dans Soft4Energy, puis avec Data Publica un outil permettant de crawler les sites Internet et d’analyser les fonctionnalités présentes sur les sites. Avec Data Publica nous nous sommes appuyé sur leur outil Data Publica Company Intelligence, un moteur d’extraction d’information sur les entreprises:
- A partir de l’identification d’une entreprise, le moteur recherche des informations thématisées sur l’entreprise
- Dans le site Web de l’entreprise (trouvé automatiquement)
- Sur le Web de façon générale (crawl complet du Web)
- Dans des sources d’information générales et spécialisées
- Dans les réseaux sociaux
Cet outil a été spécialisé pour 1min30 et pour identifier les informations suivantes:
- présence d’un flux RSS pour identifier la présence d’un blog,
- présence de formulaire de contact ou d’une adresse mail,
- présence de balise SEO pour identifier si un effort de référencement a été réalisé,
- présence des mentions légales ou de conditions générales de vente,
- présence d’un outil d’analytics (Google Analytics, Xiti, etc.)
- présence de liens vers les réseaux sociaux (Facebook, Twitter, Google+, LinkedIn)
- présence de vidéos (Youtube, Dailymotion, etc.)
- utilisation d’un CMS (Joomla, Drupal, WordPress, etc.) ou d’une solution ecommerce (Prestashop, OS Commerce, etc.)
- utilisation de technologie adaptée au mobile (site dédié ou responsive design)
Une fois l’outil développé et fiabilisé nous avons lancé le crawler sur notre fichier de 10000 entreprises afin de croiser l’ensemble de ces informations et d’avoir une vision complète de la présence des entreprises sur Internet: celles qui y sont et celles qui n’y sont pas mais aussi comment elles y sont? Croisement et traitement statistiques réalisés avec brio et patience par Guillaume Main, notre expert en analyse de données.
Et vous que pensez-vous de notre Observatoire? J’espère que vous êtes impatient de découvrir les résultats;-) Il seront disponibles demain en téléchargement à partir de 11h sur le site. Vous pourrez d’ailleurs tester vous aussi le site de votre entreprise avec le même outil et obtenir votre bulletin de note (à suivre). En attendant vous pouvez toujours télécharger notre livre blanc « les 11 commandements d’un site Internet qui convertit ses visiteurs en clients«