Aspirateur de site web
Définition
Un aspirateur de site est un logiciel qui « aspire » les données d’un site web public en les téléchargeant sur un support de stockage (disque dur, clef usb, etc.).
Objectifs d’un aspirateur de site
Il peut y avoir plusieurs raisons d’utiliser un aspirateur de site web :
Sauvegarder les données d’un site web
Dans le domaine du développement web & mobile, il existe de nombreuses méthodes pour sauvegarder les données d’un site web « ami » (c’est à dire un site web dont on ne veut pas « voler » les données). La plus directe consiste à utiliser un client FTP. Cependant, il peut arriver, dans le cadre par exemple d’une migration de site où les accès FTP sont introuvables, qu’il n’y ait pas d’autres possibilités que de devoir aspirer le site pour en conserver une copie. Cependant, si le site a été réalisé avec un CMS, cette copie ne sera pas fonctionnelle : elle donnera seulement l’image des contenus statiques du site, c’est à dire le rendu html de la page web.
Accéder à un site hors connexion
Cas de plus en plus rare, mais qui peut se produire, par exemple si on souhaite consulter les données d’un site Internet dans le train.
Faire de la veille (le gentil mot pour « surveillance »)
Afin par exemple de « surveiller » la concurrence, on peut souhaiter télécharger de manière « industrielle » et régulière les contenus de certains sites web. La surveillance des sites concurrents est cependant plus efficace lorsqu’elle est effectuée de manière ciblée et structurée à l’aide des techniques de web scraping.
Pour aller plus loin, nous vous invitons à découvrir notre agence developpement web et à télécharger notre livre blanc « Les 11 commandements d’un site internet qui convertit vos visiteurs en clients »
1 Commentaire
daniel dit: 19 Jan 2019
bien