Sélectionnez une lettre de l'alphabet

Cache

Mise à jour : mercredi 6 avril 2011

Je me suis souvent demandé ce que signifiait le terme "en cache" qui apparaît sous la forme d’un lien bleu à coté du nom de domaine (en vert) lorsque vous faites une recherche sur le web. Est-ce que ce lien "en cache" représente le sésame pour le web invisible ou la face cachée du web ? La réalité est différente. Lorsque Google explore le Web avec son armée de robots (GoogleBot), il crée une copie de chaque page examinée et la stocke dans un de ses serveurs, ce qui nous permet de consulter cette copie à tout moment, et en particulier dans le cas où la page originelle serait inaccessible. Google se base sur ces pages en cache pour déterminer si une page est pertinente pour vos requêtes (recherche sur le web à partir d’un mot clef). Autrement dit, toute page web fait l’objet d’une copie de sauvegarde automatique, ce qui permet de la retrouver dans le cas d’une panne de serveur par exemple ou si l’auteur de la page a supprimé celle-ci . Il suffit de cliquer sur "Copie cachée" à côté d’un résultat lors d’une recherche sur Google pour accéder à la page telle qu’elle était lorsque les robots de Google l’ont visitée et indexée pour la dernière fois.

Quand on connaît le nombre de pages web indexées, on peut comprendre que Google n’utilise pas moins de 10 000 serveurs !

Quel est le véritable intérêt des pages en cache ? Pour les propriétaires d’un site, le dispositif "en cache" représente un back up, si le serveur qui héberge son site "pète les plombs", le contenu de son site pourra être récupéré. Pour les internautes, les pages en cache permettent de savoir quand date une page web, dans certains cas, affaire juridique…cette info peut être cruciale.

Evidement cette belle invention a son revers de la médaille. Le cache peut même virer au cauchemar pour certains. Imaginez qu’un site, blog communique une info confidentielle (votre numéro de téléphone) ou diffamante… et qu’après de nombreux efforts, vous réussissiez à obtenir que l’auteur de cette info la supprime de ses pages, vous n’êtes pas sorti d’affaire, car l’info risque de continuer à sévir sur le web.. sous sa version cache. Ainsi, si un internaute fait une recherche pour accéder à cette page compromettante, il aura droit au fameux message d’erreur "erreur 404 -file not found", mais rien ne l’empêche de cliquer sur le lien en cache pour obtenir une copie de cette page ! Tout compte fait, les liens " en cache" nous ouvrent les portes de la face cachée du web, puisqu’ils permettent d’accéder à des pages que les auteurs ont supprimées…et de déjouer ainsi les pièges du "404" .

Alors quel est l’antidote au lien en cache ? Google nous indique la marche à suivre : Si vous êtes le propriétaire du site, vous devez modifier vous-même votre site Web, puis demander la suppression de la page posant problème dans les résultats de recherche à l’aide de l’outil de demande de suppression d’URL, disponible dans les Outils pour les webmasters. Si vous n’êtes pas le propriétaire du site, vous devez d’abord contacter le webmaster pour demander la suppression du contenu. Alors seulement vous pourrez demander à ce que votre contenu n’apparaisse pas en tant qu’extrait ou copie mise en cache dans les résultats de recherche Google. Pour ce faire, utilisez l’outil public de suppression d’URL.

Evidement si l’auteur du billet litigieux se refuse à supprimer celui-ci, vous n’avez guère de recours, le problème dépasse celui de la copie cache. Il faut alors se poser la question suivante : comment effacer un contenu critiquable sur la toile ? Un futur bon sujet à traiter pour Mynetwords.

Écrire un commentaire