Cela faisait un petit moment que nous ne vous avions plus parlé d'une vidéo publiée par Matt Cutts, le chef de l'équipe antispam de Google. A vrai dire, le dernier article à ce propos était un poisson d'avril qui expliquait que Google faisait marche arrière concernant le guest blogging.
Aujourd'hui, la vidéo publiée par Matt Cutts sur la chaîne Youtube GoogleWebmasterHelp concerne la manière dont Google traite les erreurs 404 et les erreurs 410. Pour rappel, ces deux sortes d'erreurs concernent des pages web ou des documents qui ne sont pas disponibles mais l'erreur 410 s'applique spécifiquement à des pages qui sont « parties pour toujours ». En d'autres termes, une erreur 410 est une réponse explicite du serveur qui vous dit qu'une page a bel et bien disparu.
Comment Google traite-t-il ces pages ?
Dans la vidéo qu'il nous propose (et que vous pouvez retrouver dans son intégralité ci-dessous), Matt Cutts explique que Google traite ces différentes erreurs un peu différemment. En effet, avec une erreur 404 (et d'autres codes de type 4xx), Google va « protéger » la page et ne pas la traiter comme une page supprimée pendant une période d'environ 24 heures.
A l'inverse, avec une erreur 410, Google va marquer la page comme disparue dès qu'un robot aura constater l'erreur.
Evidemment, Google sait qu'il y a parfois des problèmes de serveurs et des bugs divers et c'est pour cette raison que GoogleBot continuera à venir vérifier si les pages 404 et 410 ne sont pas revenues dans un futur plus ou moins proche (Matt Cutts parle de plusieurs fois au cours de l'année qui suit).
En conclusion, on utilisera donc certainement plutôt une erreur 404 pour un document qui n'est pas disponible et une erreur 410 pour un document ou une page web qui n'est plus disponible.