Erreur http 404 - Page introuvable

Erreurs 404 : comment détecter et gérer les pages introuvables ?

| Référencement naturel

En tant qu’internaute, vous êtes certainement déjà tombé sur une page affichant une erreur 404, signifiant que la page est introuvable. Très frustrant comme expérience, n’est-ce pas ? Mais qu’en est-il du référencement naturel ? Les erreurs 404 sont-elles néfastes au SEO, comme tout le monde tend à le croire ? Quand et comment gérer les pages 404 ? Voici un guide qui vous sera, nous l’espérons, utile !

Qu’est-ce qu’une erreur 404 (Page not found) ?

Une page web indiquant une erreur 404 est une page introuvable affichant très souvent le message « Page non trouvée » ou « 404 not found » en anglais. Le serveur web renvoie un code d’erreur http 404 aux robots des moteurs de recherche indiquant que la page n’existe plus ou qu’elle n’a tout simplement jamais existé. Le code 404 fait partie des codes de statut de réponse http appartenant à la classe « erreurs du client (400 – 499) ».

Après quelques jours ou semaines, Google désindexe les pages en erreur 404 et finit par ne plus les afficher dans les résultats de recherche.

Si l’internaute atterrit sur une page 404 qui n’a pas été personnalisée, il voit s’afficher un message d’erreur standard indiquant que la ressource demandée n’a pas été trouvée, comme sur l’exemple de la page 404 de Google ci-dessous.

Page Erreur 404 de Google
Page Erreur 404 de Google

Erreur 404 vs Soft 404

Il existe également des pages qui sont considérées par Google comme des « Soft 404 », dont vous pouvez retrouver la liste dans votre compte Google Search Console. Ces pages sont introuvables mais le serveur renvoie cependant un code de réponse http 200, signifiant que la page est valide et que la ressource a été trouvée. Le mauvais code est ainsi envoyé aux robots, une situation à éviter.

Comment apparaissent les erreurs 404 ?

Il n’est pas anormal de voir apparaître des erreurs 404 sur un site web, notamment s’il s’agit d’un site de presse ou d’un site e-commerce. Cela ne signifie pas automatiquement que votre site est de mauvaise qualité, même s’il est préférable de les éviter autant que possible. Différentes raisons peuvent expliquer la création d’erreurs 404 sur un site :

  • Suppression d’une page : sur un site e-commerce, vous pouvez être amené à retirer une page d’un produit en rupture de stock (non conseillé) ou d’un produit qui n’est plus en vente. Certains articles d’actualité très anciens sur des sites médias peuvent également faire l’objet d’une suppression, même si cela n’est également pas recommandé.
  • Modification d’une url : pour une raison quelconque, vous décidez de modifier l’url d’une page existante et vous n’avez pas effectué de redirection 301.
  • Migration / Refonte d’un site : lorsque vous effectuez une refonte de votre site web impliquant des changements dans la structure de vos urls (nouveau nom de domaine ou nouvelle architecture de site), des erreurs 404 peuvent être générées si vous n’avez pas planifié de redirections 301, spécifiant que le contenu a été déplacé vers une autre adresse.
  • Erreur de saisie d’un internaute : il s’agit là d’une erreur de frappe lorsque l’internaute saisit une url manuellement dans la barre d’adresse de son navigateur. Cette url est inconnue et génère automatiquement une erreur 404. Vous ne pouvez malheureusement pas faire grand-chose dans ce cas.
  • Un lien externe erroné : il s’agit d’un backlink, provenant d’un autre site, dont l’url a été mal orthographiée par le gestionnaire du site en question. Il conviendra ici de contacter l’éditeur du site afin qu’il corrige l’erreur.
  • Un lien interne erroné : quand vous effectuez des liens entre les pages web de votre site, ce que l’on appelle le « maillage interne », il est possible que vous ayez vous-même mal saisi l’url.

Comment détecter une erreur 404 ?

Il existe deux moyens simples d’identifier les pages faisant l’objet d’une erreur 404.

En premier lieu, consultez votre compte Google Search Console, outil gratuit et indispensable vous permettant de contrôler la bonne indexation de votre site web. Il vous fournit la liste des pages retournant un code d’erreur 404. Pour ce faire, rendez-vous dans la section « couverture » => « erreur » => « url envoyée introuvable (404) ».

Si votre site compte plusieurs milliers d’erreurs 404 (ce que l’on ne vous souhaite pas), vous n’aurez pas accès à l’intégralité des pages en erreur, le rapport n’affichant que 1000 urls maximum. Généralement, il faut compter un mois pour que les erreurs 404 cessent d’être affichées dans les rapports. Pour plus d’informations, consultez l’aide Search Console concernant les erreurs 404.

Google Search Console - Rapports Erreurs 404
Google Search Console – Rapport Erreurs 404

La deuxième option qui s’offre à vous est l’utilisation d’un outil SEO d’exploration, appelé « crawler », comme Screamingfrog ou Oncrawl. Ces outils explorent les pages de votre site, tout comme le fait GoogleBot (robot de google), et identifient les pages retournant un code 404.

L’analyse de log est également une méthode fiable pour répertorier de manière exhaustive l’ensemble des erreurs 404 d’un site web.

Quelles sont les conséquences d’une erreur 404 sur le SEO et l’UX ?

Un site comportant des erreurs 404 n’est pas pénalisé par Google. Vous ne verrez donc pas votre site perdre des positions dans les résultats de page de recherche à cause de cela. Néanmoins, il est important de limiter le nombre d’erreurs 404 sur votre site car cela peut avoir un impact indirect sur votre référencement naturel, notamment l’indexation de vos pages, et surtout l’expérience utilisateur.

Perte du bénéfice du netlinking

Si certaines de vos pages affichant une erreur 404 reçoivent des backlinks de qualité et du trafic, il est nécessaire de réparer l’erreur 404. Si vous ne le faites pas, vous perdrez le « jus seo » (popularité) envoyé par les liens externes. Les autres pages de votre site n’en profiteront pas car Google ne lit pas les pages en erreur 404 et les désindexe au bout de quelques semaines.

Budget crawl non-optimisé

Les robots des moteurs de recherche n’accordent qu’un temps limité à l’exploration de votre site. C’est ce que l’on appelle le « budget crawl ». Si votre site comporte de nombreuses erreurs 404, le robot va passer du temps à explorer des pages qui n‘ont aucun intérêt pour votre référencement naturel car elles n’existent pas et ne sont donc pas indexables. C’est autant de temps perdu pour l’exploration de pages importantes que vous souhaitez voir indexées par Google et positionnées dans les résultats de recherche.

Impact négatif sur le maillage interne 

L’existence au sein de votre site de liens cassés (mal orthographiés par vos soins), menant vers des pages 404, a un impact négatif sur votre maillage interne. Celui-ci permet à Google de comprendre l’architecture de votre site et les relations entre vos différents contenus. Il permet également de faire circuler le PageRank (jus seo) entre vos pages. Si la chaîne de liens est cassée, c’est l’efficacité de votre maillage interne qui prend un coup dans l’aile.

Expérience utilisateur dégradée

Vous l’avez certainement expérimenté au moins une fois comme tous les internautes, tomber sur une page 404 est assez déceptif. C’est d’autant plus vrai aujourd’hui où le consommateur souhaite accéder rapidement à l’information souhaitée. C’est également l’image de marque de votre société qui en pâtit, si votre site web compte trop de pages introuvables. Les erreurs 404 génèrent naturellement un taux de rebond élevé et c’est autant de trafic perdu. A moins de créer une page 404 personnalisée, point que nous abordons plus loin dans cet article.

Comment gérer ou réparer une erreur 404 ?

Il n’est pas nécessaire de corriger toutes les erreurs 404. Ciblez les pages qui ont un impact sur votre référencement naturel. Attirent-elles du trafic ? Reçoivent-elles des liens entrants (backlinks) ? Si la réponse est oui, alors privilégiez ces pages. Votre temps est précieux et passer du temps à réparer des pages qui ne sont pas positionnées sur Google n’est pas productif. Il est ainsi préférable d’optimiser d’autres leviers SEO tels que les balises title, l’optimisation du contenu, le maillage interne ou le netlinking

Voici les différentes solutions pour gérer une erreur 404 :

  • Redirection 301 : si votre page génère du trafic et reçoit des backlinks, optez pour une redirection vers une page avec un contenu similaire. Cela permettra de préserver la qualité de l’expérience utilisateur et de proposer un contenu alternatif. Le « jus seo » sera également transféré à la nouvelle page et ne sera pas perdu.
  • Corriger l’url : si l’erreur 404 provient de votre maillage interne, il conviendra de modifier l’url du lien en question dans le backoffice de votre CMS.
  • Erreur 410 (gone) : Le code d’erreur 410 indique que la page a définitivement été supprimée. Google traite les erreurs 410 de la même manière que les erreurs 404 mais procède à une désindexation plus rapide. Cette solution est intéressante si vous avez supprimé un contenu de manière définitive, que vous êtes certain qu’il ne sera pas remplacé et qu’il ne représentait pas un réel intérêt en matière de référencement.
  • Erreur 404 : S’il n’existe aucune page de substitution et que les pages concernées n’ont pas un poids significatif dans votre référencement, il convient de ne rien faire et de laisser le serveur renvoyer un code d’erreur 404. Google ignorera ces pages au bout de quelques semaines. Vous pouvez cependant personnaliser votre page 404 pour inciter les internautes à poursuivre leur navigation.

La gestion des 404 sur un site e-commerce

  • Produits en rupture de stock : pour les sites e-commerce, il est recommandé de ne pas supprimer les pages des produits en rupture de stock, ce qui créerait une erreur 404 et donc une suppression de la page de l’index Google. Laissez la page accessible aux moteurs (code 200), indiquez que le produit est en rupture de stock et donnez la possibilité aux internautes de recevoir une alerte email quand le produit sera à nouveau disponible.
  • Produits qui ne sont plus vendus : dans le cas d’un produit qui n’est plus au catalogue et qui était très recherché par les internautes, choisissez une page produit similaire ou à défaut la catégorie parente pour effectuer une redirection permanente (301). Sinon paramétrez le code 410 (gone) ou à défaut laisser le code http 404.

A lire également : 10 conseils pour le référencement SEO d’un site e-commerce

Erreurs 404, ce qu’il ne faut surtout pas faire !

Concernant les erreurs 404, si vous n’êtes pas certain de l’action à mener, il est préférable de s’abstenir et de laisser la situation en l’état ou bien de faire appel à des professionnels du référencement. En tout état de cause, il y a certaines erreurs à ne pas commettre dans la gestion des 404, qui risqueraient de nuire à votre stratégie SEO :

  • Effectuer une redirection 301 systématique vers la page d’accueil : cette pratique peut être considérée comme du spam par Google ;
  • Effectuer une redirection en masse vers une page spécifique d’un site web (également considéré comme du spam) ;
  • Générer des « Soft 404 » : pages introuvables mais renvoyant un code http 200 (page valide). Contactez votre prestataire technique afin de vérifier la configuration du serveur ;
  • Bloquer l’exploration des pages 404 via le fichier Robots.txt : Google a besoin d’y accéder afin de les désindexer et ne pas « polluer » ses résultats de recherche ;
  • Abuser des redirections 301 consomme du budget crawl. Utilisez-les à bon escient.

L’utilité de créer une page 404 personnalisée

Une des bonnes pratiques est de personnaliser la page 404 de son site web. Le message affiché par défaut par le serveur est souvent très rebutant pour les internautes. Un simple texte tel que « Page non trouvée » ou « 404 not found » est alors affiché sans donner d’informations supplémentaires ni d’alternatives au visiteur dans le cadre de sa recherche.

La personnalisation de la page 404 vous permettra de réduire le taux de rebond (visiteurs quittant le site sans effectuer d’actions particulières car insatisfaits du résultat) et donnera davantage confiance aux internautes.

Voici quelques conseils utiles :

  • Soignez le design : la page 404 personnalisée doit avoir la même charte graphique que le reste de votre site (couleurs, logo, typographie) et conserver le menu de navigation ;
  • Diffusez une information claire : indiquez simplement que la page recherchée n’existe plus. Vous pouvez également ajouter une petite touche d’humour si vous êtes assez inspiré ;
  • Offrez des alternatives : donnez la possibilité aux internautes de consulter des contenus similaires (liens vers des pages produits, articles les plus consultés, best sellers, principales catégories) ou d’effectuer une nouvelle recherche via un moteur de recherche interne ;
  • Incluez un lien vers la page d’accueil.

Vous pouvez trouver des exemples de pages 404 personnalisées originales et travaillées sur les sites bonjour404.fr et Fab404.com.

En conclusion, gardez à l’esprit que les erreurs 404 ne font pas l’objet de pénalité de la part de Google mais qu’il est préférable de garder leur nombre limité. Corrigez seulement les pages qui ont un intérêt pour votre stratégie SEO et n’y passez pas un temps infini. Ceci vous permettra de vous concentrer sur des leviers beaucoup plus profitables pour votre référencement.


Florian Geri

Auteur

Florian Geri

Partager: