Erreur 404 : qu’est-ce que c’est ?
Le code d’erreur 404 est un numéro d’erreur renvoyé par le serveur http lorsqu’une page web n’est pas trouvée à une adresse spécifique.
C’est en quelques sortes le principe de NPAI (n’habite pas à l’adresse indiquée) de La Poste appliqué au web, où le serveur remplace La Poste et le code d’erreur 404 remplace la mention NPAI sur le colis ou la lettre.
Quels sont les différents types d’erreurs 404 et leurs impacts SEO ?
Il existe 4 grandes familles d’erreurs 404 qui ont toutes leurs spécificités :
- Les « erreurs 404 internes » (issues du maillage interne) : ces erreurs sont les plus fréquentes. Il s’agit concrètement de liens internes qui doivent rediriger vers une autre page de son site mais dont les URLs de destination sont soit mal renseignées, soit obsolètes. Ces liens sont les plus importants à corriger car ils ont un impact sur le crawl de Google, la bonne redistribution du Page Rank interne et l’expérience utilisateur.
- Les « erreurs 404 internes externes » (issues de liens internes sortants) : ces erreurs se concrétisent généralement par un lien sortant présent sur votre site et redirigeant vers un site ou une page web externe qui n’existe pas ou plus. Même si ce type d’erreur 404 n’est souvent pas de votre ressort, il est recommandé de supprimer ou remplacer ces liens pour éviter une mauvaise expérience utilisateur mais cela n’aura aucun impact sur votre SEO, si ce n’est que vous ne renverrez pas inutilement de Page Rank à une page web inutile. Moins vous avez d’erreurs de ce type, plus les moteurs peuvent se dire que votre site est régulièrement mis à jour, ce qui pourrait donc avoir un impact indirect positif.
- Les « erreurs 404 externes » (issues de liens entrants en provenance de sources externes) : si un autre site fait un lien vers l’une de vos pages en se trompant dans l’URL ou en redirigeant vers d’anciennes pages non redirigées de votre côté, cela générera donc une erreur 404 sur votre site qu’il est pertinent de corriger afin de tirer profit du Page Rank envoyé par ce backlink pour ensuite le redistribuer grâce à un maillage interne efficace.
- Les erreurs 404 associées à des fichiers média : si vous avez intégré des images ou fichiers pdf sur votre site qui ont ensuite été supprimés, les URLs d’accès des pages associées à ces médias, pour peu qu’elles soient maillées en interne ou externe, peuvent également générer des erreurs 404. Ce type d’erreur est toutefois généralement peu fréquent.
Dans une récente intervention sur Twitter, Google a répété qu’il était important de corriger les erreurs 404 internes. Ces dernières sont en effet les plus urgentes à corriger bien qu’il ne faille pas négliger l’impact des erreurs 404 externes qui font indirectement perdre du « link juice » et donc d’éventuels meilleurs positionnements sur certaines requêtes.
Qu’en est-il des erreurs soft 404 ?
Dans cette section, nous n’avons volontairement pas abordé la question des « soft 404« .
En effet, ce type « d’erreur 404 » est particulier puisque le code de réponse renvoyé par le serveur est justement un code 200 (succès) alors qu’il devrait être un code d’erreur 404. Il ne s’agit donc pas réellement d’erreurs 404, d’où le nom « soft 404« .
Concrètement, cela signifie qu’une page qui n’existe pas ou plus renvoie le mauvais code de réponse aux moteurs de recherche et n’est donc pas totalement considérée comme une 404 alors qu’elle le devrait.
Ce type d’erreur doit être corrigé car vous impacterez sinon votre budget de crawl inutilement puisque les moteurs de recherche continueront d’essayer de parcourir ce type de page inutile pour votre référencement au lieu d’autres pages potentiellement pertinentes.
Comment détecter les différentes erreurs 404 ?
Comme il en existe 4 types, et qu’elles ont leurs spécificités, voici ci-dessous quelques techniques utiles pour détecter les différentes erreurs 404 et ensuite les corriger.
Pour détecter les erreurs 404 Internes et Externes :
- Utiliser le rapport « Couverture » de la nouvelle Search Console et se rendre sur la section dédiée aux erreurs de type 404 afin d’obtenir et exporter une liste d’exemples que vous pourrez ensuite traiter manuellement ou en masse en fonction des URLs listées.
Pour détecter les erreurs 404 internes :
- Utiliser un crawler de type Screaming Frog ou similaire (Botify, OnCrawl, Sitebulb, Deepcrawl…) afin de relever tous les liens internes cassés sur l’intégralité de votre site web. Pour se faire, il suffit de lancer un crawl sur la racine de votre site web (et idéalement également l’Url de votre sitemap) puis de vous rendre dans la section dédiée aux 404 sur votre crawler favori. Vous obtiendrez ainsi une liste de tous les liens internes cassés que vous devriez corriger en priorité.
Pour détecter les erreurs 404 externes :
- Utiliser un outil d’analyse de backlinks de type Ahrefs et filtrer tous les backlinks par code de réponse de la page de destination : bien entendu, vous ne voudrez ici vous intéresser qu’aux backlinks qui effectuent un lien vers votre site vers une mauvaise Url ou une ancienne page non redirigée en 301 et répondant donc en 404.
- Utiliser le rapport « Couverture » de la nouvelle search console et se rendre dans la section dédiée aux 404 : Google référence ici à la fois un échantillon d’erreurs 404 internes et externes détectées.
Si vous souhaitez détecter les erreurs 404 lors de votre navigation pour être sûr que le code de réponse renvoyé par la page est bien une 404, vous pouvez utiliser une extension Chrome baptisée Link Redirect Trace (lien direct vers l’extension).
Quels sont les bonnes pratiques en matière de gestion d’erreurs 404 ?
Dans de nombreux cas, disposer d’erreurs 404 sur son site est normal et n’aura donc que très peu d’impacts négatifs sur le référencement naturel de votre site web.
Toutefois, un certain nombre de bonnes pratiques et recommandations sont à garder à l’esprit :
- Supprimer les liens internes cassés s’il n’existe plus de ressources sur votre site pouvant se substituer à l’ancienne.
- Modifier et remplacer les liens internes cassés par des liens internes de substitution afin de ne pas briser la circulation de votre page rank interne, mieux booster la page de substitution et afin d’optimiser le crawl et l’expérience utilisateur sur votre site.
- Supprimer les pages obsolètes répondant en 404 de votre sitemap. Si votre sitemap contient des répondant en 404, il est vivement recommandé de les supprimer pour arrêter de demander aux moteurs de recherche de les parcourir inutilement. Si vous n’avez pas la main sur leur suppression, il est recommandé à minima de les rediriger grâce à une redirection 301 vers une page de substitution liée ou proche sémantiquement.
- Personnaliser la page d’erreur 404 avec une page soit originale, soit optimisée pour l’expérience utilisateur, idéalement les deux.
- Rediriger via une 301 les mauvaises URLs ou pages obsolètes qui reçoivent des backlinks intéressant vers des pages de substitution proches sémantiquement afin de tirer profit du Page Rank envoyé par les sites externes pour ensuite le redistribuer via un maillage interne pertinent.
- Laisser les erreurs 404 telles quelles si votre objectif est qu’à terme Google désindexe les pages concernées. Si telle est votre volonté, vous pouvez aussi les transformer dans ce cas en 410 afin que les moteurs de recherche comprennent que les pages ne reviendront plus jamais.
- Les laisser telles quelles si les pages répondant en 404 sont des pages issues de 404 externes et qu’il n’existe sur votre site aucunes pages de substitution vers lesquelles les rediriger. Ce type d’erreurs sont fréquentes et Google ne vous pénalisera pas pour cela.
Fondateur de LEPTIDIGITAL et consultant SEO senior (à mes heures perdues), je suis un grand passionné de marketing digital et de SEO. Avant d’être indépendant à 100 %, j’ai travaillé en tant qu’SEO manager et responsable e-commerce pour différentes sociétés (Altice Media, Infopro Digital, Voyage Privé, Groupe ERAM). (Sur le plan perso, je suis un grand curieux hyperactif aussi passionné par l’IA, la photographie et les voyages !). PS : Si vous souhaitez me contactez, privilégiez LinkedIn ou Instagram. Pour me contacter : [email protected]
Hello, merci pour ton article, j’utilise aussi Screaming Frog pour détecter les liens cassés, c’est efficace, je vais tester tes autres conseils. merci