Faut-il avoir peur des erreurs 404 ?

Corriger une erreur 404

Sur les différents forums que l’on parcourt (à propos de prestashop, wordpress, SEO etc.), il n’est pas rare de trouver des sujets abordant de manière un peu paniquée les erreurs 404 retournées par google bot.

On retrouve souvent ce genre de questions :

  • « Augmentation de 404, que faire ? »
  • « beaucoup d’erreurs 404 au niveau de mon site »
  • etc.

Tout d’abord, est-ce vraiment si grave ?

Non, ce n’est pas dramatique, cela n’influera pas directement sur votre positionnement, du moins, si ce ne sont pas vos propres pages qui envoient vers ces erreurs… S’il s’agit de pages ayant disparu car plus utiles au site, google finira pas les ignorer, il est tout de même nécessaire de vérifier quelques petites choses avant de faire une croix dessus ! Voir ci-dessous ce qu’en dit google sur GWT (Google Webmaster Tool)

err 404 GWT

Quels conseils peut-on donner?

Il y a plusieurs étapes afin de corriger correctement ces erreurs.

1 – S’assurer que ces pages 404 ne sont pas présentes dans le sitemap, plan de site ou toute autre page qui pourrait pointer vers celle-ci.

Si aucun lien interne n’est fait vers vos 404, les robots ne devraient plus y acceder autrement que par un crawl direct et finiront par ne plus revenir. A moins qu’un lien externe pointe dessus, c’est la que l’on passe à l’étape 2.

2 – Vérifier si aucun lien externe ne pointe sur cette page

Plusieurs méthodes peuvent être utiles.

  • Repérer les sites référents de la page 404 depuis son système d’analyse statistique. (Google analytics par exemple)
  • Utiliser Ahref ou OpenSiteexplorer pour analyser les liens qui pointent vers cette page (attention, ils ne sont pas actualisés en direct et ces systèmes peuvent passer à coté de certains liens.)
  • Vérifier aussi si elles ne sont pas partagées sur les réseaux sociaux en y ajoutant un bouton j’aime par exemple.

3 – Il y a des liens naturels qui pointent vers ces pages ?

Si vous retrouvez des liens intéressants qui pointent vers ces pages, vous aurez tout à gagner à faire une redirection 301 vers la nouvelle page. Afin d’indiquer aux moteurs que la page a déménagé.

4 – Ne faites pas de 301 sur des pages inutiles

Attention à ne pas trop abuser des 301, cela peut faire perdre du temps de crawl aux robots et ainsi empêcher les bots de parcourir les pages importantes de votre site rapidement.

Ainsi, si vos pages ne reçoivent aucun lien externe, et n’ont aucun trafic en provenance des moteurs de recherche ou réseaux sociaux. Alors laissez les finir leur vie et disparaitre…

5 – Faire des 410

Dans certains cas, il peut être envisageable de créer des 410 . Cette erreur indique que la page a bien existé, mais qu’elle a été délibérément supprimée… Pour ma part, c’est difficile à envisager de remplacer la 404 par celle-ci automatiquement, il faut faire du cas par cas. Sur une simple petite erreur de manip qui pourrait temporairement mettre une page voir tout une architecture en faute, on risque d’y perdre des plumes… (plugin obsolète lors d’une mise à jour par exemple…)

Quels conseils ne pas donner ?

J’ai souvent vu la réponse: va dans GWT et indique à Google que les erreurs sont corrigées en allant sur Exploration > Erreurs d’exploration…

Certes, elles seront marquées comme corrigées, mais cela n’indiquera rien du tout à google, ce n’est qu’une aide de l’interface utilisateur qui vous permet de vous y retrouver. En aucun cas google les considèrera comme des urls à ne plus crawler.

Par contre, d’un point de vue organisation, je vous conseille de les cocher afin qu’elles disparaissent de votre interface une fois corrigées. Dans tous les cas, si google les crawl à nouveau, elles réapparaitront.

Et pour finir…

Article publié le 6 février 2014 par Benoit Perrier

Il y a 4 commentaires pour ce billet

Le 7 février 2014 à 11 h 17 min par Hervé

Avec la 404, les moteurs de recherche ont toujours le cul entre 2 chaises : « Je supprimme, je supprime pas ». Avec la 410, c’est clair net et précis !

Comme mentionné dans ton article, c’est à utiliser avec beaucoup de précaution. Dans mon cas, j’ai tout automatisé dans mon script maison pour éviter les erreurs (de manipulation ^^).

Le 7 février 2014 à 12 h 10 min par percevalSEO

Cet article reflète ce que je pense et comment je traite moi même les 404. J’ai presque l’impression de l’avoir écrit ! J’ajouterai juste deux choses.

Avant de mettre en place des 301 on peut essayer de contacter le webmaster du site faisant le lien erroné pour qu’il le modifie par le bon lien. C’est mieux que de mette en place une 301 par contre il y a un léger risque car le webmaster peut tout simplement décider de supprimer le lien.

Petit bémol sur webmaster tool car je ne le trouve pas très fiable. Sur certaines erreurs 404 remontées en allant voir les pages dans « Référencée sur », le lien n’y était pas du tout… 2 possibilités :
– google nous envoie des données non mises à jour (la date de détection du lien était pourtant récente)
– certains s’amusent à cloaker leur page pour faire une sorte de NSEO avec des 404… Je n’y crois pas trop car ça ne serait pas vraiment efficace.

Le 7 février 2014 à 12 h 52 min par Benoit Perrier (author)

@Hervé, c’est sur que lorsque tu maitrises complètement l’outil de gestion de ton site, c’est différent. Il ne faut pas faire de bourde dans les MAJ, c’est tout, mais ca, je te fais confiance! 😉

@Perceval Exacte, GWT remonte parfois des 404 qui n’ont aucune origine référente.
Perso, je pense que ce sont simplement des pages qu’il connait, mais qu’il a pas encore désindexé pour X raison. Probablement un algo défaillant. Dans tous les cas, ce n’est pas grave pour le positionnement.

Le 31 mars 2015 à 10 h 15 min par Welldev

Bonjour,
un petit up pour ce sujet 🙂 j’ai perdu suite à un hack d’un des sites de mes clients presque tout le contenu, du coup j’ai fait avec ce que j’ai mais dans le GWT cela me remonte souvent des erreurs sur les images (exemple wp-content/uploads/2014/09/justuci sort en 404) référencé sur post-sitemap.xml

le sitemap.xml est récent (en tout cas je l’ai mis après la perte des données) et contenant un peu plus que 1000 URL je ne sais pas comment faire pour éviter ou corriger cette erreur 404 d’images 🙁

MErci pour votre aide !

Pour discuter de l'article, vous pouvez utiliser les commentaires ci-dessous.