SEO, GEO et LLM : pourquoi Google déconseille les pages markdown réservées aux bots ?

Le markdown est-il vraiment la meilleure façon d’optimiser un site pour l’IA ? Deux porte-parole de Google disent l’inverse. Dans l’épisode 111 du podcast Search Off the Record, John Mueller et Martin Splitt expliquent que les versions de pages réduites au seul contenu retirent justement ce qui aide un moteur à comprendre et à classer une page. De quoi refroidir une idée très répandue dans le SEO appliqué à l’IA.
Markdown utile pour SEO

L’essentiel en bref

  • John Mueller et Martin Splitt (Google) rejettent l’idée que des pages en markdown, réduites au contenu, soient meilleures pour le référencement dans l’IA.
  • Argument central : convertir du HTML en texte est trivial pour un robot, donc le markdown n’apporte aucun gain de crawl.
  • Le markdown supprime les liens, les médias, la navigation et la structure qui servent à découvrir les pages et à situer un site.
  • Google ne traitera pas un fichier markdown comme version de référence tant qu’il peut extraire le contenu d’origine du HTML.

Ce que Google reproche aux pages markdown réservées aux bots :

Le point de départ est une idée qui circule beaucoup chez les adeptes du SEO pour l’IA : servir aux agents et aux modèles une version épurée de chaque page, en markdown, débarrassée du HTML d’affichage.

L’intuition paraît logique, moins de balises, moins de tokens, un texte plus lisible pour une machine.

Martin Splitt reconnaît cette logique. Du HTML brut ouvert dans un éditeur de texte reste difficile à lire, noyé sous les balises et les styles en ligne.

Le markdown, lui, garde une structure compréhensible même quand son rendu échoue : un lien reste identifiable, un titre aussi.

C’est ce minimalisme qui séduit ceux qui veulent produire des versions de pages pensées pour les LLM.

Le problème, selon les deux représentants de Google, c’est que cet avantage est largement imaginaire pour un moteur de recherche.

Définition

Markdown : langage de balisage léger qui met en forme du texte (titres, listes, liens) avec des symboles simples, sans le code d’affichage et de mise en page propre au HTML.

Pourquoi l’argument du markdown s’effondre côté crawl ?

John Mueller règle la question du crawl en quelques phrases. Le web et le HTML existent depuis bien plus longtemps que le markdown. Tous les robots d’exploration se sont entraînés sur du HTML depuis des années. Et surtout, extraire le texte d’une page HTML est une opération triviale, gérée par de nombreuses bibliothèques disponibles.

Le vrai angle mort : la découverte des pages

Martin Splitt pointe un effet plus gênant. Le markdown se concentre sur une seule chose : le contenu. Il supprime les liens, la navigation et les en-têtes. Or ce sont précisément ces éléments qui aident un moteur à comprendre comment une page se relie au reste du site, et à découvrir d’autres pages de proche en proche.

Un moteur ne voit pas un site comme une pile de pages isolées. Il le lit comme un ensemble de sections, de catégories et de liens qui dialoguent entre eux, puis comme un point parmi des millions d’autres sites reliés. Ce que le markdown jette comme du superflu, le moteur l’utilise comme signal de structure. Le maillage interne n’est pas du bruit.

Ce que ça change pour votre stratégie SEO et GEO ?

Le message de Google est clair : ne construisez pas une version markdown parallèle de votre site en pensant gagner des positions auprès de Google. Le gain de crawl annoncé n’existe pas, et la version risque d’être ignorée comme source canonique.

Les fondamentaux ne bougent pas. Un HTML propre, des titres sémantiques, une navigation lisible et un maillage interne soigné servent à la fois le référencement classique et la visibilité dans les réponses génératives.

C’est aussi ce que confirment les recommandations officielles de Google pour l’AI Mode et plusieurs travaux récents sur la performance du contenu IA dans le référencement.

Pour la visibilité, mieux vaut regarder quelles stratégies GEO fonctionnent vraiment que de parier sur des fichiers réservés aux machines. Si votre objectif est de cadrer l’accès des IA à vos contenus, le fichier llms.txt répond à un besoin différent, et ne remplace pas un site bien structuré.

Notre verdict

Le markdown réservé aux bots repose sur une intuition non vérifiée. Tant que Google extrait sans effort le contenu du HTML, dupliquer son site en markdown pour plaire aux agents IA revient à entretenir une page que le moteur n’utilisera pas comme référence. Le temps est mieux investi dans un HTML propre, un maillage interne solide et un contenu réellement utile qui aura un double impact positif : SEO et GEO.

Alors, selon vous, faut-il vraiment maintenir deux versions d’un même site, une pour les humains et une pour les machines, ou cette logique est-elle déjà un faux problème pour les équipes SEO ?

Source officielle :

Vous pouvez réécouter leur échange dans l’épisode 111 de Search Off the Record.

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *