
L’essentiel en bref
- John Mueller et Martin Splitt (Google) rejettent l’idée que des pages en markdown, réduites au contenu, soient meilleures pour le référencement dans l’IA.
- Argument central : convertir du HTML en texte est trivial pour un robot, donc le markdown n’apporte aucun gain de crawl.
- Le markdown supprime les liens, les médias, la navigation et la structure qui servent à découvrir les pages et à situer un site.
- Google ne traitera pas un fichier markdown comme version de référence tant qu’il peut extraire le contenu d’origine du HTML.
Ce que Google reproche aux pages markdown réservées aux bots :
Le point de départ est une idée qui circule beaucoup chez les adeptes du SEO pour l’IA : servir aux agents et aux modèles une version épurée de chaque page, en markdown, débarrassée du HTML d’affichage.
L’intuition paraît logique, moins de balises, moins de tokens, un texte plus lisible pour une machine.
Martin Splitt reconnaît cette logique. Du HTML brut ouvert dans un éditeur de texte reste difficile à lire, noyé sous les balises et les styles en ligne.
Le markdown, lui, garde une structure compréhensible même quand son rendu échoue : un lien reste identifiable, un titre aussi.
C’est ce minimalisme qui séduit ceux qui veulent produire des versions de pages pensées pour les LLM.
Le problème, selon les deux représentants de Google, c’est que cet avantage est largement imaginaire pour un moteur de recherche.
Définition
Markdown : langage de balisage léger qui met en forme du texte (titres, listes, liens) avec des symboles simples, sans le code d’affichage et de mise en page propre au HTML.
Pourquoi l’argument du markdown s’effondre côté crawl ?
John Mueller règle la question du crawl en quelques phrases. Le web et le HTML existent depuis bien plus longtemps que le markdown. Tous les robots d’exploration se sont entraînés sur du HTML depuis des années. Et surtout, extraire le texte d’une page HTML est une opération triviale, gérée par de nombreuses bibliothèques disponibles.
En clair : le principal argument de vente du markdown, simplifier le crawl et l’indexation pour les modèles, ne tient plus. Si un robot lit déjà sans effort le contenu enfoui dans le HTML, le fichier markdown devient redondant. Vous dupliquez un travail que le moteur fait seul.
Le vrai angle mort : la découverte des pages
Martin Splitt pointe un effet plus gênant. Le markdown se concentre sur une seule chose : le contenu. Il supprime les liens, la navigation et les en-têtes. Or ce sont précisément ces éléments qui aident un moteur à comprendre comment une page se relie au reste du site, et à découvrir d’autres pages de proche en proche.
Un moteur ne voit pas un site comme une pile de pages isolées. Il le lit comme un ensemble de sections, de catégories et de liens qui dialoguent entre eux, puis comme un point parmi des millions d’autres sites reliés. Ce que le markdown jette comme du superflu, le moteur l’utilise comme signal de structure. Le maillage interne n’est pas du bruit.
Reste la question de la confiance : un fichier markdown servi à part finit toujours par être détourné, comme l’avait été l’ancienne balise meta keywords. Un moteur de recherche comme Google n’a ainsi aucune raison de retenir une version markdown comme source de référence quand il peut extraire le contenu réel du HTML.
Ce que ça change pour votre stratégie SEO et GEO ?
Le message de Google est clair : ne construisez pas une version markdown parallèle de votre site en pensant gagner des positions auprès de Google. Le gain de crawl annoncé n’existe pas, et la version risque d’être ignorée comme source canonique.
Les fondamentaux ne bougent pas. Un HTML propre, des titres sémantiques, une navigation lisible et un maillage interne soigné servent à la fois le référencement classique et la visibilité dans les réponses génératives.
C’est aussi ce que confirment les recommandations officielles de Google pour l’AI Mode et plusieurs travaux récents sur la performance du contenu IA dans le référencement.
Une nuance utile s’impose toutefois : le markdown garde de vrais usages. Documenter un projet, alimenter votre propre base documentaire pour un système RAG, transporter du contenu d’un outil à l’autre. Le débat ne porte pas sur l’outil, mais sur l’idée de s’en servir comme levier de positionnement.
Pour la visibilité, mieux vaut regarder quelles stratégies GEO fonctionnent vraiment que de parier sur des fichiers réservés aux machines. Si votre objectif est de cadrer l’accès des IA à vos contenus, le fichier llms.txt répond à un besoin différent, et ne remplace pas un site bien structuré.
Notre verdict
Le markdown réservé aux bots repose sur une intuition non vérifiée. Tant que Google extrait sans effort le contenu du HTML, dupliquer son site en markdown pour plaire aux agents IA revient à entretenir une page que le moteur n’utilisera pas comme référence. Le temps est mieux investi dans un HTML propre, un maillage interne solide et un contenu réellement utile qui aura un double impact positif : SEO et GEO.
Alors, selon vous, faut-il vraiment maintenir deux versions d’un même site, une pour les humains et une pour les machines, ou cette logique est-elle déjà un faux problème pour les équipes SEO ?
Source officielle :
Vous pouvez réécouter leur échange dans l’épisode 111 de Search Off the Record.

Fondateur de LEPTIDIGITAL et SUPASST, je suis également consultant spécialisé en acquisition de leads B2B (SaaS). Passionné par le marketing digital, l’intelligence artificielle et le SEO. Avant de devenir indépendant, j’ai occupé des postes clés en tant que SEO Manager et responsable e-commerce pour plusieurs grandes entreprises (Altice Media, Infopro Digital, Voyage Privé et le Groupe ERAM). Sur le plan perso, je suis un curieux insatiable, également passionné par la photographie, le badminton et les voyages. Pour toute demande de partenariat, privilégiez LinkedIn ou email ([email protected]).