⚡Pas le temps ? On lit (et filtre) toute l’actu digitale pour vous.  Rejoignez +30 000 abonnés → 

Le fonctionnement de Google Discover a été décortiqué par cet expert : ce qu’il faut retenir

Comment fonctionne réellement Google Discover ? Pourquoi certains médias explosent en visibilité tandis que d’autres disparaissent du jour au lendemain ? Un chercheur indépendant affirme avoir analysé des dizaines de milliers de lignes de code de l’application Google pour comprendre ce qui se passe en coulisses. Voici ce que cette enquête technique révèle et ce que cela implique concrètement.
Fonctionnement de Google Discover

Une plongée rare dans les coulisses de Google Discover

Metehan Yesilyurt, chercheur spécialisé en SEO et en visibilité sur les moteurs, a récemment publié une analyse technique détaillée du fonctionnement interne de Google Discover.

Son approche est particulière : il n’a pas étudié les recommandations officielles de Google mais a analysé le code de l’application Google elle-même, côté utilisateur.

Autrement dit : il a observé ce que l’application envoie, reçoit et enregistre pour comprendre comment le flux d’articles fonctionne.

Attention, cette analyse ne donne aucun accès aux algorithmes secrets de classement de Google Discover mais cela permet de voir :

  1. les étapes de traitement d’un article,
  2. les systèmes de filtrage en place,
  3. les mécanismes de personnalisation,
  4. les données internes suivies,
  5. et certaines priorités techniques.

Comment un article entre (ou non) dans Google Discover ?

L’analyse montre qu’un article suivrait une suite d’étapes bien définies avant d’apparaître dans le flux des utilisateurs.

Les grandes étapes du pipeline :

Voici le parcours simplifié :

  1. Crawl et indexation (Google découvre et enregistre la page)
  2. Extraction d’entités (identification des sujets et thèmes)
  3. Analyse des métadonnées (titre, auteur, image…)
  4. Classification en groupes (clusters)
  5. Filtrage éditeur et URL
  6. Correspondance avec les centres d’intérêt
  7. Classement final côté serveur
  8. Affichage dans le flux
  9. Analyse des réactions utilisateurs

Schema.org passe avant Open Graph : un détail important

Capture DonanimHaber OG Source Code

Beaucoup pensent que les balises Open Graph sont prioritaires mais selon l’analyse du code, ce sont d’abord les données structurées Schema.org qui sont lues par Google.

Pour le titre, l’auteur et l’éditeur, l’ordre est le suivant :

  • Schema.org JSON-LD
  • og:title
  • twitter:title
  • Balises génériques

En clair : si vos données structurées sont incorrectes ou mal optimisées, Discover peut afficher des informations erronées, même si vos balises Open Graph sont bonnes.

Le système de filtrage à deux niveaux : un risque sous-estimé

Le flux Discover applique deux types de filtres qui peuvent impacter la visibilité des articles ou d’un média :

NiveauPortéeConséquence
CollectionTout le médiaBlocage global
EntityUn article précisBlocage individuel

Si un utilisateur clique sur “Ne plus afficher ce média”, cela peut bloquer l’ensemble du site dans son flux.

Un article qui génère trop de réactions négatives peut donc pénaliser tous les autres.

Un enjeu majeur pour :

  • les médias d’actualité,
  • les sites à fort trafic,
  • les marques dépendantes de Discover.

Le système NAIADES : le coeur de la personnalisation des recommandations d’articles Google Discover ?

Optimisation du Flux News _ Comment NAIADES Priorise les Éditeurs Enregistrés (WPAS)

L’analyse mentionne un système interne appelé NAIADES qui servirait à adapter le flux aux intérêts de chaque utilisateur :

  1. Personnalisation basée sur les sujets consultés
  2. Basée sur les recherches effectuées
  3. Signal éditeur (WPAS)
  4. Priorité de récupération (recall boost)

Le signal WPAS semble lié à l’inscription au Google News Publisher Center mais ce n’est pas confirmé. Si cela se confirme côté serveur, les éditeurs enregistrés pourraient bénéficier d’un traitement particulier dans la personnalisation.

Un flux vivant et très évolutif : Discover fonctionne en continu

Discover n’est pas une simple page qui se recharge.

La connexion reste active en permanence.

  • Des articles peuvent apparaître en temps réel.
  • Un contenu peut être retiré après affichage.
  • L’ordre peut changer pendant que vous scrollez.

Le flux est donc dynamique et évolue en continu.

Ce que cela signifie réellement pour votre stratégie

Ce qui est déjà exploitable :

  • Soigner l’implémentation Schema.org.
  • Utiliser une image principale d’au moins 1200px.
  • Éviter les balises notranslate et nopagereadaloud.
  • Réduire les signaux négatifs (titres trompeurs, putaclics, mauvaise expérience sur la page, popin intrusives).

Ce qui reste incertain :

  • Le poids exact du signal WPAS.
  • Les seuils précis de blocage.
  • Les critères de classement internes.

Cette analyse concerne le fonctionnement visible de l’application. Les décisions finales restent contrôlées par Google côté serveur.

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *