NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Google Spam Update : FAQ & Tout Ce Qu’il Faut Savoir

Qu’est-ce qu’une Google Spam Update ? Qu’est-ce que SpamBrain ? Faut-il s’inquiéter de la dernière Google Spam Update ? Voici ce qu’il faut retenir de ce type de mise à jour algorithmique de Google déployée pour la dernière fois le 19 Octobre 2022 (et finalisée le 21 Octobre).
Google core update
Google Spam Update

Qu’est-ce qu’une Google Spam Update ?

Bien que les systèmes automatisés de Google pour détecter le SPAM des résultats de recherche fonctionnent en permanence, ils apportent parfois des améliorations notables à leur fonctionnement.

Dans ce cas, Google parle alors d’une mise à jour de type « SPAM Update » et cette dernière est annoncée au travers de leurs moyens de communication habituels (ex : Twitter).

C’est le cas cette fois-ci avec la October 2022 Spam Update lancée le 19 Octobre 2022 qui a été finalisée le 21 Octobre 2022.

Qu’est-ce que Google SpamBrain ?

SpamBrain est le système de prévention automatique du spam basé sur l’IA développé par Google.

De temps à autre, Google améliore ce système pour qu’il soit plus performant dans la détection des spams et pour qu’il soit en mesure de détecter de nouveaux types de spams.

Quelles sont les principales techniques SEO (black hat / grey hat) ciblées par ces mises à jour de type « SPAM Update » de Google ?

Voici un aperçu en français des principales techniques SEO BlackHat pénalisées par Google via les SPAM Updates et son algorithme SpamBrain.

1- Le cloaking

Le Cloaking : Le cloaking désigne la pratique consistant à présenter un contenu différent aux utilisateurs et aux moteurs de recherche dans le but de manipuler les classements de recherche et d’induire les utilisateurs en erreur.

Voici quelques exemples de cloaking pénalisé par Google et la SPAM update :

  • Montrer une page sur les destinations de voyage aux moteurs de recherche tout en montrant une page sur les médicaments à prix réduits aux utilisateurs ;
  • Insérer du texte ou des mots-clés dans une page uniquement lorsque l’user-agent qui demande la page est un moteur de recherche et non un visiteur humain.
  • Si votre site utilise des technologies auxquelles les moteurs de recherche ont du mal à accéder, comme JavaScript ou les images, consultez nos recommandations pour rendre ce contenu accessible aux moteurs de recherche et aux utilisateurs sans occultation.

C’est bon à savoir :

  • Si vous utilisez un paywall ou un mécanisme de contrôle du contenu, Google ne considére pas qu’il s’agit d’un cloaking si Google peut voir le contenu complet de ce qui se trouve derrière le paywall comme toute personne ayant accès au contenu contrôlé et si vous suivez leurs recommandations sur l’échantillonnage flexible.

2- Les Doorways

Les Doorways : Les passerelles sont des sites ou des pages créés pour être classés pour des requêtes de recherche spécifiques et similaires. Ils conduisent les utilisateurs vers des pages intermédiaires qui ne sont pas aussi utiles que la destination finale.

Voici quelques exemples de pratiques de type Doorways qui sont pénalisées par la SpamUpdate :

  • Avoir plusieurs sites Web avec de légères variations de l’URL et de la page d’accueil afin de maximiser leur portée pour toute requête spécifique.
  • Avoir plusieurs noms de domaine ou pages ciblés sur des régions ou des villes spécifiques qui dirigent les utilisateurs vers une page.
  • Des pages générées pour diriger les visiteurs vers la partie réellement utilisable ou pertinente de votre ou vos sites.
  • Des pages très similaires qui sont plus proches des résultats de recherche que d’une hiérarchie clairement définie et consultable.

3- Le contenu piraté

Le contenu piraté est tout contenu placé sur un site sans autorisation, en raison de failles dans la sécurité du site. Le contenu piraté donne de mauvais résultats de recherche aux utilisateurs de Google et peut potentiellement installer du contenu malveillant sur leurs machines.

Voici quelques exemples de pratiques de piratage de site web qui sont ciblées par les SpamUpdate de Google :

  • L’injection de code : Lorsque les pirates accèdent à votre site Web, ils peuvent essayer d’injecter du code malveillant dans les pages existantes de votre site. Cela prend souvent la forme de JavaScript malveillant injecté directement dans le site ou dans des iframes.
  • Injection de pages : Parfois, en raison de failles de sécurité, les pirates sont en mesure d’ajouter de nouvelles pages à votre site, qui contiennent du spam ou du contenu malveillant. Ces pages sont souvent destinées à manipuler les moteurs de recherche ou à tenter le phishing. Vos pages existantes ne présentent peut-être pas de signes de piratage, mais ces pages nouvellement créées peuvent nuire aux visiteurs de votre site ou à ses performances dans les résultats de recherche.
  • Injection de contenu : Les pirates peuvent également essayer de manipuler subtilement les pages existantes de votre site. Leur objectif est d’ajouter du contenu à votre site que les moteurs de recherche peuvent voir, mais qui peut être plus difficile à repérer pour vous et vos utilisateurs. Il peut s’agir d’ajouter des liens cachés ou du texte caché à une page à l’aide de CSS ou de HTML, ou de modifications plus complexes comme le cloaking.
  • Redirections : Les pirates peuvent injecter un code malveillant sur votre site Web qui redirige certains utilisateurs vers des pages dangereuses ou des pages de spam. Le type de redirection dépend parfois du référent, de l’agent utilisateur ou de l’appareil. Par exemple, cliquer sur une URL dans les résultats de recherche Google peut vous rediriger vers une page suspecte, mais il n’y a pas de redirection lorsque vous visitez la même URL directement depuis un navigateur.

4- Le texte et les liens cachés

Le texte ou les liens cachés consistent à placer du contenu sur une page dans le seul but de manipuler les moteurs de recherche et de ne pas être facilement visible par les visiteurs humains.

Voici quelques exemples de textes ou de liens cachés qui violent les politiques anti spam de Google :

  • Utiliser du texte blanc sur un fond blanc ;
  • Cacher du texte derrière une image ;
  • Utilisation de CSS pour positionner le texte hors de l’écran ;
  • Régler la taille ou l’opacité de la police sur 0 ;
  • Masquer un lien en ne liant qu’un petit caractère (par exemple, un trait d’union au milieu d’un paragraphe).

Il existe aujourd’hui de nombreux éléments de conception Web qui utilisent l’affichage et le masquage du contenu de manière dynamique pour améliorer l’expérience de l’utilisateur ; ces éléments ne violent pas les politiques de Google. Voici des exemples concrets :

  • Les accordéons ou les onglets qui permettent de masquer ou d’afficher du contenu supplémentaire ;
  • Diaporama ou curseur qui alterne entre plusieurs images ou paragraphes de texte ;
  • Info-bulle ou texte similaire qui affiche du contenu supplémentaire lorsque les utilisateurs interagissent avec un élément. ;
  • Texte accessible uniquement aux lecteurs d’écran et destiné à améliorer l’expérience des utilisateurs de lecteurs d’écran (ex : balise alt) ;

5- Le bourrage de mots-clés (keyword stuffing)

Le bourrage de mots-clés est une pratique consistant à remplir une page Web de mots-clés ou de chiffres dans le but de manipuler le classement dans les résultats de recherche de Google. Souvent, ces mots clés apparaissent dans une liste ou un groupe, de façon anormale ou hors contexte.

Voici quelques exemples de bourrage de mots-clés :

  • Listes de numéros de téléphone sans valeur ajoutée substantielle ;
  • Blocs de texte énumérant les villes et les régions pour lesquelles une page Web tente d’obtenir un classement ;
  • Répéter les mêmes mots ou expressions si souvent que cela ne semble pas naturel.

6- Spam de liens (netlinking abusif)

Google utilise les liens comme un facteur important pour déterminer la pertinence des pages Web. Tout lien destiné à manipuler le classement dans les résultats de recherche de Google peut être considéré comme du spam. Cela inclut tout comportement visant à manipuler les liens vers votre site ou les liens sortants de votre site.

Les exemples suivants sont des exemples de spam de liens :

  • L’achat ou la vente de liens à des fins de classement. Cela inclut : l’échange d’argent contre des liens ou des articles contenant des liens ;
  • Échanger des biens ou des services contre des liens : ex : l’envoi d’un produit à quelqu’un en échange d’un article sur ce produit et d’un lien ;
  • Les échanges excessifs de liens (« Créez un lien vers moi et je créerai un lien vers vous ») ou les pages partenaires dans le seul but de créer des liens croisés ;
  • L’utilisation de programmes ou de services automatisés pour créer des liens vers votre site ;
  • L’exigence d’un lien dans le cadre de conditions de service, d’un contrat ou d’un accord similaire, sans laisser au propriétaire du contenu tiers le choix de qualifier le lien sortant ;
  • Annonces textuelles ou liens textuels qui ne sont pas déclarés en nofollow ;
  • Les publireportages ou les publicités natives pour lesquels un paiement est perçu pour des articles comprenant des liens qui passent PageRank, ou des liens avec un texte d’ancrage optimisé dans des articles, des articles invités ou des communiqués de presse distribués sur d’autres sites ;
  • Liens de répertoires, annuaires ou de site de signets de faible qualité ;
  • Liens riches en mots-clés, cachés ou de faible qualité, intégrés dans des widgets distribués sur divers sites ;
  • Liens sitewide, largement distribués dans les pieds de page (footer) ou les templates de divers sites ;
  • Des commentaires de forum avec des liens optimisés dans le message ou la signature par exemple.

C’est bon à savoir pour les éditeurs :

  • Google comprend que l’achat et la vente de liens constituent un élément normal de l’économie du Web à des fins de publicité et de parrainage. La présence de tels liens ne constitue pas une violation de leurs règles pour autant qu’ils soient qualifiés par une valeur d’attribut rel= »nofollow » ou rel= »sponsorisé ».

7- Trafic généré par des machines / robots

Le faux trafic, comprenez le trafic généré artificiellement par des machines, consomme des ressources et interfère avec la capacité de Google à servir au mieux les utilisateurs.

Voici quelques exemples de trafic automatisé qui est pénalisé par les SpamUpdate de Google :

  • L’envoi de requêtes automatisées à Google pour tromper les recommandations Google Suggest ;
  • L’extraction de résultats à des fins de vérification du classement ou tout autre type d’accès automatisé à Google Search sans autorisation expresse (en d’autres termes, tous les logiciels d’analyse de positionnements SEO ne respectent pas les guidelines anti-spam de Google…).

8- Les sites hébergeant des logiciels et comportements malveillants

Google vérifie les sites Web pour voir s’ils hébergent des logiciels malveillants ou des logiciels indésirables qui nuisent à l’expérience des utilisateurs.

Un logiciel malveillant est un logiciel ou une application mobile spécifiquement conçu pour nuire à un ordinateur, à un appareil mobile, au logiciel qu’il exécute ou à ses utilisateurs. Les logiciels malveillants ont un comportement malveillant qui peut inclure l’installation de logiciels sans le consentement de l’utilisateur et l’installation de logiciels nuisibles tels que des virus. Les propriétaires de sites ne réalisent parfois pas que leurs fichiers téléchargeables sont considérés comme des logiciels malveillants, de sorte que ces binaires peuvent être hébergés par inadvertance.

Un logiciel indésirable est un fichier exécutable ou une application mobile qui adopte un comportement trompeur, inattendu ou qui affecte négativement la navigation ou l’expérience informatique de l’utilisateur. Il peut s’agir, par exemple, d’un logiciel qui modifie votre page d’accueil ou d’autres paramètres de navigation pour les remplacer par des paramètres que vous ne souhaitez pas, ou d’applications qui divulguent des informations privées et personnelles sans les divulguer.

9- Les fonctionnalités trompeuses

Les propriétaires de sites doivent créer des sites au contenu de haute qualité et aux fonctionnalités utiles pour les utilisateurs. Toutefois, certains propriétaires de sites ont l’intention de manipuler le classement dans les moteurs de recherche en créant intentionnellement des sites dotés de fonctionnalités et de services trompeurs qui font croire aux utilisateurs qu’ils peuvent accéder à certains contenus ou services, mais qui ne le peuvent pas en réalité.

Voici quelques exemples de fonctionnalités trompeuses :

  • Un site avec un faux générateur de code promo qui prétend fournir un code promo auprès d’une boutique en ligne, mais qui ne le fait pas réellement.
  • Un site qui prétend fournir certaines fonctionnalités (par exemple, la fusion de PDF, un compte à rebours, un service de dictionnaire en ligne), mais qui dirige intentionnellement les utilisateurs vers des publicités trompeuses au lieu de fournir les services revendiqués.

10- Le contenu scrapé, dupliqué, volé et récupéré dynamiquement

Certains propriétaires de sites basent leurs sites sur du contenu extrait (« scrapé ») d’autres sites, souvent plus réputés. Le contenu récupéré, même s’il provient de sources de haute qualité, sans services ou contenus utiles supplémentaires fournis par votre site, peut ne pas apporter de valeur ajoutée aux utilisateurs. Il peut également constituer une violation des droits d’auteur. Un site peut également être rétrogradé / pénalisé par Google si un nombre important de demandes de suppression légales valables ont été reçues.

Voici quelques exemples de raclage abusif :

  • Les sites qui copient et republient le contenu d’autres sites sans ajouter de contenu original ou de valeur, ni même citer la source originale.
  • Les sites qui copient le contenu d’autres sites, ne le modifient que légèrement (par exemple, en substituant des synonymes ou en utilisant des techniques automatisées) et le republient.
  • Les sites qui reproduisent des flux de contenu provenant d’autres sites sans offrir un avantage unique à l’utilisateur.
  • Sites consacrés à l’intégration ou à la compilation de contenus, tels que des vidéos, des images ou d’autres médias provenant d’autres sites, sans valeur ajoutée substantielle pour l’utilisateur.

11- Les redirections sournoises

La redirection est le fait d’envoyer un visiteur vers une URL différente de celle qu’il a initialement demandée. La redirection sournoise est une action malveillante visant à montrer aux utilisateurs et aux moteurs de recherche un contenu différent ou à montrer aux utilisateurs un contenu inattendu qui ne répond pas à leurs besoins initiaux.

Voici quelques exemples de redirections sournoises pénalisées par Google :

  • Montrer aux moteurs de recherche un type de contenu tout en redirigeant les utilisateurs vers quelque chose de sensiblement différent ;
  • Montrer aux utilisateurs de bureau une page normale tout en redirigeant les utilisateurs mobiles vers un domaine de spam complètement différent.

Bien que la redirection sournoise soit un type de spam, il existe de nombreuses raisons légitimes, sans spam, de rediriger une URL vers une autre.

Voici quelques exemples de redirections légitimes :

  • Déplacer votre site vers une nouvelle adresse ;
  • Consolidation de plusieurs pages en une seule ;
  • Rediriger les utilisateurs vers une page interne une fois qu’ils sont connectés.

Lorsqu’on examine si une redirection est sournoise, il faut se demander si elle est destinée à tromper les utilisateurs ou les moteurs de recherche.

12- Contenu généré automatiquement par des spammeurs

Le contenu généré automatiquement (ou « auto-généré ») est un contenu qui a été généré de manière programmatique sans produire quoi que ce soit d’original ou sans ajouter une valeur suffisante ; au contraire, il a été généré dans le but principal de manipuler les classements de recherche et non d’aider les utilisateurs.

Voici quelques exemples de contenu généré automatiquement à des fins de spam :

  • Un texte qui n’a aucun sens pour le lecteur, mais qui contient des mots-clés de recherche ;
  • Texte traduit par un outil automatisé sans révision humaine ou curation avant publication ;
  • Texte généré par des processus automatisés sans tenir compte de la qualité ou de l’expérience de l’utilisateur ;
  • Texte généré à l’aide de techniques automatisées de synonymisation, content spinning, de paraphrase ou d’obscurcissement ;
  • Texte généré à partir de flux RSS ou de résultats de recherche ;
  • L’assemblage ou la combinaison de contenus provenant de différentes pages Web sans y ajouter une valeur ajoutée suffisante.

C’est bon à savoir :

  • Si vous hébergez de tels contenus sur votre site et que vous pensez que ces contenus apportent une réelle valeur ajoutée à vos utilisateurs, vous pouvez utiliser les méthodes de non-indexation pour les exclure des résultats de recherches et ainsi préserver votre site dans sa totalité.

13- Les pages d’affiliation avec du contenu « mince »

Les pages d’affiliation minces sont des pages contenant des liens d’affiliation de produits sur lesquelles les descriptions et les avis sur les produits sont copiés directement du marchand d’origine, sans contenu original ni valeur ajoutée.

Les pages d’affiliation peuvent être considérées comme minces si elles font partie d’un programme qui distribue son contenu à travers un réseau d’affiliés sans apporter de valeur ajoutée.

Ces sites semblent souvent être des sites peu qualitatifs avec un design peu travaillé et dotés d’un contenu identique ou similaire reproduit sur le même site ou sur plusieurs domaines ou langues.

Si une page de résultats de recherche de Google affichait plusieurs de ces sites, tous avec le même contenu, les pages d’affiliation au contenu mince créeraient une expérience frustrante pour l’utilisateur.

C’est bon à savoir :

  • Tous les sites qui participent à un programme d’affiliation ne sont pas forcément des sites avec du contenu de faible qualité. Les bons sites d’affiliation ajoutent de la valeur en proposant un contenu ou des fonctionnalités utiles. Parmi les exemples de bonnes pages d’affiliation, citons l’offre d’informations supplémentaires sur le prix, des avis originaux sur les produits, des tests et des évaluations rigoureux, la navigation dans les produits ou les catégories et des comparaisons de produits.

14- Le Spam généré par l’utilisateur

Le spam généré par l’utilisateur est un type de contenu indésirable ajouté à un site par des utilisateurs via un canal destiné au contenu utilisateur.

Souvent, les propriétaires du site ne sont pas conscients de ce contenu indésirable.

Voici quelques exemples de contenu indésirable généré par les utilisateurs :

  • Les comptes spammeurs sur les services d’hébergement web auxquels tout le monde peut s’inscrire gratuitement ;
  • Messages indésirables dans les fils de discussion des forums ;
  • Les spams de commentaires sur les blogs (SPAMco) ;
  • Les fichiers indésirables téléchargés sur des plates-formes d’hébergement de fichiers.

Pourquoi Google est-il obligé de lancer ces mises-à-jour anti-SPAM ?

Les règles de Google en matière de spam contribuent à protéger les utilisateurs et à améliorer la qualité des résultats de recherche.

Pour pouvoir apparaître dans les résultats de recherche sur le Web de Google (pages Web, images, vidéos, contenu d’actualité ou autres éléments trouvés par Google sur le Web), le contenu ne doit pas enfreindre les règles générales de Google Search ou les règles relatives au spam énumérées dans cet article.

Ces règles s’appliquent à tous les résultats de recherche sur le Web, y compris ceux provenant des propriétés de Google.

Google détecte de mieux en mieux les contenus et les comportements contraires aux règles par le biais de systèmes automatisés et, le cas échéant, d’un examen humain qui peut aboutir à une action manuelle.

Les sites qui enfreignent leurs règles peuvent être moins bien classés dans les résultats ou ne pas apparaître du tout dans les résultats.

Si vous pensez qu’un site enfreint les règles de Google en matière de spam, vous pouvez le faire savoir à Google en remplissant un rapport sur la qualité des résultats de recherche.

Votre site a été impacté négativement suite à une Google SPAM Update ? Qu’est-ce que cela signifie-t-il ?

Les sites qui constatent un changement négatif sur les KPIs SEO après une mise à jour de type « spam update » doivent revoir les politiques en matière de spam de Google pour s’assurer qu’ils s’y conforment.

Les sites qui enfreignent les politiques de Google peuvent être moins bien classés dans les résultats ou ne pas apparaître du tout dans les résultats.

Combien de temps est nécessaire pour sortir d’une pénalisation pour SPAM par Google ?

Cela peut prendre plusieurs mois.

Si des modifications sont apportées pour améliorer un site, les systèmes automatisés de Google apprendront au fil des mois que le site respecte ses politiques en matière de spam et ce dernier pourra donc prétendre à de meilleures positions après la prochaine MAJ majeure par exemple.

Si cet article sur les Google Spam Updates vous a plu, n’hésitez pas à le partager sur les réseaux sociaux et à vous abonner à notre newsletter digitale pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur Linkedin, Twitter, Facebook et YouTube.

Pour toute question associée à cet article, n’hésitez pas à utiliser la section « commentaires » pour nous faire part de votre remarque, nous vous répondrons (avec plaisir) dans les meilleurs délais. 

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *