Google dévoile une technologie de filigrane invisible dans les textes générés par IA : ce qu’il faut savoir

7 novembre 2024 0

Alors que sans détecteur de texte rédigé par IA, le contenu généré par l’intelligence artificielle devient de plus en plus difficile à distinguer des textes rédigés par les humains, Google a développé SynthID-Text, un système de filigrane innovant intégré à son modèle Gemini qui permet de détecter plus efficacement. Voici ce qu’il faut savoir à son sujet.

Comment fonctionne SynthID-Text ?

La technologie SynthID-Text, mise à disposition par Google DeepMind et Hugging Face, repose sur un système de filigrane intégré au processus de génération de texte des grands modèles de langage (LLM), sans nécessiter de modifications coûteuses.

Contrairement aux méthodes traditionnelles, SynthID-Text utilise une approche qui modifie subtilement la manière dont le texte est généré, sans altérer la qualité perçue, pour insérer un filigrane imperceptible par l’utilisateur.

Aperçu du système de filigrane intégré dans un texte sans que cela n'impacte le rendu final — Aperçu du système de filigrane intégré dans un texte sans que cela n’impacte le rendu final

Voici les points clés à connaitre sur cette technologie :

Principe de watermarking : SynthID-Text marque chaque texte produit de manière subtile, en créant une signature statistique détectable par des algorithmes. Cette méthode utilise des « seeds », ou valeurs de départ aléatoires, pour influencer le choix des mots de manière imperceptible.
Détection : Une fois intégré, le filigrane peut être détecté sans accès direct au modèle d’origine, en analysant les signatures statistiques présentes dans le texte. Les résultats de la détection sont probabilistes, avec trois états possibles : texte filigrané, texte non filigrané ou résultat incertain.

Une technologie testée via 20 millions d’interactions avec Gemini

Pour évaluer SynthID-Text, Google a mené des tests grandeur nature en intégrant cette technologie dans son chatbot Gemini.

Près de 20 millions d’interactions ont été analysées par les équipes de Google.

D’après Google, la technologie n’aurait pas eu d’impact significatif sur la perception de qualité des utilisateurs. Les taux de satisfaction des utilisateurs, mesurés par le nombre de « j’aime » sur les réponses du chatbot, seraient même légèrement supérieur pour les réponses filigranées par rapport aux réponses non filigranées.

Quelles limites pour cette technologie d’insertion de filigrane dans les LLMs ?

Malgré son intérêt, SynthID-Text présente un certain nombre de limites qui risques de limiter son usage à plus grande échelle dans sa version actuelle :

Vulnérabilité aux transformations : certains types de modifications, comme la paraphrase ou la traduction, peuvent réduire l’efficacité du filigrane. Cela limite l’usage de SynthID-Text dans des contextes où le texte généré est souvent remanié.
Faible norme dans l’industrie : actuellement, il n’existe pas de standardisation dans le domaine du filigrane pour les IA. Chaque entreprise développe sa propre méthode, ce qui complique l’identification de contenus IA générés par des acteurs multiples.
Utilisation limitée aux parties coopératives : SynthID-Text ne protège pas contre les utilisateurs malveillants ou les modèles d’IA ouverts qui ne respectent pas les standards de watermarking.

Une solution de filigrane de ce type ne pourra ainsi pas garantir une protection contre la fraude ou la manipulation de contenus par l’IA.

Vers une adoption généralisée des filigranes pour l’IA ?

Si SynthID-Text marque un pas en avant intéressant dans la détection des contenus générés par des IA, sans adoption d’une technologie commune par toutes les entreprises du secteur, l’initiative, bien qu’intéressante, aura des impacts limités.

En permettant aux développeurs et entreprises de vérifier l’origine de leurs propres contenus, Google répond en tout cas à une demande croissante de transparence dans l’usage de ces technologies.

Pour les professionnels du digital qui redoutent la généralisation de ce type de système de détection peu coûteux et techniquement efficace, soyez rassurés, puisque ce n’est pas encore pour aujourd’hui…

Avant de se quitter…

Si cet article sur SynthID-Text vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Benjamin Beinard

Principalement passionné par les nouvelles technologies, l’IA, la cybersécurité, je suis un professionnel de nature discrète qui n’aime pas trop les réseaux sociaux (je n’ai pas de comptes publics). Rédacteur indépendant pour LEPTIDIGITAL, j’interviens en priorité sur des sujets d’actualité mais aussi sur des articles de fond. Pour me contacter : [email protected]

www.leptidigital.fr/