Anthropic Fable et Mythos bloqués : la fronde des experts en cybersécurité

Plus de cent dirigeants et experts en cybersécurité, emmenés par Alex Stamos (ex-RSSI de Facebook), demandent à l’administration américaine de lever l’interdiction qui frappe Fable 5 et Mythos 5, les deux modèles les plus puissants d’Anthropic, suspendus quatre jours après leur lancement. Leur thèse tient en une phrase : retirer ces modèles aux défenseurs ne freine en rien les attaquants. L’argument est pertinent mais faut-il pour autant leur donner entièrement raison ?
Claude Fable 5 interdit

L’essentiel en bref

  • Le 13 juin, le département du Commerce américain a déclenché une directive d’export control qui a forcé Anthropic à couper Fable 5 et Mythos 5 pour tous ses clients, y compris aux États-Unis.
  • Une lettre ouverte signée par plus de 100 figures de la cybersécurité (Bruce Schneier, Mikko Hyppönen, Katie Moussouris, Chris Wysopal) réclame la levée de la mesure.
  • Leur point fort : la capacité visée n’est pas exclusive à Anthropic. GPT-5.5 ou des modèles chinois ouverts font la même chose.
  • Leur angle mort : la même capacité sert à patcher du code et à fabriquer un exploit. Le dual-use n’est pas un détail.

Ce que demande la lettre ouverte signée par la cybersécurité

La lettre est adressée au secrétaire au Commerce Howard Lutnick et au directeur national du cyber Sean Cairncross. Elle demande deux choses : lever immédiatement les directives qui ont sorti Fable 5 et Mythos 5 du marché, et bâtir un processus d’évaluation du risque IA qui soit scientifique, démocratique, transparent et limité au strict nécessaire. Vous pouvez la consulter sur freefable.org.

Le contexte des faits est important. Anthropic a lancé Fable 5 le 9 juin, premier modèle de sa nouvelle classe « Mythos », présentée comme la plus avancée jamais rendue publique par l’entreprise. Quatre jours plus tard, l’ordre tombe. Selon Anthropic, le gouvernement invoque un « jailbreak » potentiel : demander au modèle de lire une base de code et d’en corriger les failles. L’entreprise affirme avoir examiné une démonstration qui n’a identifié qu’un petit nombre de vulnérabilités déjà connues et mineures.

4 jours Le délai entre le lancement public de Fable 5 (9 juin) et son retrait forcé du marché (13 juin). (Sources : Anthropic, Cybersecurity Dive)

La portée de la directive explique la coupure totale. L’ordre vise tout ressortissant étranger, où qu’il se trouve, y compris les salariés non américains d’Anthropic. Impossible techniquement de filtrer canal par canal : l’entreprise a donc tout débranché. Les modèles Claude Opus 4.8 et Sonnet, eux, restent disponibles.

Pourquoi l’argument des signataires tient debout

Le cœur de la lettre est difficile à contester. Les signataires reconnaissent que les modèles Mythos sont bons pour repérer des failles et écrire des exploits. Mais ils ajoutent un point décisif : ils ne sont pas uniquement bons à ça. La même tâche se reproduit, selon eux, sur GPT-5.5, sur Opus, sur Sonnet et sur des modèles chinois en open-weight comme Kimi 2.7. Si la capacité est partout, bannir un seul fournisseur ne retire rien aux attaquants. Ça pénalise surtout les défenseurs qui l’utilisaient légalement.

C’est l’asymétrie qui rend la mesure contestable. Un attaquant motivé garde l’accès à des dizaines d’alternatives, dont des modèles chinois performants et téléchargeables que personne ne peut rappeler. Le défenseur, lui, perd l’outil qui l’aidait à auditer son propre code, parfois des couches logicielles vieilles de vingt ans. On a déjà vu une IA détecter une faille critique passée inaperçue dans du code open source : la valeur défensive est réelle, pas théorique.

Anthropic partage cette lecture. L’entreprise estime qu’un jailbreak étroit ne devrait pas justifier le rappel d’un modèle commercial déployé à grande échelle, et prévient qu’appliqué à toute l’industrie, ce standard gèlerait le déploiement de tous les modèles de pointe. Sur le fond réglementaire, la critique vise juste : une décision aussi lourde, sans détail technique communiqué et sans délai de correction, pose un précédent inquiétant pour l’ensemble du secteur. Pour l’Europe, qui observe le grand écart américain entre dérégulation affichée et coups de force ponctuels, le signal est brouillé. Nous l’avions déjà pointé à propos de la fin des garde-fous IA aux États-Unis.

Là où la lettre est plus fragile qu’elle n’y paraît

Aller dans leur sens ne dispense pas de regarder les angles morts. Et il y en a.

  1. Premier point : l’argument « ce n’est pas exclusif » se retourne. Si trouver des failles et écrire des exploits fonctionnels est désormais à la portée de la plupart des grands modèles, dont ceux du classement des meilleurs LLM, alors la capacité cyberoffensive de l’IA se diffuse largement. C’est un motif d’inquiétude collective, pas une raison de relâcher l’attention sur un acteur précis. La lettre minimise le risque pour gagner la bataille du jour.
  2. Deuxième point : le dual-use. Repérer qu’un bout de code est vulnérable et fabriquer l’exploit qui l’attaque, c’est techniquement très proche. La lettre présente la capacité déclencheuse comme du simple « codage sécurisé ». C’est partiellement vrai et un peu pratique. Anthropic elle-même reconnaissait au lancement que, sans garde-fous, les capacités cyber de Fable 5 pouvaient causer de sérieux dégâts. Mythos 5, réservé à un cercle restreint de défenseurs, embarquait d’ailleurs moins de protections que Fable. Le risque n’est donc pas une invention administrative.
  3. Troisième point : les signataires ne sont pas neutres. Beaucoup dirigent des sociétés de sécurité qui font tourner ces modèles au quotidien, ou gravitent dans l’écosystème d’Anthropic et de ses modèles Claude. Le plaidoyer pour « rendre l’IA aux défenseurs » recoupe largement leurs intérêts commerciaux. Ça n’invalide pas leur expertise, mais ça invite à lire la liste des 100 noms avec une part de prudence.
  4. Dernier point : la logique « la Chine n’est qu’à quelques mois » peut tout justifier. Poussée à bout, elle dit qu’aucune restriction n’a de sens puisque l’adversaire finira par l’avoir. C’est un raisonnement de course vers le bas. Il peut être juste ici, et dangereux ailleurs.

Ce que ça change concrètement pour les pros

Pour les équipes qui avaient déjà câblé Fable ou Mythos dans leurs workflows d’audit, de pentest ou de revue de code, la coupure est brutale et sans préavis. Si vous bâtissez des pipelines critiques sur un modèle de pointe, l’épisode rappelle une règle simple : prévoyez une porte de sortie. Un modèle peut disparaître du jour au lendemain pour des raisons qui n’ont rien à voir avec sa qualité technique.

Au-delà du cas Anthropic, c’est l’incertitude réglementaire qui s’installe. Tant qu’un déploiement peut être stoppé par une directive opaque, sans critère public ni délai de remédiation, les responsables sécurité et les directions techniques avancent sans visibilité. C’est précisément ce que la lettre veut corriger en réclamant des règles écrites et prévisibles. Sur ce terrain, elle a raison, quelles que soient les arrière-pensées de ses auteurs.

Notre verdict

La lettre a raison sur la proportionnalité et sur la méthode : retirer un modèle parmi d’autres, par une directive opaque et sans délai de correction, est probablement inefficace et clairement mauvais pour la prévisibilité du marché. Elle a tort de balayer le risque dual-use d’un revers de main. Le vrai sujet n’est pas « la capacité cyber de l’IA est inoffensive », elle ne l’est pas, mais « cette décision-ci était disproportionnée et mal calibrée ». La bonne réponse est un meilleur processus, pas un déni du danger.

Si la même capacité de détection de failles existe déjà chez la plupart des grands modèles, sur quel critère défendable un État peut-il encore décider d’en suspendre un seul ?

5/5 - (1 vote)

2 Replies to “Anthropic Fable et Mythos bloqués : la fronde des experts en cybersécurité”

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *