Cette décision est inattendue et ne concerne pas uniquement les clients situés en dehors des États-Unis. Les ressortissants étrangers se trouvant sur le territoire américain, ainsi que les employés étrangers d’Anthropic, sont également concernés par ces restrictions.
Incertitude quant au risque pour la sécurité
Claude Fable 5 et Claude Mythos 5 ont été présentés la semaine dernière comme la dernière génération de modèles d’IA d’Anthropic. Fable 5 s’adressait à un large public et mettait l’accent sur la sécurité et les interactions contrôlées. Mythos 5, quant à lui, visait des applications plus spécialisées, notamment la programmation, la cybersécurité et la recherche.
Selon Anthropic, la directive gouvernementale ne fournit que peu de détails sur la raison précise de cette intervention. L’entreprise soupçonne toutefois que cette mesure est liée à une éventuelle technique de jailbreak pour Claude Fable 5. Dans le cadre d’un tel jailbreak, les utilisateurs tentent de contourner les mesures de sécurité intégrées d’un modèle d’IA afin d’obtenir des réponses qui sont normalement bloquées.
Anthropic souligne qu’il n’existerait pas de méthode universelle permettant de contourner la sécurité de Fable 5. Selon l’entreprise, il s’agirait tout au plus d’un problème limité qui ne pourrait survenir que dans des circonstances spécifiques. Afin de se conformer pleinement aux règles en vigueur, Anthropic a provisoirement désactivé l’accès à ces deux modèles dans le monde entier. Par conséquent, personne ne peut actuellement utiliser Claude Fable 5 ou Claude Mythos 5.
Anthropic défend son processus de développement
La société spécialisée dans l’IA souligne que les modèles ont fait l’objet de tests approfondis avant leur lancement. Ces tests ont mobilisé non seulement des chercheurs internes, mais aussi des organismes de sécurité externes, des autorités publiques et l’AI Safety Institute britannique. Selon Anthropic, des milliers d’heures ont été consacrées à l’évaluation des risques potentiels et des scénarios d’abus. Fable 5, en particulier, a été doté de mesures de sécurité supplémentaires afin d’empêcher que le modèle ne puisse être utilisé pour des cyberattaques ou d’autres activités malveillantes. De plus, lors de tests approfondis menés par une équipe de simulation d’attaques (red team), aucune méthode générale permettant de contourner les mécanismes de protection n’aurait été découverte.
Pour l’instant, la disponibilité des anciens modèles Claude ne change guère pour les utilisateurs. Ceux-ci restent tout simplement accessibles et ne sont pas concernés par les restrictions à l’exportation. Anthropic met toutefois en garde contre les conséquences plus larges de telles mesures. Si les entreprises spécialisées dans l’IA doivent retirer des modèles en raison de vulnérabilités théoriques ou dont l’existence n’a été que partiellement démontrée, cela pourrait, selon l’entreprise, ralentir considérablement le développement et le déploiement de systèmes d’IA avancés.
Cette suspension temporaire fait d’ailleurs suite à un autre incident concernant Claude Fable 5. Auparavant, Microsoft aurait restreint l’accès au modèle pour ses propres employés en raison de questions relatives aux nouvelles règles de conservation des données d’Anthropic. Selon les deux entreprises, cette affaire est toutefois sans rapport avec la mesure gouvernementale actuelle. Anthropic affirme quant à elle collaborer étroitement avec les autorités américaines afin de clarifier la situation et de rétablir l’accès à Claude Fable 5 et Claude Mythos 5 dès que possible. On ne sait pas encore exactement quand cela aura lieu.







