Anthropic révise la Responsible Scaling Policy v3, assouplissant des engagements clés en matière de sécurité sous la pression du Pentagone

Anthropic révise sa Politique de mise à l'échelle responsable v3 (Responsible Scaling Policy v3), assouplissant ses engagements clés en matière de sécurité sous la pression du Pentagone

Anthropic, largement considérée comme la conscience soucieuse de la sécurité dans la course à l'IA générative (Generative AI), a publié la troisième version de sa Politique de mise à l'échelle responsable (RSP v3). La mise à jour, qui restructure fondamentalement la manière dont l'entreprise gère les risques catastrophiques liés à l'IA, survient à un moment d'intenses frictions géopolitiques et commerciales. Alors que l'entreprise fait face à un ultimatum signalé du département de la Défense des États-Unis concernant l'utilisation militaire de sa technologie, la suppression de son engagement de sécurité « phare » — suspendre le développement si la sécurité ne peut être garantie — a suscité un examen attentif de la part des observateurs de l'industrie.

Le passage de la « pause conditionnelle » à la « transparence pragmatique »

Depuis sa création, la RSP d'Anthropic a été définie par un mécanisme d'« engagements conditionnels ». Sous la précédente RSP v2, l'entreprise s'engageait à interrompre l'entraînement ou le déploiement de nouveaux modèles s'ils franchissaient des seuils spécifiques de « niveau de sécurité de l'IA » (AI Safety Level - ASL) sans que des mesures de protection correspondantes ne soient en place. Cette approche de « fil de détente » (tripwire) a été conçue pour donner la priorité à la sécurité sur la vitesse compétitive.

Avec la RSP v3, Anthropic s'est éloignée de ces arrêts stricts. L'entreprise soutient que les pauses unilatérales sont inefficaces dans un marché où les concurrents continuent de progresser. Au lieu de cela, la nouvelle politique met l'accent sur la transparence et la fixation d'objectifs publics.

Composants clés de la RSP v3 :

Feuilles de route pour la sécurité à la frontière (Frontier Safety Roadmaps) : Au lieu de pauses internes contraignantes, Anthropic publiera désormais des « Feuilles de route » détaillant ses objectifs de sécurité. Celles-ci sont décrites comme « ambitieuses mais non contraignantes », visant à créer une responsabilité publique plutôt que des goulots d'étranglement opérationnels stricts.
Rapports de risques : L'entreprise s'engage à publier des évaluations de risques complètes tous les 3 à 6 mois. Ces rapports détailleront le profil de sécurité de leurs modèles actuels, y compris les écarts entre les capacités actuelles et les normes de sécurité idéales.
Examen externe : Dans des scénarios spécifiques à haut risque, Anthropic soumettra ses rapports de risques à l'examen d'experts tiers pour valider leurs conclusions.

Anthropic executives ont présenté ce changement comme une réponse « pragmatique » à la réalité. Dans un article de blog accompagnant la publication, l'entreprise a noté que « l'arrêt de l'entraînement des modèles d'IA n'aiderait personne en réalité » si d'autres développeurs moins scrupuleux continuent de progresser. Ils ont cité l'échec d'une « course vers le haut » (race to the top) — où les concurrents émuleraient les restrictions de sécurité d'Anthropic — comme principal moteur de ce changement.

Comparaison : RSP v2 vs RSP v3

Le tableau suivant présente les changements structurels entre la politique précédente et la version nouvellement publiée.

Caractéristique/Engagement	RSP v2 (Précédente)	RSP v3 (Actuelle)
Mécanisme central	Pause conditionnelle (Fils de détente ASL)	Transparence et feuilles de route
Engagement de sécurité	Arrêt de l'entraînement si la sécurité n'est pas garantie	Objectifs unilatéraux pragmatiques
Documentation	Évaluations internes et seuils définis	Feuilles de route publiques pour la sécurité à la frontière
Rapports de risques	Focus ad hoc et interne	Rapports de risques publics systématiques (3-6 mois)
Stratégie industrielle	Montrer l'exemple (Race to the Top)	Passage à la compétitivité nationale

L'ultimatum du Pentagone : un catalyseur géopolitique ?

Le timing de la RSP v3 est impossible à dissocier de l'impasse croissante entre Anthropic et l'armée américaine. Des rapports confirment que le secrétaire à la Défense Pete Hegseth a récemment rencontré le PDG d'Anthropic, Dario Amodei, lui remettant un ultimatum clair : lever les restrictions sur l'utilisation militaire des modèles Claude ou faire face à de graves conséquences.

Le Pentagone exigerait qu'Anthropic autorise l'utilisation de son IA à « toute fin légale », privant de fait l'entreprise de son droit de veto sur des applications militaires spécifiques. Anthropic a historiquement maintenu des « lignes rouges » strictes contre l'utilisation de sa technologie pour :

Les armes autonomes (où l'IA prend des décisions de ciblage létales sans intervention humaine).
La surveillance domestique de masse.

Le département de la Défense a menacé d'invoquer la Loi sur la production de défense (Defense Production Act - DPA) — une loi datant de la guerre de Corée qui permet au président d'obliger les entreprises privées à donner la priorité aux contrats de défense nationale. De plus, des responsables ont évoqué la possibilité de désigner Anthropic comme un « risque pour la chaîne d'approvisionnement », ce qui placerait de fait l'entreprise sur liste noire pour tous les contrats fédéraux, lui coûtant potentiellement des centaines de millions de revenus et l'excluant du lucratif secteur gouvernemental.

Les critiques soutiennent que l'assouplissement des engagements de « pause » de la RSP crée une faille politique pratique. En supprimant l'exigence stricte d'interrompre le déploiement sur la base de seuils de sécurité internes, Anthropic pourrait se positionner pour satisfaire aux demandes du Pentagone sans techniquement violer sa propre constitution de sécurité.

Implications pour l'industrie et le « surplomb de capacité »

La révision de la RSP met en lumière une tension croissante dans l'industrie de l'IA : le « surplomb de capacité » (capability overhang). Ce terme fait référence à l'écart entre la puissance brute d'un modèle d'IA et les mécanismes de sécurité disponibles pour le contrôler. La politique précédente d'Anthropic était conçue pour empêcher ce surplomb de devenir trop important. En retirant le frein d'urgence, l'entreprise accepte implicitement un niveau de risque plus élevé pour rester compétitive face à des rivaux comme OpenAI et xAI, qui ont déjà obtenu d'importants contrats de défense.

Pourquoi cela compte pour l'écosystème de l'IA :

Normalisation de l'IA militaire : Si Anthropic, le défenseur le plus vocal de la sécurité dans l'industrie, plie sous la pression du Pentagone, cela signale la fin de l'« objection de conscience » parmi les principaux laboratoires d'IA.
L'échec de l'autorégulation : Ce changement reconnaît que les engagements volontaires sont insuffisants face aux impératifs de sécurité nationale et à la dynamique du marché. Anthropic a explicitement cité l'absence de réglementation fédérale comme raison de son pivot politique.
Focus sur la surveillance post-déploiement : Les pauses pré-déploiement ayant disparu, le focus de l'industrie sur la sécurité se déplacera probablement entièrement vers le « red teaming » (simulation d'attaques) et les systèmes de surveillance après leur construction, plutôt que d'empêcher leur création en premier lieu.

Conclusion

La RSP v3 d'Anthropic représente une prise de conscience mature, bien que cynique, du paysage de l'IA en 2026. L'idéalisme de 2023 — où une seule entreprise pouvait orienter l'industrie vers la sécurité par son leadership moral — s'est heurté aux dures réalités de la concurrence entre grandes puissances et des nécessités militaires. Bien que l'introduction des Rapports de risques et des Feuilles de route pour la sécurité à la frontière offre une nouvelle couche de transparence, la suppression de l'« engagement de sécurité » contraignant marque la fin d'une ère. Alors que le Pentagone se profile à l'horizon, Anthropic n'essaie plus de ralentir le train ; elle promet simplement de siffler plus fort à mesure qu'il accélère.