AI News

Anthropic expose un vaste réseau de distillation impliquant de grands laboratoires d'IA chinois

Dans une escalade significative de la course aux armements de l'intelligence artificielle (IA) en cours, Anthropic a publiquement accusé trois éminents laboratoires d'IA chinois — DeepSeek, Moonshot AI et MiniMax — de mener une campagne systématique à l'échelle industrielle pour extraire les capacités de ses modèles Claude. Les allégations, détaillées dans un nouveau rapport de sécurité publié lundi, décrivent comment ces organisations auraient utilisé des milliers de comptes frauduleux pour « distiller » les capacités avancées de raisonnement et de codage de Claude dans leurs propres modèles propriétaires.

Cette révélation intervient à un moment critique pour l'industrie mondiale de l'IA, coïncidant avec des débats intensifiés à Washington concernant l'efficacité des contrôles à l'exportation de semi-conducteurs. Alors que les décideurs américains s'efforcent de limiter l'accès de la Chine au matériel de pointe, les conclusions d'Anthropic suggèrent que le vol de propriété intellectuelle via la distillation de modèles est devenu une voie principale pour les concurrents afin de contourner les contraintes matérielles et de combler l'écart de capacité.

L'ampleur de l'opération de « distillation »

Selon l'enquête d'Anthropic, l'effort coordonné a impliqué la génération de plus de 16 millions d'échanges avec les modèles Claude via un réseau sophistiqué d'environ 24 000 comptes frauduleux. Ces comptes, prétendument gérés par des services de proxy commerciaux pour masquer leurs origines, ont été utilisés pour interroger Claude de manière systématique, enregistrant ses sorties pour entraîner des modèles domestiques plus petits — un processus connu en apprentissage automatique (Machine Learning) sous le nom de « distillation ».

Bien que la distillation soit une technique légitime utilisée par les développeurs pour compresser leurs propres grands modèles en des versions plus efficaces, l'extraction de données à partir du modèle d'un concurrent sans autorisation viole les conditions de service et constitue un vol de propriété intellectuelle. Les données d'Anthropic indiquent que l'opération n'était pas une expérience fortuite mais une extraction hautement organisée de comportements cognitifs à haute valeur ajoutée.

L'ampleur de l'attaque a varié de manière significative selon les institutions accusées, MiniMax semblant être l'agresseur le plus agressif. La répartition suivante illustre la portée des activités présumées :

Tableau : Répartition des activités de distillation présumées par laboratoire

Nom du laboratoire Échanges estimés Capacités cibles principales
MiniMax ~13 millions Codage agentique, orchestration d'outils et séquences de raisonnement complexes
Moonshot AI ~3,4 millions Raisonnement agentique, analyse de données et tâches de vision par ordinateur
DeepSeek >150 000 Logique fondamentale, protocoles d'alignement et requêtes sensibles aux politiques

Anatomie d'un hold-up de l'IA

La méthodologie décrite par Anthropic révèle une compréhension sophistiquée des pipelines d'entraînement des modèles de langage étendus (Large Language Models ou LLM). Les attaquants ne se sont pas contentés de poser des questions au hasard ; ils ont ciblé des comportements spécifiques de « l'enseignant » qui sont difficiles et coûteux à reproduire de zéro.

MiniMax, identifié comme le plus grand auteur, aurait redirigé près de la moitié de son propre trafic vers Claude dans les 24 heures suivant la sortie d'un nouveau modèle, utilisant efficacement l'infrastructure d'Anthropic pour booster les capacités de son propre système. En injectant des invites d'utilisateurs dans Claude et en utilisant les réponses de haute qualité pour entraîner leurs propres modèles, ces laboratoires pourraient théoriquement atteindre une parité quasi totale avec les modèles américains de pointe tout en ne dépensant qu'une fraction des ressources de calcul (Compute).

Les tactiques clés identifiées dans le rapport incluent :

  • Élicitation de chaîne de pensée (Chain-of-Thought Elicitation) : inciter Claude à « montrer son travail » ou à expliquer ses étapes de raisonnement, générant des données d'entraînement riches qui enseignent aux modèles « étudiants » comment réfléchir, et non seulement quoi répondre.
  • Obscurcissement par réseau de proxy : utiliser des réseaux de proxy résidentiels décentralisés pour distribuer les requêtes, faisant apparaître le trafic comme s'il provenait de milliers d'utilisateurs distincts et légitimes.
  • Suppression ciblée des garde-fous : interroger spécifiquement des sujets sensibles pour comprendre comment Claude refuse ou gère les demandes de sécurité, potentiellement pour entraîner des modèles qui contournent des restrictions similaires.

La dimension de sécurité nationale : des garde-fous supprimés

Au-delà des implications commerciales du vol de propriété intellectuelle, Anthropic a souligné une grave préoccupation en matière de sécurité : la suppression des garde-fous de sécurité. Les modèles frontières américains comme Claude sont soumis à un entraînement rigoureux d'« IA constitutionnelle » (Constitutional AI) pour les empêcher d'aider à la création d'armes biologiques, de cyberattaques ou de campagnes de désinformation.

Lorsqu'un modèle est distillé de manière illicite, le modèle « étudiant » apprend souvent les capacités de « l'enseignant » sans hériter de ses inhibitions de sécurité. Anthropic prévient que ces clones « déchaînés » posent un risque de prolifération unique. Si un modèle distillé conserve la compétence de codage de Claude mais manque de ses mécanismes de refus pour la génération de logiciels malveillants, il devient une arme puissante pour les acteurs malveillants.

« Les modèles distillés de manière illicite manquent des garde-fous nécessaires, créant des risques importants pour la sécurité nationale », a déclaré Anthropic dans son document de recherche intitulé Detecting and Preventing Distillation Attacks. L'entreprise soutient que permettre à des entités étrangères de cloner les capacités d'IA américaines sape les protocoles de sécurité mêmes que le gouvernement américain a exhorté l'industrie à adopter.

Nouvelles mesures défensives : l'empreinte comportementale

Coïncidant avec l'accusation, Anthropic a publié des détails sur de nouveaux mécanismes de défense conçus pour identifier et bloquer les tentatives de distillation en temps réel. Le cœur de cette défense est l'« empreinte comportementale » (behavioral fingerprinting), une technique qui analyse les schémas statistiques de l'utilisation des API.

Contrairement aux utilisateurs légitimes qui présentent des schémas d'interaction organiques et variés, les scripts de distillation laissent souvent des signatures statistiques subtiles. Celles-ci incluent :

  • Distributions d'invites non naturelles : Une fréquence élevée d'invites conçues pour couvrir tout « l'espace de connaissance » d'un modèle plutôt que de résoudre les problèmes immédiats des utilisateurs.
  • Balayage systématique des paramètres : Varier systématiquement la température ou les paramètres d'échantillonnage pour extraire des sorties diverses pour la même invite.
  • Corrélation de latence : Des schémas temporels suggérant que l'API est appelée par programme en réponse à une entrée d'utilisateur tiers (une configuration de type « homme du milieu »).

Anthropic a annoncé qu'elle partageait ces indicateurs techniques avec d'autres grands laboratoires d'IA américains (tels qu'OpenAI et Google DeepMind), les fournisseurs de cloud et les autorités gouvernementales afin d'établir une grille de défense à l'échelle de l'industrie contre le minage de modèles.

Retombées géopolitiques : le lien avec la guerre des puces

Cet incident jette un pavé dans la mare des relations technologiques complexes entre les États-Unis et la Chine. Le moment est particulièrement sensible, car le Département du Commerce des États-Unis examine actuellement l'efficacité des contrôles à l'exportation qui interdisent la vente de GPU avancés, comme le H100 de NVIDIA et la nouvelle série Blackwell, aux entreprises chinoises.

Les critiques des interdictions d'exportation actuelles soutiennent qu'elles sont insuffisantes si les laboratoires chinois peuvent simplement « contourner intelligemment » les déficits matériels en copiant l'intelligence des modèles américains. Si un laboratoire peut entraîner un modèle compétitif en utilisant 10 % de la puissance de calcul en distillant Claude, la « barrière de calcul » visant à ralentir les progrès de l'IA en Chine devient nettement plus poreuse.

Implications pour les politiques :

  • Contrôles d'API plus stricts : Nous pourrions voir les régulateurs américains exiger des normes « Know Your Customer » (KYC) pour l'accès aux API d'IA, similaires aux réglementations bancaires, afin d'empêcher l'accès étranger anonyme.
  • Expansion des contrôles à l'exportation : La définition d'« exportation » pourrait être élargie pour inclure non seulement les puces physiques ou les poids des modèles, mais aussi l'accès aux API d'inférence de modèles qui peuvent être utilisées pour l'entraînement.
  • Mesures de rétorsion : Cette dénonciation publique pourrait provoquer des cyberactivités de rétorsion ou des sanctions de la part de Pékin, bifurquant davantage l'écosystème mondial de l'IA.

Conclusion

Les accusations portées par Anthropic marquent une transition des risques théoriques vers un conflit documenté dans le secteur de l'IA. À mesure que les modèles deviennent plus précieux, ils ne sont plus seulement des produits mais des actifs stratégiques nationaux. Le « hold-up de la distillation » sert de rappel brutal que, à l'ère numérique, la capacité peut être volée tout aussi facilement qu'elle peut être construite. Pour l'industrie, l'accent doit désormais passer de la simple construction de modèles plus intelligents à la construction de modèles plus difficiles à voler, garantissant que les fruits de l'innovation américaine n'alimentent pas par inadvertance les concurrents mêmes qu'ils étaient censés dépasser.

Vedettes
AdsCreator.com
Générez instantanément des créations publicitaires soignées et conformes à la marque à partir de n’importe quelle URL pour Meta, Google et Stories.
Refly.ai
Refly.AI permet aux créateurs non techniques d'automatiser des workflows en utilisant le langage naturel et une toile visuelle.
VoxDeck
Créateur de présentations IA menant la révolution visuelle
BGRemover
Supprimez facilement les arrière-plans d'images en ligne avec SharkFoto BGRemover.
FixArt AI
FixArt AI propose des outils d'IA gratuits et sans restriction pour la génération d'images et de vidéos, sans inscription.
Skywork.ai
Skywork AI est un outil innovant pour améliorer la productivité grâce à l'IA.
Qoder
Qoder est un assistant de codage propulsé par l'IA qui automatise la planification, le codage et les tests des projets logiciels.
Flowith
Flowith est un espace de travail agentique basé sur un canevas qui offre gratuitement 🍌Nano Banana Pro et d'autres modèl
FineVoice
Transformez le texte en émotion — Clonez, concevez et créez des voix IA expressives en quelques secondes.
Elser AI
Studio web tout‑en‑un qui transforme textes et images en art anime, personnages, voix et courts‑métrages.
Pippit
Élevez votre création de contenu avec les puissants outils d'IA de Pippit !
SharkFoto
SharkFoto est une plateforme tout-en-un alimentée par l'IA pour créer et éditer efficacement des vidéos, images et musiques.
Funy AI
Animez vos fantasmes ! Créez des vidéos IA de baisers ou bikinis à partir d'images/textes. Essayez le changeur de vêteme
KiloClaw
Agent OpenClaw hébergé : déploiement en un clic, plus de 500 modèles, infrastructure sécurisée et gestion automatisée des agents pour les équipes et les développeurs.
Diagrimo
Diagrimo transforme instantanément le texte en diagrammes et visuels personnalisables générés par IA.
SuperMaker AI Video Generator
Créez des vidéos, de la musique et des images époustouflantes sans effort avec SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer de SharkFoto vous permet d'essayer virtuellement des tenues instantanément, avec un ajustement, une texture et un éclairage réalistes.
Yollo AI
Discutez et créez avec votre compagnon IA. Image vers vidéo, génération d'images IA.
AnimeShorts
Créez facilement des courts-métrages d'anime époustouflants grâce à des technologies d'IA de pointe.
HappyHorseAIStudio
Générateur de vidéos IA basé sur le navigateur pour le texte, les images, les références et le montage vidéo.
Anijam AI
Anijam est une plateforme d’animation native à l’IA qui transforme les idées en histoires abouties grâce à la création vidéo agentique.
happy horse AI
Générateur vidéo IA open source qui crée des vidéos et de l'audio synchronisés à partir de texte ou d'images.
InstantChapters
Générez instantanément des chapitres de livre captivants avec Instant Chapters.
wan 2.7-image
Un générateur d’images IA contrôlable pour des visages précis, des palettes, du texte et une continuité visuelle.
NerdyTips
Une plateforme de pronostics football alimentée par l’IA, fournissant des conseils de match basés sur les données pour les championnats du monde entier.
WhatsApp AI Sales
WABot est un copilote de vente IA pour WhatsApp qui fournit des scripts en temps réel, des traductions et la détection d'intention.
Claude API
Claude API for Everyone
AI Video API: Seedance 2.0 Here
API vidéo IA unifiée offrant des modèles de génération de pointe via une seule clé, à moindre coût.
Image to Video AI without Login
Outil IA gratuit Image vers Vidéo qui transforme instantanément les photos en vidéos animées fluides et de haute qualité sans filigrane.
insmelo AI Music Generator
Générateur de musique piloté par IA qui transforme des prompts, paroles ou fichiers uploadés en chansons polies et sans redevances en environ une minute.
BeatMV
Plateforme d'IA basée sur le web qui transforme des chansons en clips musicaux cinématographiques et crée de la musique avec l'IA.
UNI-1 AI
UNI-1 est un modèle unifié de génération d'images combinant raisonnement visuel et synthèse d'images haute fidélité.
Kirkify
Kirkify AI crée instantanément des mèmes viraux de changement de visage avec une esthétique néon-glitch signature pour les créateurs de mèmes.
Wan 2.7
Modèle vidéo IA de qualité professionnelle avec contrôle précis des mouvements et cohérence multi-vues.
Text to Music
Transformez du texte ou des paroles en chansons complètes de qualité studio avec des voix générées par IA, des instruments et des exports multi‑pistes.
Iara Chat
Iara Chat : Un assistant de productivité et de communication alimenté par l'IA.
kinovi - Seedance 2.0 - Real Man AI Video
Générateur vidéo IA gratuit avec rendu humain réaliste, sans filigrane et droits d'utilisation commerciale complets.
Video Sora 2
Sora 2 AI transforme du texte ou des images en vidéos courtes, physiquement exactes, pour les réseaux sociaux et le e‑commerce en quelques minutes.
Lyria3 AI
Générateur de musique IA qui crée instantanément des chansons entièrement produites et haute fidélité à partir de prompts textuels, de paroles et de styles.
Tome AI PPT
Créateur de présentations alimenté par l'IA qui génère, embellit et exporte des diaporamas professionnels en quelques minutes.
Atoms
Plateforme pilotée par l'IA qui construit des applications et sites full‑stack en quelques minutes grâce à l'automatisation multi‑agents, sans codage requis.
Paper Banana
Outil propulsé par l'IA pour convertir instantanément du texte académique en diagrammes méthodologiques prêts pour publication et graphiques statistiques précis.
AI Pet Video Generator
Créez des vidéos d'animaux virales et faciles à partager à partir de photos en utilisant des modèles pilotés par l'IA et des exportations HD instantanées pour les plateformes sociales.
Ampere.SH
Hébergement OpenClaw géré et gratuit. Déployez des agents IA en 60 secondes avec 500 $ de crédits Claude.
Palix AI
Plateforme IA tout‑en‑un pour les créateurs, permettant de générer images, vidéos et musiques avec des crédits unifiés.
Hitem3D
Hitem3D convertit une image unique en modèles 3D haute résolution, prêts pour la production, grâce à l'IA.
GenPPT.AI
Générateur de PPT piloté par l'IA qui crée, embellit et exporte des présentations PowerPoint professionnelles avec notes du présentateur et graphiques en quelques minutes.
HookTide
Plateforme de croissance LinkedIn propulsée par l'IA qui apprend votre voix pour créer du contenu, engager et analyser les performances.
Create WhatsApp Link
Générateur gratuit de liens et QR WhatsApp avec analytics, liens de marque, routage et fonctionnalités de chat multi‑agents.
Seedance 20 Video
Seedance 2 est un générateur vidéo IA multimodal offrant des personnages cohérents, une narration multi-plans et de l'audio natif en 2K.
Gobii
Gobii permet aux équipes de créer des travailleurs numériques autonomes 24/7 pour automatiser la recherche web et les tâches routinières.
Free AI Video Maker & Generator
Créateur et générateur de vidéos IA gratuit – illimité, sans inscription
Veemo - AI Video Generator
Veemo AI est une plateforme tout-en-un qui génère rapidement des vidéos et des images de haute qualité à partir de texte ou d'images.
AI FIRST
Assistant IA conversationnel automatisant la recherche, les tâches navigateur, le web scraping et la gestion de fichiers via le langage naturel.
GLM Image
GLM Image combine des modèles hybrides autorégressifs et de diffusion pour générer des images IA haute fidélité avec un rendu de texte exceptionnel.
ainanobanana2
Nano Banana 2 génère des images 4K de qualité professionnelle en 4–6 secondes avec un rendu précis du texte et une cohérence des sujets.
WhatsApp Warmup Tool
Outil de préchauffage WhatsApp propulsé par l'IA qui automatise l'envoi en masse tout en empêchant les blocages de comptes.
TextToHuman
Humaniseur IA gratuit qui réécrit instantanément les textes générés par IA en écriture naturelle et semblable à celle d'un humain. Aucune inscription requise.
Manga Translator AI
AI Manga Translator traduit instantanément des images de manga en plusieurs langues en ligne.
Remy - Newsletter Summarizer
Remy automatise la gestion des newsletters en résumant les e-mails en informations digestes.

Anthropic accuse des laboratoires d'IA chinois d'extraire des informations de Claude via des attaques de distillation

Anthropic a publiquement accusé des laboratoires d'IA chinois d'extraire systématiquement des connaissances de ses modèles Claude via des attaques de distillation, publiant de nouvelles recherches sur la détection et la prévention alors que les États-Unis débattent des contrôles à l'exportation des puces d'IA.