Anthropic 指控中国头部 AI 实验室用 2.4 万个马甲“蒸馏”Claude 模型
2026 年 2 月 23 日(美国当地时间周一),Claude 开发商 Anthropic 官方博客发布文章《检测和预防“蒸馏”攻击》(Detecting and preventing distillation attacks),直指三家中国 AI 公司—— DeepSeek、月之暗面(Moonshot AI)和 MiniMax,创建了超 2.4 万个马甲账户,与 Claude 进行了超过 1600 万次对话,以“蒸馏”Claude AI 模型。
Anthropic 表示,这些实验室利用“蒸馏”(distillation)技术,“瞄准了 Claude 最具差异化的能力:智能体推理、工具使用和代码编写”。
正值美国对华芯片出口政策激烈辩论之际,Anthropic 的点名指控,不乏借“政策之手”遏制来自中国的竞争对手的嫌疑。
Anthropic 表示,“蒸馏”可以是合法的,是 AI 实验室在训练自家模型时常用的一种方法,旨在创建更小、更廉价的版本,“但非法提炼美国模型的外国实验室,可以取消防护措施,将模型能力引入本国军事、情报和监控系统。”
来源:Anthropic 官方 X 账号
本月初,OpenAI 曾向美国众议院议员发送备忘录,指责 DeepSeek 利用蒸馏技术模仿其产品。
DeepSeek 在一年前发布了其开源 R1 推理模型,以极低的成本实现了几乎媲美美国前沿实验室的性能,从而引起轰动。DeepSeek 预计很快将发布其最新模型 DeepSeek V4,据报道该模型在编程方面的表现,可能超过 Anthropic 和 OpenAI 的 现有模型。
Anthropic 在本篇博客中披露了三次大规模“蒸馏攻击”,表示这三次“攻击”都采用了类似的策略,即利用欺诈账户(马甲账户)和商业代理服务,大规模访问 Claude、同时规避侦测。提示的数量、结构和重点与正常使用模式不同,反映出有意提取能力而非合法使用。
“我们通过 IP 地址相关性、请求元数据、基础设施指标,以及在某些情况下,行业合作伙伴在各自平台上观察到相同行为证实,高度有信心地将每个活动归因于特定实验室。”
其中,来自 DeepSeek 的超过 15 万次对话,其目标包括跨任务推理能力、针对政策敏感内容的安全审查替代方案等。
月之暗面进行了超过 340 万次对话,目标包括智能体推理、工具使用、代码编写和数据分析、计算机使用智能体开发以及计算机视觉。上个月,该公司发布了新的开源模型 Kimi K2.5 和一个编程智能体。
MiniMax 的 1300 万次对话则针对智能体代码编写、工具使用及编排。Anthropic 表示,就在其发布最新的 Claude 模型时,MiniMax 在 24 小时内跟进调整,将近一半的流量重定向到了新模型,以“窃取”其能力。
Anthropic 表示会持续投资防御措施,使“蒸馏攻击”更难执行且更容易识别,但同时也呼吁“AI 行业、云提供商和政策制定者采取协调一致的应对措施”。
上个月,特朗普政府正式允许英伟达(Nvidia)等美国公司向中国出口先进的 AI 芯片(如 H200)。批评人士认为,在全球 AI 霸权竞争的关键时刻,放宽出口管制增加了中国的 AI 计算能力。Anthropic 明确认同该观点,表示限制先进 AI 芯片出口不仅可以限制直接的模型训练,也可以限制此种规模的“非法蒸馏”。”DeepSeek、MiniMax 和月之暗面所进行的这种规模的提取,需要依赖先进芯片”。
参考文件:
1. Detecting and preventing distillation attacks, Anthropic Blog.
2. Anthropic accuses Chinese AI labs of mining Claude as US debates AI chip exports, TechCrunch.
【本篇文章属于白鲸出海原创,如需转载:需联系授权方可,未经授权严转载!】
友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!


闽公网安备35010402350923号