Anthropic 指控中国头部 AI 实验室用 2.4 万个马甲“蒸馏”Claude 模型

智婷 • 2026-02-24 16:19

2026 年 2 月 23 日（美国当地时间周一），Claude 开发商 Anthropic 官方博客发布文章《检测和预防“蒸馏”攻击》（Detecting and preventing distillation attacks），直指三家中国 AI 公司—— DeepSeek、月之暗面（Moonshot AI）和 MiniMax，创建了超 2.4 万个马甲账户，与 Claude 进行了超过 1600 万次对话，以“蒸馏”Claude AI 模型。

Anthropic 表示，这些实验室利用“蒸馏”（distillation）技术，“瞄准了 Claude 最具差异化的能力：智能体推理、工具使用和代码编写”。

正值美国对华芯片出口政策激烈辩论之际，Anthropic 的点名指控，不乏借“政策之手”遏制来自中国的竞争对手的嫌疑。

Anthropic 表示，“蒸馏”可以是合法的，是 AI 实验室在训练自家模型时常用的一种方法，旨在创建更小、更廉价的版本，“但非法提炼美国模型的外国实验室，可以取消防护措施，将模型能力引入本国军事、情报和监控系统。”

1(1).png

来源：Anthropic 官方 X 账号

本月初，OpenAI 曾向美国众议院议员发送备忘录，指责 DeepSeek 利用蒸馏技术模仿其产品。

DeepSeek 在一年前发布了其开源 R1 推理模型，以极低的成本实现了几乎媲美美国前沿实验室的性能，从而引起轰动。DeepSeek 预计很快将发布其最新模型 DeepSeek V4，据报道该模型在编程方面的表现，可能超过 Anthropic 和 OpenAI 的现有模型。

Anthropic 在本篇博客中披露了三次大规模“蒸馏攻击”，表示这三次“攻击”都采用了类似的策略，即利用欺诈账户（马甲账户）和商业代理服务，大规模访问 Claude、同时规避侦测。提示的数量、结构和重点与正常使用模式不同，反映出有意提取能力而非合法使用。

“我们通过 IP 地址相关性、请求元数据、基础设施指标，以及在某些情况下，行业合作伙伴在各自平台上观察到相同行为证实，高度有信心地将每个活动归因于特定实验室。”

其中，来自 DeepSeek 的超过 15 万次对话，其目标包括跨任务推理能力、针对政策敏感内容的安全审查替代方案等。

月之暗面进行了超过 340 万次对话，目标包括智能体推理、工具使用、代码编写和数据分析、计算机使用智能体开发以及计算机视觉。上个月，该公司发布了新的开源模型 Kimi K2.5 和一个编程智能体。

MiniMax 的 1300 万次对话则针对智能体代码编写、工具使用及编排。Anthropic 表示，就在其发布最新的 Claude 模型时，MiniMax 在 24 小时内跟进调整，将近一半的流量重定向到了新模型，以“窃取”其能力。

Anthropic 表示会持续投资防御措施，使“蒸馏攻击”更难执行且更容易识别，但同时也呼吁“AI 行业、云提供商和政策制定者采取协调一致的应对措施”。

上个月，特朗普政府正式允许英伟达（Nvidia）等美国公司向中国出口先进的 AI 芯片（如 H200）。批评人士认为，在全球 AI 霸权竞争的关键时刻，放宽出口管制增加了中国的 AI 计算能力。Anthropic 明确认同该观点，表示限制先进 AI 芯片出口不仅可以限制直接的模型训练，也可以限制此种规模的“非法蒸馏”。”DeepSeek、MiniMax 和月之暗面所进行的这种规模的提取，需要依赖先进芯片”。

参考文件：
1. Detecting and preventing distillation attacks, Anthropic Blog.

2. Anthropic accuses Chinese AI labs of mining Claude as US debates AI chip exports, TechCrunch.

【本篇文章属于白鲸出海原创，如需转载：需联系授权方可，未经授权严转载!】

友情提醒：白鲸出海目前仅有微信群与QQ群，并无在Telegram等其他社交软件创建群，请白鲸的广大用户、合作伙伴警惕他人冒充我们，向您索要费用、骗取钱财！