内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险

内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险-第1张图片

  元平台(Meta)正逐步减少对 Anthropic 、OpenAI 旗下高价 AI 代码工具的依赖,自主研发替代工具 ,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。

内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险-第2张图片

  科技媒体《The Information》获取的 Meta 内部管理规范文件显示 ,公司对应用 AI 工程部门的工程师使用 Anthropic 旗下 Claude 代码工具、OpenAI 旗下 Codex 模型设置了严格使用限制 。一份内部备忘录甚至要求团队暂停部分依托这两款模型开展的工作,原因是担心第三方模型的输出内容可能混入 Meta 的模型训练数据,文件警告 ,该行为或将引发 “与合作企业之间严重的升级纠纷”。

内部文件曝光:Meta严防员工使用Claude	、Codex,防范知识蒸馏风险-第3张图片

  背景详情

  Meta 是 Claude 代码工具的大客户之一,今年初公司组建应用 AI 工程团队 ,核心任务是迭代自研代码助手 MetaCode(前身为 DevMate),其中关键工作就是搭建高质量数据集、设计编程测试题库,用于训练、评测自研代码大模型。虽然公司允许团队在部分场景使用第三方 AI 工具 ,但明确要求:测试题库必须由工程师自主设计 ,依托自身专业技术完成,不得直接使用 AI 生成的思路方案 。

  这份 5 月出台 、目前仍在生效的内部规范显示,Meta 惧怕无意间触发知识蒸馏行为 —— 也就是借助竞品模型的输出结果来训练自家 AI 模型 ,该操作涉嫌违反 Claude、Codex 的用户使用协议。

  知识蒸馏本质上是开发者直接复用其他企业在数据、算力 、研发上的巨额投入来训练自有模型,近些年该行为的合规争议持续发酵。

  去年,深度求索(DeepSeek)推出高性能大模型后引发行业热议 ,OpenAI 曾质疑该模型部分能力源自对其 o1 模型的知识蒸馏(深度求索后续回应称,模型预训练主要采用公开数据与经授权的第三方合规数据) 。就在今年 4 月埃隆・马斯克起诉 OpenAI 的庭审中,马斯克旗下太空探索技术公司(SpaceX)的 AI 子公司 xAI 被迫承认 ,曾对 OpenAI 的模型开展过部分知识蒸馏。

  今年 2 月,Anthropic 表示,在监测到多家中国 AI 企业大规模开展模型蒸馏后 ,公司投入大量技术手段搭建防护机制;本月,该企业指控中国电商企业阿里巴巴实施了迄今为止规模最大的 Claude 模型蒸馏攻击。在提交给美国国会的信函中,Anthropic 称此次攻击瞄准了 Claude 最核心的前沿能力 ,包括智能体推理、软件工程、长周期复杂任务处理等 ,阿里巴巴暂未对此置评 。

  OpenAI 、Anthropic 、谷歌的 AI 模型用户协议均明确禁止:利用模型输出内容研发同类竞争产品。

  Meta 内部文件并未出现员工违反上述协议的具体案例。Meta 官方发言人回应:“我们制定了清晰的 AI 工具使用规范,引导团队合规使用工具,聚焦高价值研发工作 。”

  尽管暂无违规案例 ,但这份最新约束规范足以说明:在全力迭代 AI 产品、为巨额算力硬件投入寻求商业回报的关键阶段,管理层必须给员工划定清晰的使用红线 。

  全力压降 AI 研发成本

  随着 AI 相关开支急速膨胀,减少外部 AI 工具依赖、将大量研发工作迁移至自研工具 MetaCode 已经成为 Meta 的核心战略。根据公司近期内部备忘录 ,Meta 仅今年内部 AI 使用相关支出就将达到数十亿美元。在全公司大范围推广 AI 工具之后,Meta 如今通过限制员工的令牌(Token)调用额度,遏制成本失控上涨的趋势 。

  公司允许应用 AI 工程团队在常规工作中使用第三方 AI 工具 ,例如搭建工作流 、整理代码与文件、为自研 AI 工具开发自动化校验类测试基础设施,也就是规范中提到的测试脚手架搭建、方案参数校准(用于搭建 、调优模型性能评测体系)。

  即便在上述合规场景下,所有 AI 生成内容投入使用前必须经过人工严格审核。规范明令禁止:使用外部 AI 模型的输出来设计代码测试题库 ,文件中写道 “该行为意味着工程师完全丧失项目主导权,我们绝不允许测试任务的创意来源于第三方模型 ” 。

  另一项禁令:工程师不得借助 AI 查找源代码漏洞,也不能通过代码分析让 AI 产出测试任务方向。简单来说 ,不能由 AI 来决定需要测试哪些业务问题。

  此外 ,规范要求:如果自研待测模型可以访问容器内资源,那么应用部署容器(封装程序、代码、依赖库等运行环境)中,严禁放入任何 AI 生成内容 。

  在合规边缘谨慎前行

  业内专家表示 ,科技企业在研发过程中使用竞品 AI 模型,相当于走钢丝:既要借力第三方模型提升效率,又要严防相关数据回流进自家的训练体系。

  法学与科技行业顾问马克・莱泽评价 ,Meta 这份内部文件几乎完整还原了企业游走在合规红线的所有风控细节。

  尽管美国现行法律并未明令禁止知识蒸馏,AI 生成内容也不受版权法保护,但各大 AI 实验室普遍会直接封禁涉嫌蒸馏的企业 、个人的模型调用权限 。

  去年 ,Anthropic 就关停了 OpenAI 调用 Claude 的 API 接口权限。OpenAI 当时解释,调用接口仅用于横向测评竞品模型的能力与安全性能,属于行业通用的技术基准测试手段。

  Meta 上月的备忘录提及 ,部分员工利用 AI 生成、修改评测任务,导致无法界定任务创意来自人工还是第三方模型 。

  Meta 收紧 Claude、Codex 使用权限,一方面是担忧第三方模型输出内容间接流入训练数据集 ,既会损害自研模型质量 ,也会引发合作方的合规纠纷;另一方面,通过暂停相关高危业务强化内部治理,让 AI 研究院 、应用 AI 业务线管理层确保所有研发流程符合合规要求 。

文章推荐

  • 疫情塑身衣/疫情 衣服

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【沂水疫情分布,沂水疫情分布在哪里】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【邳州疫情查询,邳州疫情查询电话】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    1
  • 【莒县桑园疫情,莒县桑园疫情防控电话】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    1