微软 GitHub 宣布将默认使用 Copilot 用户数据训练 AI 模型，4 月 24 日起施行

2026-05-05阅读 0热度 0

微软 Copilot Github AI 模型

GitHub Copilot 更新条款：默认启用用户数据训练机制，4月24日生效

最新政策已经发布。GitHub宣布，自2024年4月24日起，将调整Copilot服务的数据处理协议。所有开发者都应仔细审阅这一关键变更。

具体变更如下：自生效日起，Copilot Free、Pro及Pro+用户的互动数据将被默认用于基础AI模型的优化与迭代。训练数据范围覆盖用户与Copilot的完整协作过程，包括输入的提示词、AI生成的代码、用户采纳或修改后的代码片段，以及相关上下文信息。用户可通过隐私设置选择退出此机制。一个核心细节：当前政策调整暂不影响Copilot Business与Copilot Enterprise的企业级客户。

对于重视代码隐私的开发者，操作流程如下：在账户设置的“隐私”板块中，关闭相应数据共享功能即可。若您此前已禁用“产品改进数据收集”选项，该设置将自动继承，您的交互数据不会纳入训练集——除非您后续主动修改偏好，重新启用。

GitHub阐释了此项调整的技术动因：基于真实世界交互进行模型微调，是提升AI代码建议相关性、准确性与安全性的核心路径。通过分析海量实际工作流，模型能更精准地理解开发意图，优化代码补全逻辑，并增强潜在漏洞的识别能力。其核心逻辑在于，高质量、多样化的生产级数据，是驱动AI应对复杂编程场景的关键。

选择加入训练计划的用户，其可能被收集的数据类型包括：用户最终采纳或编辑的AI生成代码、提交至Copilot的所有提示与代码片段、光标定位附近的上下文代码、用户撰写的注释与文档、文件名与仓库结构及浏览记录、与Copilot各功能模块的交互日志，以及对建议代码的反馈行为（如采纳、拒绝或评分）。

需要明确的是，以下数据类别不在收集范围内：

一、Copilot Business与Copilot Enterprise许可证持有者的交互数据，以及企业托管仓库内的所有活动数据；

二、已在隐私设置中明确禁用模型训练功能的用户数据；

三、静态存储于Issues、Discussions或私有仓库内的原始内容。

关于数据处理流向，GitHub声明：为模型优化而收集的数据，可能会在关联公司（包括其母公司微软）内部共享，但不会提供给第三方AI服务商或外部平台。

“我们坚信，AI辅助编程的演进依赖于开发者真实的工作数据。为此，我们已运用微软内部交互数据优化模型，并将引入GitHub员工的数据。若您选择共享交互数据以协助模型改进，我们由衷感谢。您的贡献对构建服务全球开发者的AI工具至关重要。当然，您也可以随时选择退出——这不会影响您继续使用Copilot的全部核心功能。”

微软 GitHub 宣布将默认使用 Copilot 用户数据训练 AI 模型，4 月 24 日起施行

GitHub Copilot 更新条款：默认启用用户数据训练机制，4月24日生效

相关阅读

最新教程

最新资讯