微软 GitHub 宣布将默认使用 Copilot 用户数据训练 AI 模型,4 月 24 日起施行

2026-05-05阅读 0热度 0
微软 Copilot Github AI 模型

GitHub Copilot 更新条款:默认启用用户数据训练机制,4月24日生效

最新政策已经发布。GitHub宣布,自2024年4月24日起,将调整Copilot服务的数据处理协议。所有开发者都应仔细审阅这一关键变更。

具体变更如下:自生效日起,Copilot Free、Pro及Pro+用户的互动数据将被默认用于基础AI模型的优化与迭代。训练数据范围覆盖用户与Copilot的完整协作过程,包括输入的提示词、AI生成的代码、用户采纳或修改后的代码片段,以及相关上下文信息。用户可通过隐私设置选择退出此机制。一个核心细节:当前政策调整暂不影响Copilot Business与Copilot Enterprise的企业级客户。

微软 GitHub 宣布将默认使用 Copilot 用户数据训练 AI 模型,4 月 24 日起施行

对于重视代码隐私的开发者,操作流程如下:在账户设置的“隐私”板块中,关闭相应数据共享功能即可。若您此前已禁用“产品改进数据收集”选项,该设置将自动继承,您的交互数据不会纳入训练集——除非您后续主动修改偏好,重新启用。

GitHub阐释了此项调整的技术动因:基于真实世界交互进行模型微调,是提升AI代码建议相关性、准确性与安全性的核心路径。通过分析海量实际工作流,模型能更精准地理解开发意图,优化代码补全逻辑,并增强潜在漏洞的识别能力。其核心逻辑在于,高质量、多样化的生产级数据,是驱动AI应对复杂编程场景的关键。

选择加入训练计划的用户,其可能被收集的数据类型包括:用户最终采纳或编辑的AI生成代码、提交至Copilot的所有提示与代码片段、光标定位附近的上下文代码、用户撰写的注释与文档、文件名与仓库结构及浏览记录、与Copilot各功能模块的交互日志,以及对建议代码的反馈行为(如采纳、拒绝或评分)。

需要明确的是,以下数据类别不在收集范围内:

一、Copilot Business与Copilot Enterprise许可证持有者的交互数据,以及企业托管仓库内的所有活动数据;

二、已在隐私设置中明确禁用模型训练功能的用户数据;

三、静态存储于Issues、Discussions或私有仓库内的原始内容。

关于数据处理流向,GitHub声明:为模型优化而收集的数据,可能会在关联公司(包括其母公司微软)内部共享,但不会提供给第三方AI服务商或外部平台。

“我们坚信,AI辅助编程的演进依赖于开发者真实的工作数据。为此,我们已运用微软内部交互数据优化模型,并将引入GitHub员工的数据。若您选择共享交互数据以协助模型改进,我们由衷感谢。您的贡献对构建服务全球开发者的AI工具至关重要。当然,您也可以随时选择退出——这不会影响您继续使用Copilot的全部核心功能。”

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策