GitHub 日前发布公告,宣布将从 2026年4月24日 起调整其 AI 编程助手 GitHub Copilot 的数据使用政策。核心变化在于,开发者与 Copilot 的交互数据将被默认收集,并用于 AI模型训练 和改进。
这意味着,当你使用 Copilot 时,相关的输入和反馈都可能成为训练数据的一部分。对于注重代码隐私的开发者来说,这是一个需要关注的重要变动。
公告中提到,开发者输入的数据可能包含敏感信息,因此建议不希望被纳入训练的开发者主动退出该计划。好消息是,GitHub 尊重用户之前的选择,如果你已经手动禁用了数据用于训练,那么此设置将继续有效。
GitHub 解释此举的目的是为了利用实际使用数据来训练模型,从而提供更智能、更具上下文感知能力的编程辅助功能。这本质上是为了提升工具的实用性和精准度。你可以前往云栈社区的 开发者广场 板块,与其他同行交流对此政策的看法。

具体哪些数据会被收集?
根据 GitHub 的说明,收集的数据范围包括但不限于:
- 开发者接受或修改的 AI 输出结果
- 发送给 Copilot 的输入内容,包括代码片段
- 光标周围的代码上下文
- 开发者撰写的注释和文档
- 文件名、仓库结构和导航模式
- 与 Copilot 聊天、代码补全等功能的交互内容
- 开发者对建议的反馈(如点赞或点踩)
哪些用户会受影响?
此项默认数据收集计划将覆盖 GitHub Copilot Free(免费版)、GitHub Copilot Pro 和 GitHub Copilot Pro+ 用户。而 GitHub Copilot Business 和企业版 用户默认不会被收集任何交互数据。
此外,GitHub 明确表示,收集的数据可能会与关联公司(如微软及其旗下公司)共享,以用于模型训练和改进,但不会提供给无关的第三方模型提供商。对于关心 数据安全 与 AI 伦理的开发者,这无疑是一个值得深入探讨的话题。若想了解更多关于大模型训练与数据应用的前沿讨论,可以关注云栈社区的 智能 & 数据 & 云 板块。
如何退出数据共享计划?
如果你希望退出,可以按照以下步骤操作:
- 访问 GitHub Copilot 设置页面。
- 导航路径为:GitHub Settings -> Copilot -> Features -> Privacy。
- 找到并关闭 “Allow GitHub to use my data for AI Model training” 选项。
你也可以直接访问设置页面:https://github.com/settings/copilot/features
|