近期,许多开发者在访问GitHub时可能注意到了这样一则通知:
On April 24 we‘ll start using GitHub Copilot interaction data for AI model training unless you opt out. Review this update and manage your preferences in your GitHub account settings.

这则通知的核心信息很明确:自2025年4月24日起,除非你主动选择退出,否则GitHub将开始使用你的GitHub Copilot交互数据来训练其AI模型。
这些数据具体可能包括:
- 你接受或修改过的代码建议
- 你发送给Copilot的输入(包括代码片段)
- 光标位置的代码上下文
- 你编写的注释和文档
- 文件名、仓库结构、导航习惯
- 你对建议的点赞或点踩反馈
如何关闭数据共享选项?
如果你不希望自己的交互数据被用于AI训练,可以前往GitHub设置页面手动关闭此选项。即使你和我一样不常使用Copilot,有时也可能在VS Code或GitHub网页上无意间触发它,关闭该选项能更好地保护隐私。
关闭路径如下:
- 打开设置页面:
https://github.com/settings/copilot/features
- 导航至 Settings → Copilot → Privacy 部分。

- 在“Privacy”区域,找到“Allow GitHub to use my data for AI model training”选项。
- 将其设置为 Disabled 状态即可。
根据官方说明,更改生效可能需要最多30分钟,建议重启代码编辑器以使设置完全生效。
哪些数据不会被使用?
GitHub也在更新中明确了不会被用于训练的数据范围:
- GitHub Copilot Business 和 Enterprise 计划用户的数据。
- 已经选择退出(Opt-out)的用户数据。
- 你的Issues、Discussions或仓库中处于“静止”状态的代码内容。不过,官方特别指出,Copilot在运行时实时处理的代码上下文仍然可能被收集,除非你已选择退出。
此外,这些收集的数据可能会与GitHub的关联公司(如微软)共享,用于模型训练与改进,但不会提供给第三方AI模型提供商。
数据使用的影响与开发者选择
这一政策更新引发了开发者社区对于代码隐私与AI模型训练数据来源的讨论。对于参与开源项目的开发者而言,了解自己的贡献如何被使用尤为重要。
无论你选择保持默认设置以助力AI进化,还是选择关闭以保护代码隐私,这都应是基于充分知情后的个人决定。技术的进步往往伴随着对边界与规则的重新探讨,保持关注并管理好自己的数字足迹,是当代开发者的重要技能。
如果你想了解更多关于AI与开源生态的深度讨论,欢迎到云栈社区的人工智能或开源实战板块,与其他开发者交流看法。
政策更新来源:https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/
|