github用数据训练ai 模型

哎，说个事儿，IT之家报的。GitHub 准备干件大事，从 4 月 24 号起，就开始用大家平时用 Copilot 时的数据，来训练 AI 模型。这事儿吧，针对的是用 Free、Pro 或者 Pro 用户的交互数据。具体包括咱们输入啥、输出啥、写的代码片段还有周围上下文这些东西。如果不想参与，就能在设置里把这功能关掉，或者直接退出也行。不过呢，Copilot Business 和 Copilot Enterprise 的用户这次不用管这个。其实GitHub 说，这么做就是行业里的老规矩了。大家都觉得用真实的交互数据训练出来的模型，能帮咱们开发更精准、更安全的代码建议，还能帮忙找 Bug。说白了就是让 AI 更好地懂咱们怎么写代码。至于大家怕不怕隐私问题？GitHub 也说了，他们不会把数据给第三方用，只会给微软这些自家公司共享。而且那些公司的仓库数据、个人隐私内容啊什么的都不在收集范围内。最后 GitHub 还跟咱们交底了，他们觉得 AI 辅助开发就靠咱这些开发者的真实数据撑着呢。所以之前微软也在用自家的数据练模型，现在也打算用 GitHub 员工的数据了。所以你要是愿意分享数据帮着改进模型呢？谢谢你啊。这对咱们整个开发者社区的好处太大了。要是不愿意参加也没关系啊，照样能开开心心地用你那些熟悉的功能。