github用数据训练ai 模型

哎,说个事儿,IT之家报的。GitHub 准备干件大事,从 4 月 24 号起,就开始用大家平时用 Copilot 时的数据,来训练 AI 模型。这事儿吧,针对的是用 Free、Pro 或者 Pro 用户的交互数据。具体包括咱们输入啥、输出啥、写的代码片段还有周围上下文这些东西。如果不想参与,就能在设置里把这功能关掉,或者直接退出也行。不过呢,Copilot Business 和 Copilot Enterprise 的用户这次不用管这个。 其实GitHub 说,这么做就是行业里的老规矩了。大家都觉得用真实的交互数据训练出来的模型,能帮咱们开发更精准、更安全的代码建议,还能帮忙找 Bug。说白了就是让 AI 更好地懂咱们怎么写代码。 至于大家怕不怕隐私问题?GitHub 也说了,他们不会把数据给第三方用,只会给微软这些自家公司共享。而且那些公司的仓库数据、个人隐私内容啊什么的都不在收集范围内。 最后 GitHub 还跟咱们交底了,他们觉得 AI 辅助开发就靠咱这些开发者的真实数据撑着呢。所以之前微软也在用自家的数据练模型,现在也打算用 GitHub 员工的数据了。 所以你要是愿意分享数据帮着改进模型呢?谢谢你啊。这对咱们整个开发者社区的好处太大了。要是不愿意参加也没关系啊,照样能开开心心地用你那些熟悉的功能。