抖音新上线了个“算法体验”小程序,让大伙儿把以前只存于心底的疑问给解开了。抖音集团通过自己的微信公众号发了通知,说是抖音安全与信任中心在官网上新加了个板块,专门教大家看“一条视频是咋被推荐的”。这次最大的特点是能看、能玩,不搞技术也能懂。 打开抖音安全与信任中心的官网,或者去App上搜“看得懂的算法”,就能玩这玩意儿。抖音每天那新视频多得吓人,过亿呢。想把这些海量内容里最合你心意的挑出来,那算法可是在背后辛苦地给你精挑细选了好几轮。 第一步叫“召回”,主要演示了双塔模型和兴趣时钟。双塔模型是抖音干活的主力之一。你把自己代入不同的用户角色去体验一下,就能看见算法算出来的那个推荐指数是怎么回事。把兴趣时钟上的指针拨弄一下就能发现,算法不光是看内容本身,还会考虑一些“场外因素”。比如它会跟着时间走,早上给你推养生的,晚上给你推电影的。 召回完了之后就剩下几千条候选视频了。接下来是“排序”环节,用的是Wide&Deep模型。这模型也是个顶梁柱。排序说白了就是给视频打个分,分高的就往前排。用户的行为(点了、看了、喜欢了、转发了)都是分的依据。Wide那部分是“记忆”,记住你以前喜欢的东西;Deep那部分是“泛化”,帮你发现你以前没见过的玩意儿。两者合在一起算算,就有了最终的排序分。 为了不让推荐列表全是一个味儿,算法还得搞点其他动作:打散一下、调一调多样性、混排一下。在互动演示里拖一拖那个随机扰动的强度滑块,你就会看到推荐列表从清一色变成了五花八门。这样就能明白算法是怎么帮你打破那个“信息茧房”的了:既记着你喜欢的那些东西,又带你去发现你还没接触过的新兴趣点。