流动的推荐系统——兴趣Feed技术架构与实现_技术资料_物联网_中国计算网——工业互联网一站式服务平台—

引用
作者：[email protected]，金融科技公司天农科技CTO，曾任新浪微博资深推荐算法工程师，考拉FM算法主管，先后负责微博反垃圾、基础数据挖掘、智能客服平台、个性化推荐等产品的后端算法研发，为考拉FM从零构建了个性化音频推荐系统。
本文为《程序员》原创文章，未经允许不得转载，更多精彩文章请订阅2017年《程序员》

流动的推荐系统
我们经常谈论的推荐系统（Recommender System），从形式上看是比较“静态”的推荐，通常位于网页主要信息的周边，比如电商网站的“看了又看”、“买了又买”。这种推荐系统在大多数场景下无法独立撑起一款产品。

依据维基百科Recommender System词条的定义：“推荐系统是信息过滤系统的子类，专门用于预测用户对一个项目偏好或者评分进行预测”，则兴趣Feed也是一种推荐系统：它预测用户对社交网络中相邻节点动态内容喜好程度，并根据喜好程度决定这些动态内容的展示顺序。

Feed是一种信息流，就是我们看到的“动态”、“新鲜事”。当用户与一些内容源建立了连接（如关注、赞、收藏等）之后，这些内容源产生的新动作，就会源源不断地通过连接流向用户，不同内容源产生的动态被聚合后呈现在用户面前，就是Feed。

传播社交网络动态的Feed，通常默认按照动态产生的时间顺序出现在你面前，称为时间线（timeline）。国外的Twitter、Instagram，一开始都是时间线形式的Feed；国内的微博、QQ空间、微信朋友圈至今仍然是时间线。

但是一些老牌时间线Feed都有计划要切换成依据算法排序的个性化兴趣Feed，微博在2012年尝试过智能排序，Twitter在去年上线了一个叫做“当你不在时发生了什么”的功能，Facebook甚至早就放弃对其NewsFeed的时间线排序。

出现这种情况的原因主要有两个。一方面，智能手机的普及和移动网络的提速，使得UGC越来越容易，用户动态的产生和浏览越来越碎片化，数量和频度陡增，以前用户消费无压力的时间线Feed，开始出现信息过载或者错过一些更感兴趣的内容的情况。Instagram说他们的用户平均错过了70%的内容，Facebook也曾说每个用户每天只能看完1500条新鲜事中的300条而已。另一方面，时间线Feed不利于商业化的开展，商业账号肆无忌惮地以动态的方式发布广告，不仅影响用户体验，还完全绕过平台方进行商业活动，形成一种“公共资源悲剧”。

所以，Feed的发展趋势必然是从时间线到利用算法重排序，按照用户兴趣的相关程度展示Feed，一方面要帮用户解决信息过载问题，另一方面要平衡好平台上的商业价值和用户体验。

成功的兴趣Feed——NewsFeed
一个成功的兴趣Feed，就是Facebook的NewsFeed。那是2006年9月，Facebook上线了朋友新鲜事，与之同时问世的还有MiniFeed（个人动态）。上线至今十周年，NewsFeed已经成为日收入几千万美元的现金牛。

Facebook刚上线这个功能时，曾引发广泛的争议，焦点就是“隐私”问题——我的动态怎么能让别人看见呢？用户不停质疑和抗议，又忍不住继续使用，Facebook就在争议声中增加了最初的隐私控制功能，比如隐藏自己的动态，而NewsFeed就这样坚持了下来。

2009年，Facebook在收购FriendFeed之后，将其赞（like）功能整合进了NewsFeed中，并开始按照热门程度对Feed重排序，这又引起了用户们的反抗，因为大家已经习惯按照时间顺序阅读。

10年来，NewsFeed有数不清的改进，甚至每天线上会同时部署很多算法版本进行AB测试。但EdgeRank算法是这条改进之路的一个标志性建筑，我们可以将NewsFeed排序策略分为EdgeRank前时代、EdgeRank时代和EdgeRank后时代。

在EdgeRank前时代，按照Facebook首席产品官Chris Cox的说法：“最初，NewsFeed排序就是在拍脑袋，给照片加点权重，给系统消息降点权重。”我们的算法工程师们读到这些，想必要会心一笑：今天高大上的Facebook，又是人工智能又是深度学习，竟然也是从这个时代走过来的。

之后，Serkan Piantino（现任Facebook人工智能研究院工程总监）在2010年左右领导开发了第一版EdgeRank算法。

EdgeRank算法
了解大名鼎鼎的EdgeRank是怎么回事，先看朋友的一条新鲜事（动态）诞生后怎么流动到你的面前：

1/6 1 2 3 4 5 6 下一页尾页