对推荐算法演化的几点体会

2019-07-28 12237

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 最近一段时间，由于工作需要一直在研究推荐算法。通过对互联网信息的搜刮和对现有开源推荐算法的实践，总结出一些心得遂吐个槽，发表出来与广大网友探讨，希望能得到应用推荐的正确姿势先说问题吧：目前推荐算法存在的问题 1.

最近一段时间，由于工作需要一直在研究推荐算法。

通过对互联网信息的搜刮和对现有开源推荐算法的实践，总结出一些心得

遂吐个槽，发表出来与广大网友探讨，希望能得到应用推荐的正确姿势

先说问题吧：

目前推荐算法存在的问题

1.算法多杂：

推荐领域的门槛较低，掌握一定业务规则即可进行目标导向的推荐，从而导致各种算法多如牛毛，鱼龙混杂，让人无所适从；

2.思想混乱：

自从亚马逊推出协同过滤思想后，推荐领域便开始迅速发展，并呈现出百家争鸣、万花齐放的态势，但推荐领域不像其他领域具备明确的思想路径（比如NLP先做分词再做语义理解，比如图像特征金字塔等），各自都能说出自己的1、2、3，而且都声称自己有效果；

3.结果不透明：

目前不管是媒体还是电商，推荐算法的效果都是不透明的，各家只有各家自己心里清楚，也只有从业的专业人士有一些经验概数，这就导致谁都能出来说上两句，但到底对不对？你猜

小结

以上3种路径实质代表了三种思想：

1.经验主义+因果推断思想；

2.统计和概率思想；

3.神经连接思想；（其实这种有点不伦不类，神经网络自编码器与FM矩阵分解结合，感觉有点奇怪）

但仔细观察上述优化的过程，都绕不开业务的理解，都是在不断刻画用户行为，而对模型的升级改造也只是为了能更好的处理用户行为变量

所以，本质上推荐算法其实是在不断建立“用户画像”的过程

从模型的可持续发展以及可解释性的角度出发，我认为第1种思想是最稳妥的发展方式

与其用高级晦涩难懂的变量或模型将“业务”包装起来，不如直接暴露在因果图中，这样显得更平易近人

从人机结合的角度来看，基于因果图的贝叶斯网络也是一种可靠的交互方式，最终要攻克的难点在于因果推理

个人心得

从现有推荐模型的研究方向来看：
1.神经网络的发展方向（已经完全跑偏，试图用固化的复杂的模型结构去表达对业务的理解，这种已经偏离了模型对事物客观规律本质的刻画，相信在未来很长一段时间，神经网络的推荐研究进展将会很缓慢）

2.集成学习和模型融合的思想（集成学习在特定明确问题的解决上，效果很好，但我认为，目前并不适用推荐这一领域，推荐系统实际是在不断捕捉用户喜好，不断刻画用户兴趣的过程，和稀泥的做法，只会使效果适得其反）

目前的推荐系统研究，大多停留在和现有模型的比较及提升方面，并未从问题本质上去思考和改进，并且鱼龙混杂，结果又很难复现，短期内是很难取得有效的改观的

希望个人的一些浅见，对大家一起提升推荐算法会有帮助

对推荐算法演化的几点体会

目前推荐算法存在的问题

1.算法多杂：

2.思想混乱：

3.结果不透明：

推荐领域的原罪

1.我们需要那么多声音吗？

2.我们抓住了问题的本质吗？

3.理论与实际的脱节

4.我们的算法有进步吗？

推荐算法的发展态势

1.以业务为中心的建模方式：

2.以统计为中心的建模方式：

3.端到端的建模方式：

小结

个人心得

热门文章

最新文章

相关课程

相关电子书

相关实验场景