小红书如何实现高效推荐?解密背后的大数据计算平台架构

Ververica 2019-08-05

大数据 平台架构 Image Hive schema 报表 session 流计算 推荐系统

作者:郭一
整理:董黎明

本文整理自2019阿里云峰会·上海开发者大会开源大数据专场中小红书实时推荐团队负责人郭一先生现场分享。小红书作为生活分享类社区,目前有8500万用户,年同比增长为300%,大约每天有30亿条笔记在发现首页进行展示。推荐是小红书非常核心且重要的场景之一,本文主要分享在推荐业务场景中小红书的实时计算应用。

实时计算在推荐业务中的场景

线上推荐流程

小红书线上推荐的流程主要可以分为三步。第一步,从小红书用户每天上传的的笔记池中选出候选集,即通过各种策略从近千万条的笔记中选出上千个侯选集进行初排。第二步,在模型排序阶段给每个笔记打分,根据小红书用户的点赞和收藏行为给平台带来的价值设计了一套权重的评估体系,通过预估用户的点击率,评估点击之后的点赞、收藏和评论等的概率进行打分。第三步,在将笔记展示给用户之前,选择分数高的笔记,

登录 后评论
下一篇
冒顿单于
10703人浏览
2019-08-28
相关推荐
程序员必读书单
6285人浏览
2015-02-24 17:13:00
程序员必读书单(转)
1646人浏览
2015-03-03 12:58:00
程序员必读书单 1.0
1896人浏览
2016-03-02 14:13:00
加密类型以及相关算法
402人浏览
2017-11-16 14:43:00
0
3
0
1200