LinkedIn:我们下一步要做的是数据产品矩阵化

简介: 本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成,他着重分享了LinkedIn对体内数据的搭建、产品化和矩阵化的构想。
0.jpg

本文根据美国LinkedIn公司的数据分析部资深总监Simon Zhang在3月7日的阿里巴巴西湖品学大数据峰会的演讲整理而成,他着重分享了LinkedIn对体内数据的搭建、产品化和矩阵化的构想。文章未经演讲者审阅。 


现在的大数据的后面是个大冰川,海平面上的普通人一般能看见,海平面以下是专业人士能看见的。Linkedin内部大约有起码20种不同的数据库,就是完全不同的技术的数据库,还不包括同样一种数据库有不同的应用。但实际上我们真正的内部企业用户,包括Linkedin本身,需要的不是一个大冰川,需要的最后是冰激淋,就想把结果出来就行,他不需要大冰川。 


怎么能做到这个冰淇淋呢?咱们讲讲数据分析的变革。基本大数据分析的三个原则,这个基本的原则是我大约加入Linkedin9个月以后我们决定下来的。我们如果要做一件最重要的事的话,那个事需要有三个属性: 


第一个简单,他出来的结果必须要非常非常简单,没有任何花哨的东西,任何人都能够看明白看懂。

 

第二个迅速,就是刚才说的速度的问题,越慢结束度越低,越快接受度越高。当然在Linkedin使用的是蓝图法则,3秒钟的法则。

 

第三就是要规模化,规模化各这的角度来说,我们当时思考的方法是这样的,希望Linkedin内部所有的员工每一个人都能够用数据来分析帮他们做决策,很快的做决策。


怎么做到这一点? 


第一步,我们需要建立一个真正的金字塔。分析师不应该从数据开始,他必须要从客户、产品、市场、销售开始,也就是说明白公司怎么能做到这件事。他必须要明白如何在这种层面标记未来的事物,标记比数据本身重要得多。分析师本身要分析自己以后要分析什么,这样才能把正确标记加到数据库里面去。他还必须要明白,数据库之间的公用,流程,每种数据是怎么分工的。 


下面就干活了。在Linkedin有一个不成文的共识,你做的东西不仅仅是有趣是不够的,必须要注重执行性。我分析到这个结果以后到底能做什么,这是很重要的。说完了做以后咱们就走到决策,决策本身一定要实现增加商业的价值,或为团队增加价值。

 


第二步是规模化需要用科技来把金字塔变成一个非常小的底,而大的中心,最小的一个尖的一个过程。举个例子,Linkedin我待的九个月之内和另外一个同事合作,完成了500个不同的需求项目和模型,但是当年我们其实直接支持两百个人,500÷200,每年我才回答2.5个问题,这绝对是非数据驱动。后来我们决定是把整个做一个系统,来模拟以前我们两做的大部分工作,这个系统响应3秒钟,简单的规模化了,大概花了三个月,五个人,在内部支持销售的,在今天为止每天这个系统可以服务1000个销售员工,大约用这个系统十次,用一次大约时间是3秒到一分钟,这个系统一天就能做到以前我们两个人做不到的事情,这就是一个规模化的结果。当年出来结果是我们销售增长了175个百分点。 


第三步,产品化。内部的东西大致做到OK了,就要把内部积累的这些实践、经验和产品和规模化的东西,要做到网站上去,要进来大量自然的用户、企业的用户,比如说我们前面讲的那个支持内部销售的分析系统,在去年Linkedin就对外开始了一个新的业务,用数据帮助全世界所有的销售人员变得更有效率。 


第四阶段,不断的开发新的数据产品。我们发现了第一个数据产品后,做第二个就非常容易了,然后第二个产品会利用第一个产品的结果,第三个又用第二个结果,结果造成了数据产品内部的网络化、矩阵化,推动人与人之间的交流、互动、合作。这就是下一步我们准备要做的,就是把所有的产品关联起来,让它们互相提供价值。实际上这都是建立在一个平台上面的,数据是一致的,产品是多样性的,服务的对象既是同一个人又是一个同样一个人不同的面,比方说,作为一个父亲来说需要为我的孩子花钱上学,我作为上班族来说我需要买汽车上班,所以人的需求是不同的,做同样的产品挖掘不同的数据。


原文发布时间为:2014-03-09


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


相关文章
|
3天前
|
算法 数据可视化 大数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
圆堆图circle packing算法可视化分析电商平台网红零食销量采集数据
33 13
|
9天前
|
关系型数据库 MySQL BI
R语言RFM模型在电商行业的应用
R语言RFM模型在电商行业的应用
|
8月前
|
数据可视化 大数据 数据挖掘
2022-11-28-大数据可视化“可视化国产/进口电影票房榜单”分析,特征维度大于50(一)
2022-11-28-大数据可视化“可视化国产/进口电影票房榜单”分析,特征维度大于50
77 0
|
8月前
|
数据可视化 大数据
2022-11-28-大数据可视化“可视化国产/进口电影票房榜单”分析,特征维度大于50(二)
2022-11-28-大数据可视化“可视化国产/进口电影票房榜单”分析,特征维度大于50
48 0
|
10月前
|
数据挖掘
pheatmap|暴雨暂歇,“热图”来袭!!!
pheatmap|暴雨暂歇,“热图”来袭!!!
108 0
|
11月前
|
人工智能 智能设计 算法
行业透视 | 电商色彩营销:听说消费者都有“好色”心理
编者按: 现代营销学之父曾经有说过, 消费者需求主要分为数量满足、质量满足, 以及情感满足阶段。随着社会经济的发展, 消费者对于产品质量进入到情感需求阶段, 达到一个新高度。与此同时, 消费者对于现在生活环境和产品质量的需求, 不仅仅局限于功能特性的实用阶段, 更加注重消费过程中环境美学的需求。此外, 消费者对于同质化产品, 以及对竞争激烈消费场景有更大的色彩需求, 所以色彩对消费者购买行为的影响具有重要现实意义。
195 0
|
算法 数据处理
基于AIE平台的决策树算法下的贵州省黔东南州水稻提取
依据作物在不同物候期内卫星影像的光谱存在差异的特征和地形因子,可建立水稻提取算法,进行水稻提取。
基于AIE平台的决策树算法下的贵州省黔东南州水稻提取
|
知识图谱 流计算
Google Earth Engine ——全球陆地数据同化系统(GLDAS)摄取了卫星和地面观测数据产品大气分析场、降水场和辐射场数据集
Google Earth Engine ——全球陆地数据同化系统(GLDAS)摄取了卫星和地面观测数据产品大气分析场、降水场和辐射场数据集
1419 0
Google Earth Engine ——全球陆地数据同化系统(GLDAS)摄取了卫星和地面观测数据产品大气分析场、降水场和辐射场数据集
|
SQL 数据采集 JSON
天池大数据竞赛 Spaceack带你利用Pandas,趋势图与桑基图分析美国选民候选人喜好度
竞赛地址: https://tianchi.aliyun.com/competition/entrance/531837/introduction 首先,这是一篇面向新人的教程导向的分析文章,(by the way其实我也是新手,从比赛开始才学的Pandas库,这也是我的一篇学习笔记),所以会包含很多函数的基础用法,解题思路等等, 流程会比较详细。 其次,本文在官方教程基础上会加入创新内容,但是绝不会为了用而用某种新方法,一定本着分析数据有所帮助的原则和对数据敬畏的态度来做。
393 0
天池大数据竞赛 Spaceack带你利用Pandas,趋势图与桑基图分析美国选民候选人喜好度
|
自然语言处理 分布式计算 算法