关于啤酒和尿布故事的真相

简介:

数据刚刚兴起时,常常听厂商或大数据倡导者说这个啤酒和尿片的故事,鲜活、形象地说明大数据分析给商业带来的无限商机。如果你没有听过的话,我们再讲一遍:

“尿布和啤酒,听起来风马牛不相及,但这是对历史数据进行挖掘的结果,反映的是数据层面的规律。这种关系令人费解,这是一个真正的规律吗?经过跟踪调查, 研究人员终于发现事出有因:一些年轻的爸爸经常要到超市去购买婴儿尿布,有30%到40%的新爸爸会顺便买点啤酒犒劳自己。沃尔玛随后对啤酒和尿布进行了 捆绑销售,不出意料,销售量双双增加。”

——摘自涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》

第一次听到这个故事时,其实心中有惑 。以笔者对美国社会的有限理解,美国很多州的法律是不允许超市卖酒类商品,仅在最近几年才开始陆续有些州通过法律,允许超市申请酒的销售执照。但当时被大数据的热潮所吸引,也就无暇深究。最近参加了一些和大数据相关的活动,这个故事又不绝于耳。终于决定探探这个故事的源头。

原来这个故事在欧美国家也被传唱,出现的版本还不尽相同。但对此质疑的声音也不少,其中有一位叫Daniel J. Power的教授特此撰文,应该是最全面地有理有据揭开这个故事后面的真相。有兴趣的同学可以详细阅读英文全文:What is the "true story" about using data mining to identify a relation between sales of beer and diapers?。主旨内容如下:

  • 这家连锁店不是沃尔玛,而是Osco Drugs,一家主要在美国中西部经营的药房和便利店。
  • 该公司于1992年就着手进行数据挖掘项目,算是数据挖掘的先驱者。
  • 当时的项目收集了来自25家分店、一千两百多万个购物车的信息。
  • 数据的确发现:下午5点到7点之间,客户购买了啤酒和尿片。
  • 商店管理层的确对此发现表示兴趣。但现实中,并没有重新设计商品的摆放,没有把啤酒和尿布进行捆绑销售。不过,公司保守地对销售流程进行了改造,即在正确的时间放正确数量的正确商品。

这就是啤酒和尿片的故事真相,所以,这其实并不是数据挖掘的好故事。大家对此故事津津乐道,无外乎希望表达:数据挖掘技术是商业决策的好帮手!


本文作者:Shirley Xie

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8月前
|
对象存储
七夕快到了,来创造一副浪漫的鹊桥插画吧
本次通过加载和推理SD模型对象存储OSS Bucket,挂载到PAI-EAS服务,实现模型部署,加载和推理SD模型,制作属于自己的七夕画作。
|
Arthas 运维 安全
|
机器学习/深度学习 人工智能 区块链
过年别再逼婚了,《黑镜》里的AI相亲系统是对爱情最好的匹配
春节将至,单身一人回家过年难免会被问到有无对象,何时结婚,心中难免五味杂陈。最近被大家热议的神剧《黑镜》第四季中的一集,却为苦于找不到对象的人们提供了一个完美解决方案,AI相亲系统可以对比候选人各种数据通过算法为客户寻找最完美的另一半,而现实生活中,这样的科技其实离我们并不遥远。
2637 0