大数据专家舍恩伯格演讲

简介:

6月19日上午消息,第十二届中国国际软件和信息服务交易会今天在大连世界博览广场开幕。本次会议时间为6月19日-22日,聚焦智慧城市、云计算、物联网等技术热点和产品服务,主题锁定为“智城市,酷生活”。本次展会展览面积3万平方米,有近600家厂商,百余个国内外团组参展。新浪科技作为独家网络战略合作伙伴直播本次大会。以下为全文:


非常感谢给我这样的机会,能跟大家在一起进行这样的介绍,非常高兴能够来到大连,来跟大家聊一聊大数据的重要性,因为之前我们说到云的快速改变,在过去一段时间改变我们的生活,我想说一下大数据对经济的含义和对商业的含义。

  大家都在说大数据,大数据到底有多大?到底有多少信息说到ZB字节,我们说10的21次方,这是什么意思?它的含义是什么?它如何发挥作用?我 们看一下这张图,它给我们显示的是数据随时间流失的发展趋势,我们看一下它在背后告诉我们的故事是什么?1987年,也是很久,那个时候我在大 学,1987年数据世界还没有达到30亿GB,这是1987面的规模,2007年的时候增加到3000亿GB,所以20年间数据的数量增加了100倍。如 果说回到历史的话,看上一次,数据像这么快的增长,那个时候是数据翻一番的,那是50年间,因为印刷的革命,带来了数据翻一番的增长,20年间实现的,这 是历史,我们看一下颜色,深色是数字信息,浅色是类比信息。

  这对我们来说意味着什么,我们看一下我们的图片,如果每一分钟对这匹马进行拍照是这样的;如果每一秒钟对这匹马进行拍照,是这个状态。如果是六十分之一秒照一次相,就会有连续的动作,所以我们创造了影片。

  新的对世界的理解,我们有更多的海量的数据及相关的数据联系起来,我也要跟大家解释一下,这个更多的意味着什么呢?意味着更多的和数据相关的或 者问题相关的一些数据,我们可以让数据说话,我们如何了解这一点呢?如何真正的理解它呢?我们再想一下照片,如果我现在要拍一个照片,把所有人都拍进来, 我必须要有聚焦,我必须要选择对我来说什么是重要的,是第一排的还是后面一排的,如果我关注的是第一排的人,那遗憾的是后面一排的人就看不到了,因此我必 须要进行一个选择,目前在收集数据时进行选择,什么是重要的,什么是不重要的,但是很多时候我不知道什么是重要的,什么是不重要的,这种情况下,有些数据 丢失了,我们要考虑一下。

  这张照片是我四岁的儿子,这不是正常的照片,是大数据的照片,是大数据的相机拍下来的,这样的话,我儿子就聚焦了,我可以把我儿子聚焦,也何以 把牙刷聚焦,因为我把所有的数据都收集了,我可以让数据说话,而且可以用这些数据来回答问题,或者回答我之前没有的问题,一旦我收集了这些数据,我们可以 做到这一点,因为我们把所有数据都收集到了,我有这么多数据,可以做一些工作,因为我在某些方面丢失了一些东西,在某些方面就获得了一些东西,我们必须用 全新的视角考虑世界。

  过去我们考虑世界的时候是以因果的关系考虑世界,我年轻的时候,我爸妈跟我说,在冬天的时候,出去戴上帽子,否则会感冒,因此他创造了这样一种 因果关系,就是不戴帽子就会感冒,尽管并不是如此,是有一些病毒会导致感冒,而不是戴不戴帽子导致感冒。这就是过去的时间里,人们想理解世界是通过因果关 系的连接,我们想要了解到事物后面的原因是什么,来了解世界。我们想了解为什么,尽管我们不知道发生了什么事情,在大数据时代我们可以了解发生了什么事 情。

  沃尔玛(75.870.170.22%)可以对收集的数据进行分析,比如一个飓风侵袭了某个地方,可能会对他们产生影响,比如人们会买一些苞米花,美国人经常买苞米花,但是到现 在也不知道为什么买苞米花,但是他们把这个东西拿出来,可以看出销售增长了30%,这个数据之间有更多的相关性,因为这些卖家他们更好的了解了这些数据, 对这些数据进行分析,了解它的地点,地点可能不太容易获取这样的信息。现在在日本,研究者们对我们的姿势进行了一个分析,为什么这么做呢?好象说姿势很独 特,而且可以对他进行利用,进行抽取数据,怎么做呢?可以用来防止小偷,一个小偷进了一个车,手的动作,我们通过这个方面进行分析哪个是小偷。

  这是谷歌(554.91.530.28%)的眼镜,第一版不是那么强大,第二版可以有更多的信息,我们可以分享一下,这个数据价值非常大,我们可以了解一下,她看了什么东西,她 看的是广告板吗?看的是某一个商场,看的是某一个人,我们可以看到这些数据。也就是说,数据让我们获得了一些数据源,结果是什么?第一个结果是我们如何进 行营销,我们如何把我们的东西更好的卖出去,亚马逊(327-7.38-2.21%)很好的利用了这一点,我们都知道亚马逊,而且我们知道它的一个推荐,他会给你推荐产品,他有推荐的软 件,我们可能感到很惊奇,但是刚开始的时候,亚马逊聘请了工程师对它进行设计,这个工程师设计了推荐的引擎,是基于买家30种不同的行为进行推荐,推荐的 是之前预先定义的品类,亚马逊的工程师说这是一个灾难,好象你去购物,好象一个很愚蠢的人不知道自己怎么样去购物,亚马逊说会从小数据转向大数据的思维, 而且不是预先定义的品类,不再这么做了,我们看在大数据领导是什么样的状况?我们把它一项一项推荐,现在大概占到亚马逊销售的30%,就是让数据可以说 话,而且这对我们来说是全新的变革,比如在制造业方面,我们可以想到100年前,亨利福特生产了福特的汽车,那是了不起的创新,是工业革命的初期,现在有 红色、蓝色或者白色的汽车,亨利福特说可以有任何颜色,只要颜色是黑色的话,因为他们只能生产黑色的车,大量生产和制造,那个时候亨利福特的工厂没有买家 的数据,他们也不知道生产什么颜色的汽车,也就是生产界可以有很大的变化,也就是灵活的生产,也就是为客户量身定制,生产他们所需要的东西,而不仅仅是生 产唯一的东西,客户没有什么选项。

  第三个转移或者变化就是我们了解数据的价值。过去我们可以用数据来帮助销售更多的产品,在大数据的时代,数据本身是一种资源,这也改变了我们业 务的模式,甚至说在传统的制造业企业里面,比如劳斯莱斯,劳斯莱斯过去是生产飞机的企业,而且营业额也很高,利润也很高,但是后来随着飞机的发展,他们在 里面有一些软件以及硬件来对发动机进行改进,因此他们可以获得很多的数据,他们现在有一些资源了,劳斯莱斯改变了自己的营业模式,过去是销售产品的公司, 现在这个公司销售的是服务,也就是固定费用的维修服务,尤其是针对全球各地的飞行公司,生产飞机的公司提供服务,因此如果能够很好的了解,数据本身可以成 为资源,可以带来价值。

  我们再来看移动电话的公司,我们看这个图,这个不是手机的发射塔,电信行业现在面临很大的困难,主要是价格的问题,因为价格的竞争非常激烈,我 们不想通过价格来竞争,我们想通过价值来竞争,怎么做呢?应该认识到你有什么样的机会和资源,一个移动手机的运营商,在荷兰有一个很好的例子,信息的强度 是不一样的,因为天气的不一样,发射器的信号强度也不一样,我们可以利用信号的变化来预测天气,比如降雨或者湿度,我们有很多这样的发射塔,他们突然想到 有很多这样的天气预测,真正实现了实时的传递天气预报的信息,基本是免费的。现在还有一个有趣的观察,全球没有一个国家,除了英国之外,英国对天气感兴 趣,所有人都会对当地感兴趣,除了英国之外,英国对全国天气感兴趣,荷兰的手机运营商有新的业务模式,可能成为全球最佳的天气预报的服务商。

  创造一种新的价值,或者新的资源,而且我们可以看到手机的信号发射塔,他们会有不断的信号传来,这是新的业务模式,这个发射塔是收集信息的平 台,以非常低的成本收集信息,因此有很多新的机会,同时也会有新的竞争者,没有任何业务的领域,都是新的,因为总会有新的人加入,因此你不会永远保持在新 的状态。

  我们看汽车行业,汽车在不断的发展,而且是革命式的速度在发展,过去几年最大的创新是什么?无人驾驶汽车,谷歌在这方面研发速度非常快,已经有 几十万的历程,而且成为了这方面的专家,第一次在交通灯停下来的时候,发生了一次撞击,是因为驾驶人员决定把计算机关掉自己驾驶,不然是零事故的,为什么 是BMW研发的?不是奔驰研发的?因为他们没有看到新的机会,谷歌成为了新的竞争对手,看到了新的机会,当然也是新的竞争。

  再来看健康和医疗,之前是结果非常完善的行业,如果我感冒的话,如果我吃阿司匹林,我要么吃多了,要么吃不够,因为剂量是针对平均患者的,我和 平均患者是不一样的,我们都不同,每个人都是不一样的,都有不同的DNA,不同的新陈代谢,有不同的严重程度,但是我们吃同样的剂量,为什么?因为在医疗 行业没有数据,让他能够更加的定制化,有了大数据以后,我们能够走向个人化、个性化了医疗,不仅能延长我们的寿命,还能提高我们的生活质量,能够让我们更 快的获得医疗。

  再考虑另外一个方面,之前没有想到大数据的影响,就是人类学习。我们现在对学生测试,他们学的多好,多蠢啊,我们没有想到的做法就是我们看他们 的学习方法,我们的书、我们应用的教学方法,我们没有测试这些教学方法,我们还用过去200间使用的教学方法,我们知道是否有效吗?不知道有效性,为什么 继续使用呢?因为我们没有数据,不知道,这个点要改变,而且改变速度会比你想象的快。

  我们有这样的应用,曾经上百万人在用,这个应用能够帮助你学习语言,非常漂亮,很有趣,是个游戏,很有意思,因为有千万级的用户,保存了这样的 数据,他们知道西班牙人怎么学英文,中国人怎么学英文,有了这样的数据,他们发现,西班牙人教授英语哪些方法是错误的,应该改变这些方法,改变的方法能够 很快的提高学习的结果,这个是以结果为导向的方式。

  有这么一个人叫做专家,就是以自我为风格的这些专家,大家都知道,很了解这一类人,一般年纪要大一些,坐在那儿,声音非常洪亮,我知道正确答案 是什么,相信我吧,有时候他们只是装一下,但是没人敢说,没人敢挑战他们,因为他们有权威,你没有任何可以驳斥他的数据,将来这个局面会改变。

举个例子,有这么一个公司你肯定听过叫做谷歌,41种不同的蓝色,他们有个首席设计师,进行测试来选择一个颜色用于设计,大概是两个象素,他说 一定要是这个蓝色,为什么呢?上司说有没有进行数据分析,设计师说我是设计师,我知道,上司说我不相信你,我要进行测试,设计师说你要强迫我进行数据分析 我就辞职,因为我是设计师我就是知道,所以这个设计师的上司说你的辞职报告我接受了,你被解雇了,41种不同的蓝色,他发现差别非常细微,能够创造多的多 的点击率,最后能够把年营业额增加几百万美元,他真的把这个设计师解雇了,所以要记住这一点。

  未来如何改变一个组织和机构?大数据是看待现实新的角度,不仅改变市场营销,改变生产制造,改变我们从事商业的方式,因为数据不再说你能不能 做,而是数据本身就是唯一的资源,就成为一个价值的资源,一个来源,也就是对我们来说意味着新的商业机会,没有哪一个行业有这种竞争的免疫能力,都将会受 到这个影响,包括医疗、包括学习,所有的机构,无一幸免,都必须要能够适应大数据,他确实说得上是一个革命,所以要不断的学习,谢谢大家!

本文来源于"中国人工智能学会",原文发表时间"2014-06-30"

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
大数据 BI
阿里十年大数据专家谈“云上数据中台之道”含内部PPT
从大数据的概念被正式提出,到马云老师预言人类正从IT时代走向DT时代,大数据浪潮迭起。大数据同仁共同认知的一点是,大数据会对社会创新、产业变革、业务创新及每个人的角色定位产生近乎决定性的影响。
|
存储 SQL 人工智能
贾扬清演讲实录:阿里云一体化大数据智能平台的演进丨2022云栖一体化大数据智能峰会
贾扬清在一体化大数据智能峰会论坛上分享立足于数据这个领域,数据和智能之间创新的火花。
贾扬清演讲实录:阿里云一体化大数据智能平台的演进丨2022云栖一体化大数据智能峰会
|
人工智能 大数据 双11
大数据专家在线
感谢您关注阿里云智能大数据&AI产品双11活动!
1932 1
大数据专家在线
|
人工智能 弹性计算 自然语言处理
【1026 - 1030直播导视 | PPT 下载】阿里专家直播:EasyTransfer平台应用实践、大数据+AI meetup 2020第二季·上海场来啦!
本周为大家带来了8场技术公开课,技术学习实践两不误!开源日迎来第六期啦线上对话阿里云专家:为大家带来EasyTransfer平台应用实践;大数据+AI meetup上海专场来啦!大家快办好小板凳坐等下周技术专场吧!
7838 0
|
人工智能 大数据 双11
报名中 | 4天4城(深圳/广州/上海/武汉),10位专家带你实操演练,如何玩转行业大数据应用
您是否了解数仓最新技术趋势「湖仓一体」?您是否还在惆怅业务数据不够实时?您是否在大数据开发治理、日志数据分析和个性化推荐等方面遇到难题?
2376 0
报名中 | 4天4城(深圳/广州/上海/武汉),10位专家带你实操演练,如何玩转行业大数据应用
|
大数据 分布式计算 流计算
阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点
章剑锋(简锋),开源界老兵,Apache Member,曾就职于 Hortonworks,目前在阿里巴巴计算平台事业部任高级技术专家,并同时担任 Apache Tez、Livy 、Zeppelin 三个开源项目的 PMC ,以及 Apache Pig 的 Committer。
阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点
|
机器学习/深度学习 达摩院 大数据
中国计算机学会大数据专家委员会增选,阿里李飞飞、李静远入选正式委员
中国计算机学会大数据专家委员会(以下简称CCF大专委)学术年会于2018年10月11-13日在西安陕西宾馆召开,会上公布了第八批次增选正式委员和通讯委员结果,阿里巴巴集团副总裁、达摩院数据库首席科学家李飞飞博士,阿里云计算有限公司科研技术合作总监李静远博士入选。
7523 0
|
算法 大数据 数据库
数据分析师、数据科学家、大数据专家三个职位的区别
版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 https://blog.csdn.net/chszs/article/details/80658582 数据分析师、数据科学家、大数据专家三个职位的区别 2018.6.11 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。
1159 0