大数据与互联网的关系

简介:  大数据平台 大数据中心 网络大数据(http://www.raincent.com) 大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。
  大数据平台 大数据中心 网络大数据http://www.raincent.com
大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。作为继云计算,IT产业的又一次新技术、颠覆性革命,无论是芝麻开门般的财富奇迹,还是对人们生活的影响。大数据不断地被提及,更是成为了影响当今世界创新的重要知识点。
什么是大数据?

    曾在《大数据时代》一书中提到,以前人们使用的大多是抽样数据,而大数据则包含了所有数据。另外,大数据关注效率,而不是精准度,关注关联性,而不是因果关系。以前的大多数数据被称为结构化数据,比如“你几岁?我15岁”,而“我今天说了什么话?我今天吃了什么东西?”这些数据则被称为非结构化数据,主要指一些描述性的数据。随着互联网的发展,这些非结构化数据被收集并存放起来,对于这些数据加以分析利用,便构成了大数据的应用,这也是大数据不同于之前数据的最为重要的一点。

大数据到底有多大?

    大数据所涉及的数据量非常大,而且正变得越来越大。自人类有文字记载到2012年为止,古今中外所有人类出版的资料,共计数据200PB。而在互联网发展的短短十几年里,数据量就已经步入了EB、ZB时代。以1号店为例,1号店一年产生的数据约为20个PB。这20个PB只是有过数据储存的这部分,不是1号店产生的全部数据。这些数据相当于有人类文字记载到2012年止所有数据的十分之一,而且,这只是1号店一家公司所产生的数据量。数据量正以惊人的速度爆炸并发展,是随着互联网的应用而产生的爆发式增长。

备注:单位从小到大排序:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 进率1024

1Byte = 8 Bit

1KB = 1,024 Bytes

1MB = 1,024 B = 1,048,576 Bytes

1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes

1TB=2的40次方Byte=1099511627776 Byte

1PB=2的50次方Byte=1125899906842624Byte

1EB=2的60次方Byte= 1152921504606846976 Byte

1ZB=2的70次方Byte= 1180591620717411303424 Byte

1YB=2的80次方Byte= 1208925819614629174706176 Byte

1DB=2的90次方Byte= 1237940039285380274899124224 Byte

1NB=2的100次方Byte= 1267650600228229401496703205376 Byte

这么多数据从哪儿来?

    以一位浏览了1号店网页的顾客为例,他从哪里来?在1号店网站浏览了哪些页面?看过哪些商品?涉及的品类有多少?是否使用了搜索功能?还是只是随便浏览?这些看似不经意的数据都会储存在1号店的大数据平台。为什么数据越来越多?就是因为人们无时无刻不产生数据。比如上海科普大讲坛邀请1号店CTO韩军在1点45分进行了关于大数据的演讲,这个时间点便产生了一些数据。还有大家无时无刻不使用的移动设备,也会不断产生数据。每个人都在不断地产生各式各样的数据,这就使得数据越来越多,无所不在。

大数据是如何应用的?

    以一个怀孕的女性为例,她的消费行为可能会在怀孕的前四周或者前五周突然发生变化,比如在她网购时,原来喜欢买甜食,现在则偏好酸的食物,这些信息就会被 纳入企业数据库,并被记录下来。随后,公司会为这位孕妇推送与怀孕相关的产品优惠券,这就是典型的大数据应用。亚马逊有一个非常神奇的大数据应用,叫做 “未购买先发货”。亚马逊作为全球最大的电子商务网站,对于大数据有着许多应用。比如,亚马逊会根据消费者在网站上的消费行为,预测顾客下个礼拜的需求, 如牙膏、薯片、大米、酱油等。亚马逊会自动生成订单,将这些商品送到顾客家中。顾客作为消费者主体,在根本没有意识到自己需要这些东西的时候,商品就已经 送到手中。以实际应用效果来看,绝大多数消费者认为“未购买先发货”的预测较为准确,会愉快地签收订单。

大数据下的个人隐私?

    现代人使用智能手机时,商家会将信息存在云端备份,这些数据的存在,不可避免地会引发隐私问题。美国曾有预测学家说过,在未来十年或二十年,现在人们认为 非常重要的隐私,会慢慢转变为每个人都乐于将数据共享,这也将成为社会发展的一个过程。大数据下的信息处理,可以将人们在图书馆借书的信息和网上购物的信 息产生交集,比如在人们在图书馆借阅了健康类书籍后,在网上买披萨时,会为顾客推荐更健康的披萨。当数据产生关联后,也就产生了价值。在大数据下,隐私与 便利永远存在矛盾,可谓没有绝对的隐私。在这个数据化生存的时代,数据跟隐私是相对的。隐私和便利之间,也在慢慢寻求平衡。

电商对于大数据有着怎样的应用?

    对电商来说卖什么产品?以什么价格销售?如何防止价格设置出错?应该卖什么商品?什么商品好卖?什么商品不好卖?都需要运用大数据。定价对于电商领域的竞争而言非常重要。比如,在大数据的应用下,1号店设计了名为“智能价格”的应用。每天会自动在网站上搜索大量的产品价格,然后根据搜取的价格信息,对价格进行自动调整,以保证1号店的产品价格处于可竞争性的地位。在各大电商齐打价格战的“双十一”,1号 店的价格系统对于部分热销商品,每隔一两分钟就会对其他电商的商品价格进行扫描比对,实时推动价格变动。在电商的运营中,销量、价格和库存有着密不可分的 关系,库存又和备货有着重要关系,这些都需要非常强大的销售预测系统进行支撑。还有许多诸如此类的大数据应用不胜枚举,大数据的应用对于电商打价格战,提 高毛利,更好地服务消费者都有着巨大帮助。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
8天前
|
SQL 存储 大数据
某互联网大厂亿级大数据服务平台的建设和实践
某互联网大厂亿级大数据服务平台的建设和实践
81 0
|
大数据
《2017 中国互联网消费生态 大数据报告》电子版地址
2017 中国互联网消费生态 大数据报告
44 0
《2017 中国互联网消费生态 大数据报告》电子版地址
|
分布式计算 DataWorks 数据可视化
4.互联网、电商离线大数据分析最佳实践(三)|学习笔记
快速学习4.互联网、电商离线大数据分析最佳实践
96 0
4.互联网、电商离线大数据分析最佳实践(三)|学习笔记
|
存储 SQL 分布式计算
4.互联网、电商离线大数据分析最佳实践(二)|学习笔记
快速学习4.互联网、电商离线大数据分析最佳实践
111 0
|
大数据
《互联网大数据应用&解决方案》电子版地址
《互联网大数据应用&解决方案》PPT
54 0
《互联网大数据应用&解决方案》电子版地址
|
存储 机器学习/深度学习 人工智能
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
160 0
三剑合一称霸互联网时代——Serverless助推云计算-大数据-人工智能
|
SQL 分布式计算 算法
传统金融IT男转型互联网大数据码农,图啥?
传统金融IT男转型互联网大数据码农,图啥?
|
SQL 分布式计算 DataWorks
互联网、电商行业离线大数据分析
最佳实践覆盖23种场景,有180多篇最佳实践,其中涉及100款以上阿里云产品的最佳使用场景,最佳实践已成功帮助大量客户实现自助上云。
互联网、电商行业离线大数据分析
|
大数据
互联网时代,一份投资理财大数据报告能改变什么?
互联网时代,一份投资理财大数据报告能改变什么?
113 0
互联网时代,一份投资理财大数据报告能改变什么?
|
弹性计算 分布式计算 监控
互联网、电商行业离线大数据分析最佳实践
使用阿里云服务实现电商网站销售数据离线分析后在大屏幕上展示,极大地增强数据的可读性。
互联网、电商行业离线大数据分析最佳实践

热门文章

最新文章