福建大数据产业发展的优势与劣势

简介:

美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中,如何打造智能城市?这一系列问题的背后,其实都隐藏着大数据的身影——不仅彰显着大数据的巨大价值,更直观地体现出大数据在各个行业的广阔应用。这些行业应用也都更直白地告诉人们,大数据时代已经来临。

一、大数据有多大

多大的数据才叫大数据?目前并没有一个标准答案,根据业内经验,单从数据规模方面来说,当达到PB,TB级别时,才被称为大数据。

数据最小的基本单位是bit(比特),按顺序给出所有单位:bit、Byte(字节)、KB、MB、GB、TB、PB(拍字节)、EB(艾字节)、ZB(泽字节)、YB、BB、NB、DB。

1个英文字母(不分大小写)占1个字节的空间,1个中文汉字占2个字节的空间。一首4分钟的MP3歌曲大约3-5MB字节,一部120分钟的1024p高清电影大约5-7GB字节。一部完整的电影可以压缩成一个GB的文件,而一个艾字节相当于10亿GB,一个泽字节则相当于1024艾字节。

南加利福尼亚大学安嫩伯格通信学院的马丁·希尔伯特进行了一个比较全面的研究。据他估算,2007年,人类大约存储了超过300艾字节的数据,其中只有7%的数据是存储在报纸、书籍、图片等媒介上的模拟数据,其余全部是数字数据。到2013年,世界上存储的数据估计约1.2泽字节,其中非数字数据只占不到2%。

这样大的数据量意味着什么?如果把这些数据全部记在书中,这些书可以覆盖整个美国52次。如果将之存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以伸到月球。公元前3 世纪,埃及的托勒密二世竭力收集了当时所有的书写作品,所以伟大的亚历山大图书馆可以代表世界上所有的知识量。但当数字数据洪流席卷世界之后,每个地球人都可以获得大量数据信息,相当于当时亚历山大图书馆存储的数据总量的320 倍之多。

大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果,确切的说是移动互联网、物联网产生了海量的数据,大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题。

二、数据的价值

(一)数据是金矿

成千上万的数据汇集到数据中心后,经过对数据进行加工和清洗,可以变成商品并出售。从各个渠道采集来的数据,方式各不相同,有的质量很差,有的格式不统一,有的涉及用户隐私,因此在用之前,要对数据进行清洗。大数据本身是一座金矿,但它必须经过清洗、分析、建模、可视化之后,才有交易价值。

数据商品化后,企业可以通过购买到的数据对目标顾客精准定位,根据他们的口味出售商品;创业者也可以依赖商品化的数据,定位市场,提供符合市场需求的产品及服务。

(二)数据值多少钱

数据的价值由市场决定。不同品种的大数据价格机制是不一样的,实时价格主要取决于数据的样本量和单一样本的数据指标项价值,而后通过交易系统自动定价,价格实时浮动。

例如,facebook上市时,市场没有把2.1万亿条信息作为公司的资产负债表,而如今目前它每条的市值达到140美元。但即使是facebook这样的巨头,它的信息定价也未成为业界公认的标准,这是由于数据价格在不同的空间和时间环境下是完全不同的,国内也没有成熟的标准业务模式。我们可以为一些企业估算出数据资产价值,然后尝试交易,通过市场去真正核实它的价值。

三、大数据应用场景举例

(一)医疗行业大数据场景应用

医疗行业拥有大量病例、病理报告、医疗方案、药物报告等。如果这些数据进行整理和分析,将会极大地帮助医生和病人。在未来,借助于大数据平台我们可以收集疾病的基本特征、病例和治疗方案,建立针对疾病的数据库,帮助医生进行疾病诊断。

基因技术发展成熟后,可以根据病人的基因序列特点进行分类,建立医疗行业的病人分类数据库。在医生诊断病人时可以参考病人的疾病特征、化验报告和检测报告,参考疾病数据库来快速帮助病人确诊。在制定治疗方案时,医生可以依据病人的基因特点,调取相似基因、年龄、人种、身体情况相同的有效治疗方案,制定出适合病人的治疗方案,帮助更多人及时进行治疗。这些数据也有利于医药行业开发出更加有效的药物和医疗器械。中国的基因测序处于世界领先梯队,目前不到一万元就可以测量客户36对基因序列,可以帮助医生进行早期疾病诊断和制定治疗方案。

(二)金融行业大数据场景应用

金融行业拥有丰富的数据,并且数据维度和数据质量也很好,自身的数据就是最好的数据,可以开发出很多应用场景。如果考虑引入外部数据,可以加快数据价值的变现,市场上较好的数据有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据、银联交易数据等。

大数据在金融行业应用范围较广,典型的案例有花旗银行利用IBM沃森电脑为财富管理客户推荐产品,并预测未来计算机推荐理财的市场将超过银行专业理财师。摩根大通银行利用决策树技术,降低了不良贷款率、转化了提前还款客户,一年为摩根大通银行增加了6亿美金的利润。VISA公司利用Hadoop平台将730亿交易处理时间从一个月缩短到13分钟。

四、大数据产业的发展

(一)国外大数据产业的发展

大数据正在成为国家竞争的前沿、产业竞争力和商业模式创新的源泉,大数据产业已经得到了国内外的广泛关注并积极行动。联合国“数据脉动”计划、美国“大数据”战略、英国“数据权”运动、日本“面向2020年的ICT综合战略”、韩国“大数据中心战略”、新加坡“五大系统大数据建设”等先后实施了“国际大数据战略的国家行动”,有效加快了大数据产业化、市场化进程。

(二)我国大数据产业的发展

近年来,我国政府对大数据重视程度日益凸显,市场规模增长迅猛,新技术新应用层出不穷,大数据产业加快发展的基础和条件基本具备,大数据产业结构日益完善,已基本形成“上游数据资源+中游产品技术+下游应用服务”的大数据产业体系。

国内正在展开大数据产业发展的角逐,争抢大数据产业发展的先机及“蛋糕”。全国已建成逾10个大数据产业园区,已有23个省份出台了74个与大数据相关的政策和规划。福建、上海、贵州、重庆、天津等省市都出台了大数据发展规划或政策措施。

(三)福建大数据产业发展

⒈优势

福建大数据产业发展已具备相当基础。已形成一批在大数据硬件设备、应用软件服务等领域国内领先、产值超亿元的应用类企业。大数据已成为福建三家电信运营商的发展重点,福建移动通信公司承建的电子政务外网云计算平台已经建成投入使用,已经承载了10个应用系统在线运行。福建省不少云计算及大数据服务和产品在全国居于领先地位,被广泛应用。

国内领先的福建部分大数据项目

项目名称

相关内容

中国国际信息技术(福建)产业园

中国国际电子商务中心携手福建构建具备国际视野,融合国家战略、地方经济、市场开发、资源整合为一体的“中国商务云”网络。项目位于泉州市安溪县,总占地面积约5000亩,以国际最高等级第三方数据灾备中心为核心,产业园构建以信息技术服务外包为主的绿色生态产业链,打造集云服务等功能为一体,覆盖福建、辐射海西的国际一流信息产业园区。

福建省电子政务云计算平台

福建在全国率先建成并投入使用的数字福建政务内外网云计算平台由电信、移动公司共同出资1亿元参建,免费向全省政务部门提供相关服务,目前已有“12345”政务服务热线等应用系统在平台上线运行。

数字福建(长乐)产业园

计划于2017年上半年,除涉密系统外,省直部门数据中心将全迁入,将在全国率先实现所有省直部门政务数据统建共享、汇聚开发。工程总投资7500万元,建筑面积1.23万平方米,建成后能容纳约1200个标准机柜,可满足未来10年所有省直部门所有应用系统的部署需求。

2、劣势

首先是人才、技术资源的短缺,我省缺乏大数据应用领域的领军人物和专业机构,国内专家人才严重匮乏(目前,福建省信息集团下属的星云大数据应用服务有限公司已开始承建多个省级大数据中心和公共基础能力服务平台);其次是大数据产业发展总体偏弱。目前,福建省内还没有形成大数据行业有影响力的龙头企业或科研机构。在中国四个大数据产业区域中(京津冀地区、珠三角地区、长江三角洲地区、中西部地区),福建处在珠三角地区、长江三角洲地区的两不靠地区,地位十分尴尬。

中国大数据产业圈分布图

中国大数据产业圈分布图

五、投资大数据的建议

(一)抓住机遇促发展

2016年11月,国务院印发了《“十三五”国家战略性新兴产业发展规划(2016-2020年)》,提出“实施国家大数据战略”的发展规划。

2016年6月,福建省政府印发了《福建省促进大数据发展实施方案(2016-2020年)》,提出了“到2020年,政务工作、公共事业、城市运行、商事服务和生产生活等重点领域大数据应用全面建成,构建全国一流的大数据产业和应用示范基地,涌现一批具有国际影响力的大数据平台与技术企业,以大数据为核心要素、以大平台为营运支撑的产业集群基本形成”的发展目标。该《方案》提出了23项大数据应用重点工程,7项大数据技术创新重点工程和7项大数据产业发展重点工程。这些重点工程不乏掘金点(包括医疗大数据、健康大数据、信用大数据、宏观决策大数据等),我们可以深耕部分工程,实现盈利。

此外,该《规划》和《方案》都提出了具体的金融财税支持政策(如《方案》中提出“鼓励设立一批投资于大数据产业领域的创投基金”)。这些措施有利于对我们通过资本运作的方式,以股权投资基金、创业投资基金、数据基金等形式投资大数据产业。

(二)做专做强谋创新

大数据不是技术创新,而是信息技术创新的运用。大数据的特性决定了数据可一次开发,多样使用的属性。比如,某地发生地震(公共安全管理),我们可以通过大数据建立“人流去向模型”,分析灾民可能的避灾时间和地点,在灾民到达之前快速反应,提供补给和人员疏导。这个“人流去向模型”还可以用于分析疫情爆发时疫区人员的去向,在疫情蔓延之前做好管控并采取措施。因此,我们可以立足于大数据的某个领域(如医疗健康大数据)做专做强,强化行业影响力和数据资源垄断能力,创新大数据及分析模型的使用(如利用医疗健康大数据推动养老、保险、个人征信等业务发展),真正做到“一子落准,满盘皆活”。

(三)借智借脑补短板

作为一家以实业与金融投资为主业的投资型集团,技术研发或许不是我们的强项。但是,我们可以借助与国内外大数据行业领军企业和科研机构合作,利用他们的资金、资源优势,实现自身大数据产业的“弯道超车”,补齐我们的技术研发短板,增加自身的技术储备和人才储备,从而实现“弯道超车”。



本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
29天前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
4月前
|
分布式计算 资源调度 大数据
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
152 0
|
4月前
|
存储 安全 大数据
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
【云计算与大数据技术】云交付模型、云部署模型、云计算优势与挑战、应用的讲解(超详细必看)
345 0
|
6月前
|
存储 分布式计算 数据挖掘
maxcompute优势
MaxCompute作为阿里巴巴集团内部核心大数据平台,具有以下优势: 1. 存储及计算能力:MaxCompute具备万台服务器扩展能力和跨地域容灾能力,能够承担集团内部绝大多数的计算任务,支撑每日百万级作业规模,适用于100GB以上规模的存储及计算需求,最大可达EB级别,并支持多种计算模型如SQL、MapReduce、Graph等及MPI迭代类算法。 2. 高效的数据处理能力:MaxCompute可以快速处理海量数据,减轻企业数据处理负担。 3. 自动调整存储成本:MaxCompute可以根据数据的访问频率和重要性,自动调整存储成本,降低企业数据存储成本。 4. 实时数据分析:MaxCom
43 3
|
11月前
|
机器学习/深度学习 SQL 分布式计算
「大数据分析」寻找数据优势:Spark和Flink终极对决
「大数据分析」寻找数据优势:Spark和Flink终极对决
|
存储 SQL 分布式计算
MaxCompute产品优势
MaxCompute产品优势
159 0
|
存储 SQL 机器学习/深度学习
【MaxCompute】 产品优势
MaxCompute 的主要优势如下: 简单易用面向数据仓库实现高性能存储、计算。预集成多种服务,标准 SQL 开发简单。
【MaxCompute】 产品优势
|
大数据
大数据是否为小企业创造了竞争优势?
大数据可能成为当今小企业最具竞争力的优势,人们需要了解更多有关大数据如何提供帮助的信息。
|
数据采集 大数据 索引
分布式数据采集软件较常规大数据采集软件的优势是什么?
为什么分布式数据采集软件能够收到互联网发展的青睐呢?大数据时代的发展,大数据在目前的企业发展,政府决策以及社会动态分析等等方面都发挥着重要的作用,如何在目前的互联网大平台下,实现大规模、快速采集数据成为焦点。
2162 0