法国:大数据的运行方案已初具规模

简介:

0.jpg


海量数据处理专家们云集于412日举行的巴黎大数据会展。他们借此机会参与讨论法国政府关于推行大数据的一些措施。

如何在法国建立大数据行业?这是 Capgemini的首席执行官保罗艾穆兰及达索信息系统Exalead解决方案的技术总监弗朗索瓦布尔冬克要回答的问题。去年十月他们受阿尔诺蒙特布(现任法国经济部长)委托,作为针对大数据的工业重振计划项目的共同负责人,他们将于近期提交他们的研究结果。刚刚过去的四月在巴黎举行的大数据展会上,他们做了阶段性总结。

需要说服法国政府机构及企业

要在法国创建一个大数据的生态系统,这是符合市场需求的,而不是随意选择的服务。换句话说,要说服公司和法国政府部门现在是时候开始大数据了。 “大数据尚未成为法国企业的核心部分。而在美国和英国,几乎所有产品的投放都会经过大数据的分析。并且,这种使用数据分析的趋势正蔓延到他们国家的整个工业基础,波士顿咨询集团的大数据及分析总监埃里阿斯巴塔斯如此说到。

因此,现在应紧急应对已挽回我们的迟滞的损失。弗朗索瓦布尔冬克提醒说,大数据已成为企业的战略议题。它首先涉及到董事会,而不是首席信息官或创新总监。

大数据战役已经打响

大数据的作用不仅在于可以提高企业的经济效益,更重要的是我们现在正面临着经济战,而赢得这场战争的重要武器是数据,弗朗索瓦布尔冬克补充到。美国网络巨头已经具备了通过大数据来为客户选择产品的能力。

由于没有及时的开始数字化,很多行业已经遭受了一些损失。比如传统便利店已经被亚马逊或旅游行业电商入侵。法国酒店住宿业市场约90亿欧元,20%的酒店预订是通过在线预订平台完成的的 (其中70%来自booking.com, 20% 来自Expedia) ”然而,酒店的营销成本由实体旅行社的10%增加至现在的使用网络平台的23%,弗朗索瓦布尔冬克提到。这对于酒店经营者来说是一个无法忽视的影响。其他领域也开始担心,例如银行领域。尤其是保险领域已经有Google入侵的案例。

客户关系和供应链管理位于大数据战争的前沿

保罗艾穆兰预计大数据尤其成为客户关系管理、供应链管理的推动力。对于第一种情况,弗朗索瓦布尔冬克说“我们尝试帮助保险公司建立客户应答策略,通过对单一客户的服务、个性化服务及自我量化服务重新与他们的客户建立关系”。

这是通过分析客户的使用情况来调整公司的产品。另外一个例子,在有睡眠呼吸暂停症的病人所使用的呼吸系统中添加在线通信芯片,不仅可以反馈病人的正确的使用信息,同时可以避免设备的浪费以及高额的社保。

至于供应链管理,预测性维护需要大量的数据。飞机发动机的生产商宁愿预先在本地完成飞机的检修而不愿意看到飞机坏在了地球的另一端。通用电气飞机租赁公司已经收购了Pivotal的股份。在租赁而非销售的业务模式中,最初的采购价格已经居于次要位置,取而代之的是使用实时采集的数据的能力。弗朗索瓦布尔冬克总结说“价值链已由原来的生产制造变为提供产品运行的服务。很多行业开始倾向于各类服务,类似于软件行业的Saas模式

政府会扶持相关的培训以及创新

为了帮助企业解决这些问题,国家以及各行业可主动成立一些种子基金或专门企业加速器。弗朗索瓦布尔冬克提到借助孵化器来实现一些保险业的相关项目是个不错的主意。在这样的理念下,重新建立客户关系以收集数据,并使数据使用具备商业价值,才能迅速并成功的进行行业革新。

但是,这些创新并不是来自于大公司。大公司应该学会帮助法国初创企业进行国际化推广,并且等到他们有一定规模之后再进行收购。保罗艾穆兰强调一些大的企业业应当选择一些法国中小型创新企业。我们要行动起来,大数据不仅仅是美国巨人的领域

在我们的行动计划中,我们首推一个资源中心机构的理念,以解决三个具体问题“。弗朗索瓦布尔冬克补充说,首先要帮助初创企业找到他们创新所需要的数据。例如,在公共交通领域,机构将帮助初创公司与SNCF(法国国家铁路交通公司)讨论,帮助他们找到合适的对话人,以及合适的政策法规。其次,需要提供技术平台以提供计算数据资源。

最后,该中心机构将帮助引进人才,让他们使用中心的数据,并且可以做一些实验。更宏观得来说,工程师的教育必须有所改善以便于提高数据科学家的技术水平,弗朗索瓦布尔冬克解释道。但是技术并不代表全部。 “我们需要能读懂数据的人才,并且不忽视商业方面的数据。这些技能可以通过工程师,商学院以及大学的教育来获得,保罗补充道。

与此相关的数据自由以及保护法

数据自由以及保护法确立了一个使用原则即:所有的数据处理必须与最初收集数据时确定的目的相一致。这恰恰与大数据领域相反,弗朗索瓦布尔冬克说到。一项与CNIL(国家信息以及信息自由委员会)联合定义的一种行业授权的操作机制已经完成。比如,在保险业,分析司机的驾驶方式(比如平均速度,在城市中行驶情况等等)是允许的;但是通过观察司机的外出习惯来确定是他否在家是不允许的。这些数据处理机制需要由CNIL和被审计的公司的认可。


原文发布时间为:2014-05-17

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
分布式计算 DataWorks BI
MaxCompute数据问题之运行报错如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
46 1
|
8月前
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(下)
|
11天前
|
SQL 分布式计算 运维
MaxCompute产品使用合集之在大数据计算MaxCompute中,怎么查看工作空间中正在运行的查询和任务
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
分布式计算 大数据 Hadoop
开源大数据方案有哪些
开源大数据方案有哪些
107 0
|
3月前
|
SQL 分布式计算 DataWorks
maxcompute函数问题之注册函数后运行结果错误如何解决
MaxCompute函数包括内置函数和自定义函数(UDF),它们用于在MaxCompute平台上执行数据处理和分析任务;本合集将介绍MaxCompute函数的使用方法、函数编写和优化技巧,以及常见的函数错误和解决途径。
|
3月前
|
SQL 分布式计算 MaxCompute
MaxCompute异常问题之运行语句异常如何解决
MaxCompute异常涉及到在使用阿里云MaxCompute大数据计算服务时遇到的各种错误和问题;本合集将提供针对MaxCompute异常的分析和解决方案,帮助用户处理数据处理、分析任务中的异常情况。
|
8月前
|
分布式计算 资源调度 Hadoop
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
Hadoop学习指南:探索大数据时代的重要组成——Hadoop运行模式(上)
|
3月前
|
SQL 并行计算 大数据
【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink(基础加强+运行原理)
关于Flink服务的搭建与部署,由于其涉及诸多实战操作而理论部分相对较少,小编打算采用一个独立的版本和环境来进行详尽的实战讲解。考虑到文字描述可能无法充分展现操作的细节和流程,我们决定以视频的形式进行分析和介绍。因此,在本文中,我们将暂时不涉及具体的搭建和部署步骤。
498 3
【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink(基础加强+运行原理)
|
9月前
|
并行计算 固态存储 Ubuntu
基因组大数据计算: CPU和GPU加速方案深度评测
基因组大数据计算: CPU和GPU加速方案深度评测
162 0
基因组大数据计算: CPU和GPU加速方案深度评测
|
5月前
|
存储 分布式计算 大数据
【大数据技术Hadoop+Spark】Spark RDD设计、运行原理、运行流程、容错机制讲解(图文解释)
【大数据技术Hadoop+Spark】Spark RDD设计、运行原理、运行流程、容错机制讲解(图文解释)
78 0

热门文章

最新文章