工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

简介:

工业大数据在中国是伪命题

大数据本来有更加学术化的名称:数据密集型(Data-Intensive)计算研究。微软在2009年组织撰写《第四范式:数据密集型科学发现》一书,给与这种方法以“范式里程碑”的待遇。而对于大众而言,这些不过是野地径自升起的炊烟,无人知晓也无可关注。

后来随着Big Data这个简洁明了的概念一炮打响,各种大数据这才迎风而上。

工业大数据不过是其中一种BigBang。工业4.0轻松地接过这一闪亮的火把,搅动了人们对于大数据无穷的想象力和不着边际的信心。数字设计、数字工厂、数字制造等一时间喧嚣而上,难免给人造成一种温暖的假象:到处都是工业大数据。有些舆论甚至断言,中国拥有全世界最大的工业大数据——大概理由是因为中国有最多的设备和工厂现场。

然而,且慢,数据现场,远非工业大数据之地。

中国真的有工业大数据吗?

贵阳大数据中心,以政府主导型的数据为基础,基本是城市数据、政务数据、物流数据等;阿里云是以消费者数据为基础,十多年淘宝历程,沉淀了大量的用户行为数据。

但是,对于那些不分昼夜轰鸣的设备,工业数据仍然是暗无天日的黑油、黑煤炭。对中国制造业而言,些许的光亮或闪烁,远没有到大规模发光发热的时代。更为重要的事情,还需要工业领域去优先解决。

不是煤炭创造了工业革命

对于第一次工业革命的发源地,煤炭在英国发挥了巨大的作用。1700年,英国煤产量是世界其他地区的5倍;1800年,是欧洲其他地区的5倍。

然而,谜团犹在,英国拥有煤炭,好像是该国逃离农耕陷阱的根本要素。但与此同时,德法日和清朝,都有大面积煤田,却未得到大规模的开采。煤炭与工业革命的关系值得明辨。

实际上,这不是一个煤炭创造了工业革命的问题,而是工业革命创造了煤炭需求的问题。

换言之,英国煤炭工业的飞速发展,只是财富和技术已经到达高水平的一个征兆。

煤炭对于英国第一次工业革命的战略意义,此刻正如工业大数据之于中国制造2025。由于蒸汽机的驱动,煤炭犹如脱缰之野马,成为工业革命源源不断的动力。正如一把复杂钥匙吻合一把锁,这种类似的模式,第一次将人力一劳永逸地解脱出农耕时代。工业根基肇始。一段时间后,这个开锁程序被世界模仿,并且换成石化燃料和内燃机。

这一模式,影响了随后二百多年的工业史。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图1 煤炭与工业大数据的对比

随着智能制造的发轫,看上去这个模式,马上就要交给了工业大数据。而此刻,我们必须意识到,数据对于新工业革命的意义,尤其是对于中国制造2025的意义,是一种全新的密码锁模式——中国工业化还并不太熟悉的一种模式。

无数据 不知识

数据、信息和知识的关系,有时候容易混淆。大致而言,数据最开始都是未经组织的,大量存在却价值极低;底层的数据需要通过信息化和工业化,才能转化为知识体系。

从数据到信息,本身就是一种过滤机制——这需要一种提炼,然后可执行、可传递的信息形成知识。知识分为隐性和显性,隐性知识往往存在于人本身之中,传递性很差。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图2 数据、信息和知识的模型

可惜的是,传统知识管理的DIK模型(Data-Information-Knowledge)关系,是一个单线程关系。它只解决了知识的提炼,没有解决回馈问题。

就工业大数据而言,最重要的就是对它进行密集型的分析——工业知识断不能缺位。GE在谈及工业互联网的时候,给与了“专业知识”以高度的重视。工业大数据不是传统的数据统计分析,而是基于专业知识的引导,才能挖掘出数据真正的价值。

显然,知识体系必须重新作用于数据本身,才能形成工业大数据的价值。在工业领域,“无知识,不数据”。没有工业经验的线性化指引,数据就不会高速转化,工业大数据的价值,就不会产生。

对于数据而言,信息化作了第一次提升,使得数据归类、文本化和沉淀;但必须通过工业化才能进行第二次提升,才能将数据提升到知识的高度,形成真正的Know-how、经验、最佳实践、直觉;在此基础上,挖掘形成大数据的新产业价值。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图3 工业大数据与知识的关系

如果数据是石油,设备是藏宝地图,那么知识是唯一的钻探工具。

中国工业技术体系没有形成线性化,尚无法形成驱动力。那些数据深藏在设备里,深锁在系统中,它们只在规定的范围局部流动,一如地表下的熔岩。它们有着澎湃的能量,却无法驾驭。

就此而言。中国就没有工业大数据。甚至连显性化的工业数据都没有。我们工业化短短的行程,使得我们习惯于硬件思维和设备思维,还没来得及形成珍惜工业数据的意识。对那些有着厚重的工业技术体系和知识转化的GE、西门子而言,当他们在说工业大数据的时候,他们有着一个我们很多企业没有的隐含条件。

这是我们需要有的清醒意识:不要将无数的现场数据等同于工业大数据。

就中国制造业而言,知识才是最大的拦路虎。工厂中各种数据,如果没有领域知识和业务建模的前提,不过满工厂堆砌起来的一座座数据垃圾山。

对于企业而言,必须静下心来想一想:数据何在?知识何在?这是一种全新的范式,我们并不熟悉它:工业大数据模式,需要先看懂密码锁规格,再去找钥匙。

精益数据观 斩除数据浪费

两化融合走了十年之路,给中国制造业培养了一批工厂级的IT人才。就中国整体而言,许多企业的信息化水平并不低;但知识化和工业数据,则处于非常低的价值链。受各种信息孤岛的影响,数据被捆绑了,犹如被深嵌在花岗石上的钻石,数据处于高度不流动性。不流动的数据,不太可能发挥工业大数据的价值。

过去几十年,中国制造市场不知疲倦地耗资引进各种设备自动化——一种自由购买的商品,一种吞噬数据的黑洞机器;中国工厂也略知皮毛地、半推半就地引进了精益思想,它的烙印还没来得及成为我们血液中的自由元素。

而此刻,全新的数字化技术却已经来到身边,成为我们必须面对、必须应答的时代拷问。

新的浪费,正在形成。

中国的工厂必须用知识来解放数据。中国制造者们,此刻必须开始意识到,我们最熟视无睹的“数据浪费”, 已经成为一种新的触目惊心的挥霍。这是一种可怕的工业无知。它如一只令人生厌的乌鸦,站在设备的控制板上,嘲笑着我们在设备上所做的大把大把的投资。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图4 工业大数据的价值观

就设备的效率而言,我们需要设备自动化;

就资源的浪费而言,我们需要精益生产观;

就数据的效率而言,我们需要知识自动化;

就数据的浪费而言,我们需要精益数据观。

从工业大数据的角度,中国制造业尚处于数据的黑金时代。

在当下,工业大数据还是中国制造业的伪命题。

正是此刻,数据与知识的关系,更加耐人寻味。在这样一个i额时代,所有企业都将逐渐意识到数据的重要性。但如何能够完成数据的解放,将数据释放出来,仍然需要穿过“无视知识”的认知障碍,仍然需要借助大量的专业化知识。这是中国两化深度融合过程中,工业化必须单独回答的命题。

如果我们忽略管理者深浅不一的见识和技术上互相标榜的流派,那么工业4.0时代的所有命题,其实只有两个:数据和用户。所有的障眼法都由此而来。

而工业知识的显性化、模型化和固化,则是破解数据障眼法的唯一之道。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0
|
2月前
|
分布式计算 关系型数据库 MySQL
MaxCompute问题之数据归属分区如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
35 0
|
9天前
|
数据采集 搜索推荐 大数据
大数据中的人为数据
【4月更文挑战第11天】人为数据,源于人类活动,如在线行为和社交互动,是大数据的关键部分,用于理解人类行为、预测趋势和策略制定。数据具多样性、实时性和动态性,广泛应用于市场营销和社交媒体分析。然而,数据真实性、用户隐私和处理复杂性构成挑战。解决策略包括数据质量控制、采用先进技术、强化数据安全和培养专业人才,以充分发挥其潜力。
13 3
|
12天前
|
运维 供应链 大数据
数据之势丨从“看数”到“用数”,百年制造企业用大数据实现“降本增效”
目前,松下中国旗下的64家法人公司已经有21家加入了新的IT架构中,为松下集团在中国及东北亚地区节约了超过30%的总成本,减少了近50%的交付时间,同时,大幅降低了系统的故障率。
|
1月前
|
分布式计算 DataWorks 关系型数据库
DataWorks报错问题之dataworks同步rds数据到maxcompute时报错如何解决
DataWorks是阿里云提供的一站式大数据开发与管理平台,支持数据集成、数据开发、数据治理等功能;在本汇总中,我们梳理了DataWorks产品在使用过程中经常遇到的问题及解答,以助用户在数据处理和分析工作中提高效率,降低难度。
|
1月前
|
存储 监控 大数据
数据仓库(11)什么是大数据治理,数据治理的范围是哪些
什么是数据治理,数据治理包含哪些方面?大数据时代的到来,给了我们很多的机遇,也有很多的挑战。最基础的调整也是大数据的计算和管理,数据治理是一个特别重要的大数据基础,他保证着数据能否被最好的应用,保证着数据的安全,治理等。那么数据治理到底能治什么,怎么治?
65 0
|
2月前
|
JSON 分布式计算 MaxCompute
MaxCompute问题之创建数据集失败如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
33 0
|
2月前
|
存储 分布式计算 DataWorks
MaxCompute数据问题之数据不一致如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
36 0
|
2月前
|
存储 分布式计算 DataWorks
MaxCompute数据之数据不一致如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
26 0