干货 | 下一代数据网:数据驱动的云网链一体化

简介:

本讲座选自清华-青岛数据科学研究院大数据基础设施研究中心特聘研究员刘运渠9月5日在Odaily星球日报 X 36Kr P.O.D大会上所做的题为《下一代数据网:数据驱动的云网链一体化》的演讲。

以下是演讲图文实录

80dae957258d7ae0390329c3a49fc5b87d5163a9

刘运渠:数据驱动的云网链一体化,它潜在的商业场景,是把它作为一个基础设来提供。清华-青岛数据科学研究院是一个多学科的交叉融合,与数据确权和安全多方计算的核心技术,来建立的数据分享平台。它的目标是实现一个大数据自来水管道,做到一些资产服务和创新技术,最重要的目标是实现数据驱动

09a31fea41806eccf65d64194dd0b7cf2c22b7a6

现有的三大核心技术云、网、链各自有一些缺点。数据协议方面,有数据孤岛的问题,成本和灵活性的问题及数据确权和效率的问题,这是清华大学下一代数据网络试图解决的问题,最主要的方法是通过区块链技术的研究和产业化方面来做一些动作。

16b7b3320e1e0ed5ff57fd601e19be48347461b1

刚刚讲了一些机构性的介绍,下面会深入到技术和产业细节里面去。

什么是这三大块融为一体化,这是一个很大的野心

我们能不能占一个万米的高空,看这三大技术的关系呢?我们看到机器学习的AI,它得益于大数据,同时它又为大数据提供了一个得力的工具。云计算,跟边缘计算、雾计算一起,在不同的场景,有不同的需求。对于云计算来讲,大的数据在需要计算力方面有一个弹性。当我需要算力的时候,我希望无穷大;当我不需要算力的时候,手机的CPU是闲着的,所以这是计算力共享的问题。

基础设施试图转向以数据为中心的场景,大家已经比较熟悉一些CDN、NDN、ICN、DCN,本质是把网络从比特流转向数据。我们认为未来的价值焦点,也就是从大数据视角来看,它不仅仅是数据隐私的问题,首先是数据的所有权。数据的隐私,首先数据是我的,你凭什么拿去用,拿去用有没有好处,这个好处是不是我应该得到。这才是我们认为下一阶段大数据的核心问题

83e88a046f8b318910ab1180aeaf691cf42a96b9

从刚刚讲的大数据和网络视角下,我们再看区块链是什么情况。

 ●  首先,我们认为 区块链技术可能具有实现数据确权的潜力 。这里引用一下谷歌董事长斯密特的说法,他认为区块链技术最大的价值,就是实现的 数据的稀缺性 ,也就是不可以篡改和随便拷贝。为什么稀缺性很重要?因为他是董事长,他关心经济问题,没有稀缺性就没有经济价值。
 ●  第二,我们认为 区块链技术跟大数据的结合,可能会出现万亿级的商业。
 ●  第三, 区块链技术尚未具有支撑大数据的能力,这是我们下一代数据网要解决的核心难题。

 ●  第四,区块链对于网络本身也提出了巨大挑战。区块链在技术上有三大块,一个是分布式共识,一个是加密,一个是基于P2P的广播。P2P的广播是广播的一种,是基于点对点实现的。广播对于网络来讲是很可怕的东西,因为N到N远远大于1到1的量。如果有一个网络可以支撑完美的通信的话,它需要什么呢?它需要网络的有效载荷即有效排列组合可以达到N的N次方,而普通网络只有达到N的阶层数字,这两个数字差距非常的大。我们认为网络是区块链规模应用的瓶颈之一,一方面它的商业价值备受关注,另一方面它的规模和实验,成为关注的焦点。

fb777fce6c5427cd4098cd353ac73e8cd10e48a2

今天有很多嘉宾在规模方面讲得比较多,我集中精力讲一下时延的问题。

第一,关系型数据库系统是非常强悍的,它可以轻松达到千万次的TPS。现有的系统,不要上千万次,几千次都不是那么容易的事。成熟的系统需求也没有那么高,日常也就是2000次。没有必要在这块做无谓的追求,这方面我们赶不过关系型数据库。

第二,交易的时延和带宽是不一样的东西。比如我烤匹萨10个小时,同时烤了10块匹萨,我回头跟人说,10个小时烤了10个披萨,平均时间1小时。这里面是有误导的。时延就是说,到底烤一块匹萨多久,这对于实际应用很有价值。我们来看看它受到什么限制呢?一些是我们看得见的,就是代码里面可以看到,就是显示限制,比如交易尺寸、快、平均大小。当像中本聪这样世界级的设计者,他们设计的时候,是考虑后面的限制。算法现在的研究可以达到100毫秒以下,我们网络也做到100毫秒以下,1+1等于200毫秒,再给以3倍的安全系数,目标可以到600毫秒。由于广播的模型,会导致它的规模也不会很大,所以要解决这个问题,可能要通过一些分集,用联盟链的方法来处理。

16d8fffc056866caa83d8a37fbc5a36129c1d488

下一代的数据网络,它可以支持高速、海量区块链吞吐。首先在广域里面部署一个服务,同时能够支持毫秒级、亚秒级的交易,能够实现规模化的区块链应用。为什么呢?因为我们在广播里面增加广播代理,不要每个人都去广播,这就是联盟链的观点。

f6b47d052394b2fd4a82831b50f0b15a38b19363

这一块清华大学希望我们能够提供一些区块链设施、平台以及应用作为服务。而且区块链在阿尔山的基础区块链项目里面已经做了这样的场景。这是清华区块链现有的下一代数据网的设计方案及想要实现的目标。

2eb8a2f4367355274a60bae9427aea24a5259d65


原文发布时间为:2018-09-12
本文作者:刘运渠
本文来自云栖社区合作伙伴“ 数据派THU”,了解相关信息可以关注“ 数据派THU”。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
Web App开发 人工智能 Linux
开源数字孪生基础设施
开源数字孪生基础设施
95 0
|
11月前
|
存储 供应链 安全
【企业技术架构】企业自动化是下一代架构吗?
【企业技术架构】企业自动化是下一代架构吗?
|
11月前
|
存储 开发框架 运维
数智洞察|云端融合时代的计算体系创新
数智洞察|云端融合时代的计算体系创新
144 0
|
11月前
|
数据采集 传感器 供应链
从云原生到混合云集成,用友iuap构筑新一代产业互联技术底座
我们知道,技术的迭代赋予企业数字化转型与变革的新能力——在社会化商业时代,企业可以看作是社会化商业生态系统中一个功能单元,还可以看作是构成产业互联的一个连接器;而云原生技术,则可以最大化利用云的能力,构建和运行可弹性扩展的社会化应用,并通过混合云技术来实现云上云下的数据与系统融合,支撑多云环境下的社会化场景落地。
175 0
|
存储 安全 小程序
DaaS架构及落地 (一)
DaaS 数据即服务是一种服务模式,即将数据以服务的形式,向客户提供价值,参与到客户的业务中,它也是软件即服务的一种细分领域。同时DaaS 拥有云计算的通用特点,包括以租代买,按需付费、按用付费。 本文介绍 DaaS 的架构及实现选择,对于拥有大量优质数据资源的企业,可以参考构建起数据业务线,进而实现数据的资产化、价值化。需要说明的是本文中的各种图例仅是逻辑示意,均做了简化。
811 1
DaaS架构及落地 (一)
|
存储 数据采集 运维
分析服务一体化理念解读
分析服务一体化理念解读
9283 0
分析服务一体化理念解读
|
新零售 运维 Kubernetes
加速SaaS规模化演进,餐道基于K8s的云上创新底座
餐饮正在成为数智化转型在实体经济运用中的最大试验场,推动着 SaaS 演进为餐饮行业新的基础设施。作为国内最早一批涉足餐饮 SaaS 的企业,餐道正在以云原生的方式帮助餐饮企业进一步解决成本控制、效率提升等需求。通过将业务平台迁移至阿里云容器服务 ACK,使服务器资源利用率提升超过 30%,扩容效率提升近 80%,版本发布周期缩短近 40%,并以 0 集群故障为业务连续性提供充分保障。
390 0
加速SaaS规模化演进,餐道基于K8s的云上创新底座
|
SQL 存储 消息中间件
DorisDB 叶谦:打造新一代企业数据驱动体系
DorisDB 叶谦:打造新一代企业数据驱动体系
DorisDB 叶谦:打造新一代企业数据驱动体系
|
存储 弹性计算 缓存
上云技术解决方案
上云技术解决方案
3508 0
上云技术解决方案
|
机器学习/深度学习 人工智能 安全
iNeuOS专注自主可控工业互联网平台,为中小企业提供全新解决方案
工业互联网 物联网 Web组态 商业BI 实景视频 人工智能 iNeuOS
iNeuOS专注自主可控工业互联网平台,为中小企业提供全新解决方案