大数据spark 是什么
首页
博客
论坛
聚能聊
问答
直播
活动
主题
登录账号
注册账号
阿里云
>
云栖社区
>
主题地图
>
D
>
大数据spark 是什么
全部
博客
问答
免费套餐
上云实践机会
校园扶持
助力学生成长
API服务
覆盖海量行业
大数据spark 是什么 相关的博客
Spark是什么?用Spark进行数据分析
1. 什么是Apache Spark? Apache Spark是一个为速度和通用目标设计的集群计算平台。 从速度的角度看,Spark从流行的MapReduce模型继承而来,可以更有效地支持多种类型的计算,如交互式查询和流处理。速度在大数据集的处理中非常重要
知与谁同
7年前
1456
《Spark大数据处理:技术、应用与性能优化》——第1章 Spark 简 介1.1 Spark是什么
本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第1章,第1.1节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第1章 Spark 简 介 本章主要介绍Spark大数据计算框架、架构、计算模型和数据管理策
华章计算机
7年前
1705
Spark 概念学习系列之Apache Spark是什么?(一)
简单地说, Spark是发源于美国加州大学伯克利分校AMPLab的大数据分析平台,它立足于内存计算,从多迭代批量处理出发,兼顾数据仓库、 流处理和图计算等多种计算范式,是大数据系 统领域的全栈计算平台。 Spark是基于内存计算的大数据并行计算框架。 Spar
技术小哥哥
7年前
953
大数据:Spark和Hadoop是友非敌
Spark 在 6 月份取得了激动人心的成绩。在圣何塞举办的 Hadoop 峰会上,Spark 成了人们经常提及的话题和许多演讲的主题。IBM 还在 6 月 15 号宣布,将对 Spark 相关的技术进行巨额投资。 这一声明帮助推动了旧金山Spark 峰会的召
青衫无名
7年前
877
大数据分析平台解析:什么是Apache Spark?
Apache Spark是一款快速、灵活且对开发者友好的工具,也是大型SQL、批处理、流处理和机器学习的领先平台。 2009年,Apache Spark从美国U.C. Berkeley的 AMPLab为起步,现在已经成为世界上主要的大数据分布式处理框架之一。S
行者武松
7年前
1899
大数据那些事:从Spark到Spark
Spark,当前大数据领域最活跃的开源项目。好几个人想让我写写Spark了,说实话我觉得对Spark来说有点难写。Spark的论文我倒多半读过,但是Spark的系统就没怎么用过了。所以以一个没有实际使用经验的人去写这样一个当红的系统, 我也不知道楼会歪到哪里
泡泡浅眠
7年前
1508
《Spark与Hadoop大数据分析》——1.1 大数据分析以及 Hadoop 和 Spark 在其中承担的角色
1.1 大数据分析以及 Hadoop 和 Spark 在其中承担的角色 传统的数据分析使用关系型数据库管理系统(Relational Database Management System,RDBMS)的数据库来创建数据仓库和数据集市,以便使用商业智能工具进行
华章计算机
7年前
1450
《Spark与Hadoop大数据分析》一一第1章 从宏观视角看大数据分析
本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第1章,第1.1节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第1章 从宏观视角看大数据分析 本书的目标是让你熟悉 Apach
华章计算机
7年前
1263
大数据spark 是什么 相关的问答
大数据-基于Spark的机器学习-智能客户系统是怎么操作的?
大数据-基于Spark的机器学习-智能客户系统主要适用于做什么,对于企业有什么作用?
zht2000
7年前
2226
当Spark在S3上读取大数据集时,在“停机时间”期间发生了什么?
我在AWS S3中有一堆JSON数据 - 让我们说100k文件,每个大约5MB - 我正在使用Spark 2.2 DataFrameReader来读取和处理它们: sparkSession.read.json(...) 我发现Spark在开始计算之
社区小助手
5年前
303
关于spark分区什么时候进行的问题?
spark分区是在maptask 到reduceTask的时候进行分区,还是说在sc.textFile就开始分区了呢 我测试了一下,sc.textFile默认分区后我把每个分区的内容打印出来发现不是hash算法分区,但是当我经过了shuffle算子之后再
游客saqcxjoyi2n6i
5年前
133
spark foreach调用restful接口同步数据效率太差
通过编写 spark程序,读取数据库形成RDD,然后对RDD进行foreach操作,在内部实现方法中对遍历的元素通过调用restful接口同步第三方的数据到本地数据库,将程序 提交到 spark集群后,1000条 数据需要耗时 500秒才可以同步完,效率太差
louis.li
6年前
939
2018spark技术问答集锦,希望能给喜欢spark的同学一些帮助
小编发现问答专区中有很多人在问关于spark的问题,小编把这些问题汇总一下,希望能给喜欢spark的大家一些启示和帮助 本帖不定期更新,喜欢的可以收藏哦 **如何在Apache Beam中实现类似Spark的zipWithIndex?** htt
技术小能手
5年前
466
在Apache spark中跨执行程序共享数据
我的SPARK项目(用Java编写)需要跨执行程序访问(SELECT查询结果)不同的表。 这个问题的一个解决方案是: 我创建了一个tempView 选择所需的列 使用forEach转换DataFrame为Map。 将该映射作为跨执行器的广播变
社区小助手
6年前
348
Spark 【问答合集】
如何使用spark将kafka主题中的writeStream数据写入hdfs? https://yq.aliyun.com/ask/493211 当Spark在S3上读取大数据集时,在“停机时间”期间发生了什么? https://yq.aliyun.co
社区小助手
5年前
533
使用spark streaming连接loghub报错,是什么问题
"main" java.lang.ClassNotFoundException: Failed to find data source: loghub. Please find packages at http://spark.apache.org/third
游客lplm6xso3kx3e
5年前
104
相关主题
spark是什么意思
什么是大数据
什么是数据分片
数据分片是什么
大数据是什么意思
什么是大数据平台
数据库是什么
数据存储是什么
什么是数据库
什么是数据存储
数据分析是什么
什么是数据分析
什么是数据流程分析
什么是数据大屏
什么是数据迁移
数据网络模式是什么
大数据是指什么
云计算大数据是什么
什么是数据安全性
什么是云数据库
数据存储是什么意思
简述什么是数据库
什么是数据库开发
什么是大数据分析
什么是数据分析能力
数据分析是什么专业
数据分析是什么意思
大数据分析是什么
大数据是干什么的
什么是数据的安全性
nosql数据库是什么
hbase是什么数据库
什么是结构化的数据
什么是bi数据分析
bi数据分析是什么
什么是大数据分析技术
spss数据分析是什么
RDS 数据库是什么
云数据库是什么意思
是什么
cmd测试连接数据库
linux 数据库 超出
api 718
数据库in的使用
网站的关键词设置
api 752
网站权重下降
api 754
普及网络安全师资培训
腾讯offer 短信