大数据技术 spark-spark读取hive数据-搭建Spark-手机站-阿里云

大数据技术 spark

阿里云 > 云栖社区> 主题地图> D> 大数据技术 spark

大数据技术 spark 相关的博客

【Spark Summit East 2017】2017年大数据与Spark的发展趋势

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data；此外，通过Maxcompute及其配套产品，低廉的大数据分析仅需几步，详情访问https://www.aliyun.com/product/odps。本讲义出自M

小猫吃鱼569 8年前 1824

助人就是助己：IBM宣布大规模资助开源大数据项目Spark

本周一，IBM宣布将对开源实时大数据分析项目Apache Spark进行大规模资助，蓝色巨人宣称，其资助的力度之大相当于每年数亿美元的投入。 Hadoop技术出自Google、Yahoo这些互联网公司，主要是为了对规模庞大的各类数据进行处理和分析。不过近年来随

晚来风急 8年前 1326

大数据：Spark和Hadoop是友非敌

Spark 在 6 月份取得了激动人心的成绩。在圣何塞举办的 Hadoop 峰会上，Spark 成了人们经常提及的话题和许多演讲的主题。IBM 还在 6 月 15 号宣布，将对 Spark 相关的技术进行巨额投资。这一声明帮助推动了旧金山Spark 峰会的召

青衫无名 8年前 877

《Spark大数据分析：核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1节，作者穆罕默德·古勒（Mohammed Guller）更多章节内容可以访问云栖社区“华章计算机”公众号查看。大数据技术一览我们正处在大数据时代。数据不仅是任何组织的命

华章计算机 8年前 3937

Spark框架概览【大数据技术】

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架，最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一，与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark

武耀文 7年前 1274

《Spark大数据分析：核心概念、技术及实践》一第1章大数据技术一览

本节书摘来自华章出版社《Spark大数据分析：核心概念、技术及实践》一书中的第1章，第1.1节，作者[美]　穆罕默德·古勒（Mohammed Guller），更多章节内容可以访问云栖社区“华章计算机”公众号查看。第1章大数据技术一览我们正处在大数据时代

华章计算机 8年前 1287

大数据技术的对决——Spark对Impala对Hive对Presto

在大数据浪潮全面来袭的历史背景下，我们一直面临着同一类难题的困扰——该选择哪款工具解决相关问题?这项挑战在大数据SQL引擎领域同样存在。作为大数据报告工具开发商，AtScale公司通过基准测试为我们带来了如下答案： 1. Spark 2.0在大规模查询性能方

知与谁同 8年前 2039

专访携程李亚锋：大数据技术融合下的Spark更具魅力

大数据”作为当下最火热的IT行业词汇，在主流的数据处理工具当中Hadoop和Spark都被大家所熟悉。不过，目前基于内存计算的Spark适合各种迭代算法和交互式数据分析，能够提升大数据处理的实时性和准确性，已经逐渐获得很多企业的支持。这是否意味着我们应该彻底

小旋风柴进 8年前 1170

大数据技术 spark 相关的问答

大数据职业如何规划

Java转过来做大数据，Java做过前后端。大数据目前用过的技术，Hadoop spark_mllib spark_streaming kafka flume hbase hive docker solrCloud OSGI oozie 。除了买书

sunt_dota 8年前 1481

大数据真的很难吗？大数据架构师之路有多远？

成为大数据架构师需要掌握哪些技术？分享一下你的大数据架构师之路。

调皮仔3683 7年前 650

2018spark技术问答集锦，希望能给喜欢spark的同学一些帮助

小编发现问答专区中有很多人在问关于spark的问题，小编把这些问题汇总一下，希望能给喜欢spark的大家一些启示和帮助本帖不定期更新，喜欢的可以收藏哦 **如何在Apache Beam中实现类似Spark的zipWithIndex？** htt

技术小能手 7年前 466

Spark 【问答合集】

如何使用spark将kafka主题中的writeStream数据写入hdfs？ https://yq.aliyun.com/ask/493211 当Spark在S3上读取大数据集时，在“停机时间”期间发生了什么？ https://yq.aliyun.co

社区小助手 6年前 533

让我们一起来聊聊 Netty。

众所周知，构建高性能的现代互联网架构，我们一定离不开分布式系统，这些系统必定是反应式的。反应式的系统是一个比较新的概念，即消息驱动、弹性、极具适应性并且即时响应。构建这样的系统，定然离不开优秀的网络通信框架，其中 Netty 就是一款及其优秀的网络通信框架。

千万别惹猫哈 8年前 1648

【精品问答合集】Hbase热门问答

hbase 大量写入很慢 https://yq.aliyun.com/ask/50074 发现hbase文件大规模的丢失了 https://yq.aliyun.com/ask/46584 hbase启动脚本start-hbase的疑问 htt

hbase小能手 6年前 561

相关主题

spark读取hive数据搭建Spark 学习Spark 数据抽取技术数据保护技术数据清洗技术数据分片技术大数据技术培训大数据技术架构大数据处理技术大数据关键技术大数据核心技术大数据主要技术大数据平台技术架构大数据技术培训大数据的存储技术大数据技术有哪些大数据需要什么技术大数据云计算技术大数据应用技术大数据需要的技术数据安全技术数据库技术数据存储技术数据分析技术数据分析技术数据迁移技术 spark是什么意思 spark云主机大数据处理技术培训大数据存储技术有哪些大数据技术基础知识大数据的技术支持云数据库技术云数据存储技术数据库技术学习数据存储加密技术海量数据存储技术数据库编程技术数据库技术基础 stm32 存储空间 win 10 管理无线网络 spotlight监控linux sql server 2000 创建数据库 ping主机名不通 pg数据库事务表 ios虚拟机的快捷键 ibm x3650 服务器安装系统 jdbctemplate.execute 存储过程网站上线倒计时