备案控制台

开发者社区

开发者社区大数据文章正文

《Hadoop海量数据处理：技术详解与项目实战》一第1章绪论

2017-05-02 1949

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来异步社区《Hadoop海量数据处理：技术详解与项目实战》一书中的第1章，第1.1节，作者：范东来责编：杨海玲，更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章绪论

Hadoop海量数据处理：技术详解与项目实战
本章作为绪论，目的是在学习Hadoop之前，让读者理清相关概念以及这些概念之间的联系。

文章标签：

分布式计算

Hadoop

数据处理

关键词：

hadoop技术

hadoop项目实战

hadoop海量数据处理技术项目实战

hadoop海量数据处理

hadoop海量数据处理技术项目实战绪论

异步社区

目录

相关文章

桃李春风一杯酒

|

7天前

|

分布式计算 Hadoop 大数据

大数据技术与Python：结合Spark和Hadoop进行分布式计算

【4月更文挑战第12天】本文介绍了大数据技术及其4V特性，阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce，Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop，可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop，以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。

桃李春风一杯酒

21 1 1

零零年夏

|

5月前

|

存储分布式计算 Hadoop

【大数据】Hadoop技术解析：大数据处理的核心引擎

【大数据】Hadoop技术解析：大数据处理的核心引擎

零零年夏

147 0 0

热烈的马

|

4月前

|

消息中间件分布式计算大数据

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装（图文解释超详细）

【大数据技术Hadoop+Spark】Flume、Kafka的简介及安装（图文解释超详细）

热烈的马

66 0 0

热烈的马

|

4月前

|

SQL 存储大数据

【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示（附SQL语句）

【大数据技术Hadoop+Spark】Hive基础SQL语法DDL、DML、DQL讲解及演示（附SQL语句）

热烈的马

73 0 0

Want595

|

6月前

|

分布式计算大数据 Hadoop

【大数据开发技术】实验03-Hadoop读取文件

【大数据开发技术】实验03-Hadoop读取文件

Want595

101 0 0

热烈的马

|

4月前

|

SQL 分布式计算大数据

【大数据技术Hadoop+Spark】Spark SQL、DataFrame、Dataset的讲解及操作演示（图文解释）

【大数据技术Hadoop+Spark】Spark SQL、DataFrame、Dataset的讲解及操作演示（图文解释）

热烈的马

53 0 0

Want595

|

6月前

|

分布式计算 Hadoop Java

【大数据开发技术】实验01-Hadoop安装部署

【大数据开发技术】实验01-Hadoop安装部署

Want595

133 0 0

热烈的马

|

4月前

|

分布式计算大数据 Scala

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战（超详细附源码）

热烈的马

88 1 1

热烈的马

|

4月前

|

分布式计算资源调度大数据

【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解（图文解释）

热烈的马

148 0 0

热烈的马

|

4月前

|

存储分布式计算大数据

【云计算与大数据技术】大数据系统总体架构概述（Hadoop+MapReduce ）

【云计算与大数据技术】大数据系统总体架构概述（Hadoop+MapReduce ）

热烈的马

97 0 0

热门文章

最新文章

利用Hive与Hadoop构建大数据仓库：从零到一

Hadoop【基础知识 05】【HDFS的JavaAPI】（集成及测试）

Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】（图片来源于网络）（hadoop fs + hadoop dfs + hdfs dfs 使用举例）

大数据处理架构Hadoop

Hadoop集群基本测试

Hadoop【hadoop学习大纲完全总结01+02+03+04+05】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】

Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource

Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】（图片来源于网络）

【Hadoop】HDFS 读写流程

大数据Hadoop生态圈体系视频课程

hadoop 启动和验证

Apache Hadoop YARN基本架构

hadoop配置文件参数

使用Hadoop和Nutch构建音频爬虫：实现数据收集与分析

Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)

百度搜索：蓝易云【Ubuntu搭建全分布式Hadoop】

hadoop升级流程

Hadoop：驭服数据洪流的利器

使用Sqoop将数据从Hadoop导出到关系型数据库

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》

零基础实现hadoop 迁移 MaxCompute 之数据

CIO 指南:如何在SAP软件架构中使用Hadoop

相关实验场景

更多

使用Flink实时发现最热Github项目

零基础入门Serverless：基于函数计算快速搭建基于人工智能的目标检测系统

搭建超级小班课网课系统

搭建Hadoop环境

下一篇

阿里云oss简介和使用流程