Hadoop技术基础与项目实践 - 中国高校教材图书网
|
书名: |
Hadoop技术基础与项目实践
|
| ISBN: | 978-7-5606-7774-3 |
责任编辑: | |
| 作者: |
余姜德 梁本来 冷令
相关图书
|
装订: | 平装 |
| 印次: | 1-1 |
开本: | 16开 |
| 定价: |
¥34.00
折扣价:¥32.30
折扣:0.95
节省了1.7元
|
字数: |
|
| 出版社: |
西安电子科技大学出版社 |
页数: |
|
| 出版日期: |
2025-09-01 |
每包册数: |
|
| 国家规划教材: |
|
省部级规划教材: |
|
| 入选重点出版项目: |
|
获奖信息: |
|
|
|
| 内容简介: |
本书系统讲解了Hadoop生态的核心技术,内容涵盖Hadoop集群搭建、HDFS文件操作、MapReduce编程开发、Hive技术应用、ZooKeeper技术应用、HBase数据库开发、Scala编程开发、Spark技术应用、Flume技术应用以及Sqoop技术应用等。本书内容按项目组织,每个项目又都细分为多个任务,详细阐述技术原理、安装配置、操作应用和编程实战等内容。此外,书中还巧妙融入思政教育元素,如阿里云EMR的自主创新之路、华为鲲鹏创新突破大数据加速引擎等,培养学生的创新精神和社会责任感。 作为一本面向高职专科、职业本科的实践型教材,本书旨在帮助学生系统构建Hadoop技术知识体系,扎实掌握大数据处理的核心原理与实践技能。 本书的读者对象为大数据技术、人工智能等专业的学生,以及有志于从事数据分析领域工作的技术人员。
|
| 作者简介: |
|
|
| 章节目录: |
项目1 Hadoop集群搭建 1
任务1.1 探索Hadoop技术原理 1
1.1.1 Hadoop概念理解 1
1.1.2 Hadoop框架结构分层 2
1.1.3 Hadoop版本选择 3
1.1.4 Hadoop应用场景 5
任务1.2 Hadoop集群环境搭建 6
1.2.1 准备安装环境 6
1.2.2 Hadoop 3.3.0伪分布式集群搭建 14
1.2.3 Hadoop 3.3.0完全分布式集群搭建25
任务1.3 思政教育——阿里云EMR的自主创新之路 31
课后习题 32
项目2 HDFS文件操作 33
任务2.1 探索HDFS技术原理 33
2.1.1 HDFS架构分析 34
2.1.2 HDFS Shell操作应用35
2.1.3 HDFS Web 管理实践 37
2.1.4 文件系统应用 40
任务2.2 HDFS Java API编程实践41
2.2.1 新建Java项目 41
2.2.2 读取数据 46
2.2.3 创建文件夹 47
2.2.4 创建文件 49
2.2.5 删除非空目录51
任务2.3 思政教育——HDFS在“数字中国”战略中的政务大数据实践52
课后习题 52
项目3 MapReduce编程开发54
任务3.1 探索MapReduce技术原理 54
3.1.1 理解MapReduce设计思想 55
3.1.2 MapReduce工作原理分析 56
3.1.3 MapReduce容错机制设计 58
任务3.2 MapReduce编程实践 59
3.2.1 新建Maven项目 59
3.2.2 Hadoop 3.0-MapReduce项目实践 67
3.2.3 MapReduce Example JAR调用73
3.2.4 Hadoop 2.0-MapReduce项目实践 74
任务3.3 思政教育——华为鲲鹏创新突破大数据加速引擎 81
课后习题 82
项目4 Hive技术应用 83
任务4.1 探索Hive技术原理83
4.1.1 理解Hive基本概念84
4.1.2 Hive版本选择 84
4.1.3 Hive体系架构分析 85
任务4.2 Hive安装配置 86
4.2.1 Hive安装模式分析 86
4.2.2 内嵌模式安装86
4.2.3 本地模式(伪分布式Hadoop 3.3.0集群)安装 87
4.2.4 远程模式(完全分布式Hadoop 3.3.0集群)安装92
任务4.3 Hive应用操作 96
4.3.1 Hive CLI操作应用 97
4.3.2 Hive表查询应用 98
任务4.4 思政教育——守护“生命数据”的Hive守护者 99
课后习题100
项目5 ZooKeeper技术应用101
任务5.1 探索ZooKeeper技术原理 101
5.1.1 理解ZooKeeper基本概念 102
5.1.2 ZooKeeper体系架构分析 102
5.1.3 ZooKeeper节点类型 103
5.1.4 ZooKeeper Watcher机制分析 103
任务5.2 ZooKeeper安装配置 105
5.2.1 伪分布式ZooKeeper集群安装配置 105
5.2.2 完全分布式ZooKeeper集群安装配置 108
任务5.3 ZooKeeper命令行操作110
任务5.4 思政教育——勇于创新,协作共赢 113
课后习题 113
项目6 HBase数据库开发 115
任务6.1 探索HBase技术原理 115
6.1.1 理解HBase基本概念 115
6.1.2 HBase数据库结构分析 116
6.1.3 HBase与传统关系型数据差异分析 119
任务6.2 HBase 安装配置 120
6.2.1 HBase伪分布集群模式下安装 120
6.2.2 HBase完全分布集群模式下安装 125
6.2.3 HBase正确启动方法 126
6.2.4 HBase启动故障排除 127
任务6.3 HBase Shell操作应用 127
任务6.4 思政教育——以技术革新书写时代篇章 131
课后习题 131
项目7 Scala编程开发 133
任务7.1 探索Scala技术原理 133
7.1.1 理解Scala基本概念 134
7.1.2 Scala版本选择 134
任务7.2 Scala 程序编译 135
7.2.1 Scala CLI操作应用 135
7.2.2 Scala IDE for Eclipse项目开发 136
任务7.3 Scala 编程应用 140
7.3.1 Scala基本语法 140
7.3.2 Scala project 147
任务7.4 思政教育—从“东方明珠”到Apache社区的星辰大海 150
课后习题150
项目8 Spark技术应用 152
任务8.1 探索Spark技术原理 152
8.1.1 理解Spark基本概念 153
8.1.2 Spark体系架构分析 154
任务8.2 Spark安装配置 155
8.2.1 Spark安装模式 155
8.2.2 Spark Standalone 模式安装 156
8.2.3 Spark on YARN 模式安装 158
任务8.3 Spark应用操作 162
8.3.1 Spark-submit 162
8.3.2 Spark Shell命令操作 163
8.3.3 Spark RDD命令操作 164
任务8.4 思政教育——国产Spark引擎的“超算突围” 166
课后习题 166
项目9 Flume技术应用 168
任务9.1 探索Flume 技术原理 168
9.1.1 理解Flume基本概念 169
9.1.2 Flume体系架构分析 169
9.1.3 Flume版本选择 170
任务9.2 Flume安装与应用 171
9.2.1 Flume部署 171
9.2.2 Flume应用 172
任务9.3 思政教育——数据采集伦理与技术担当的融合实践 176
课后习题 177
项目10 Sqoop技术应用 179
任务10.1 探索Sqoop技术原理 179
10.1.1 理解Sqoop基本概念 180
10.1.2 Sqoop体系架构分析 180
10.1.3 Sqoop版本选择 181
任务10.2 Sqoop安装与配置 182
10.2.1 Sqoop安装 182
10.2.2 Sqoop连接MySQL 184
任务10.3 Sqoop应用 187
10.3.1 Sqoop导入/导出 187
10.3.2 MySQL导入数据至HDFS 188
10.3.3 HDFS导出数据至MySQL 189
10.3.4 MySQL导入数据至Hive 190
10.3.5 Hive导出数据至MySQL 192
任务10.4 思政教育——技术向善与开源协作的中国实践 193
课后习题 194
参考文献 196
|
| 精彩片段: |
|
|
| 书 评: |
|
|
| 其 它: |
|
|
|