
西安电子科技大学出版社《大数据技术导论》(订购)
内容简介
本书旨在指导高职院校学生对大数据技术进行入门学习,以任务驱动为导向,系统介绍了大数据技术基础知识及应用案例。全书共分为六大项目,具体包括大数据与大数据时代、大数据处理平台、Hadoop开发环境的搭建、数据采集与预处理、数据计算与数据存储、数据分析与可视化。
本书可作为高职院校大数据应用技术、软件技术等专业学生的专业基础课教材,也可作为其他计算机相关专业学生的选修课程教材以及大数据技术爱好者的自学参考书。

前 言
《大数据技术导论》定位为大数据学习的入门教材,主要面向高职大数据应用技术、软件技术等专业的学生,旨在为读者打开大数据技术学习之门,引导读者研习大数据技术的相关知识,为后续大数据专业核心课程的学习打下坚实的基础。
本书采用案例驱动的方式详细介绍了大数据处理的各个环节,包括数据采集、数据预处理、数据存储、数据计算、数据分析和数据可视化等。全书分为六个项目。项目一主要介绍大数据与大数据时代的相关理论知识和行业应用。项目二主要结合互联网公司大数据平台应用案例介绍当前主流的大数据平台架构和大数据处理流程。项目三主要介绍Hadoop大数据处理平台的搭建,并运行简单的大数据处理任务。项目四以Python爬虫为核心介绍大数据数据采集和数据预处理的相关知识。项目五以Spark技术为核心介绍大数据计算的相关知识,同时以HBase为核心介绍大数据存储的相关知识。项目六以PySpark为核心介绍数据分析的相关知识,以Python为核心介绍数据可视化的相关知识。项目一和项目二以理论讲授和案例分析为主,项目三、四、五、六以实操为主。
本书由张寺宁编著,余明辉主审。书中所有案例都经测试验证并运行成功。
由于时间仓促,加之作者水平有限,书中难免存在不足之处,敬请广大读者批评指正。
配套资源
本书共6个项目、23个任务,有362个重点图片、精美PPT课件、完整的源代码、相关软件程序、习题答案。

图书在版编目(CIP)数据


目 录
项目一 大数据与大数据时代 任务1-1 认识大数据时代 任务1-2 掌握大数据基本特征和处理流程 任务1-3 大数据技术的发展历程 任务1-4 大数据产业结构及行业应用 任务1-5 了解大数据行业的岗位需求
项目二 大数据处理平台 任务2-1 构建大数据处理平台的原因 任务2-2 最早的大数据生态系统—Hadoop 任务2-3 大数据处理平台架构
项目三 Hadoop开发环境的搭建 任务3-1 VMware虚拟机的安装 任务3-2 VMware上Ubuntu系统的安装和配置 任务3-3 Ubuntu系统上Hadoop的安装和配置 任务3-4 Hadoop下的词频统计
项目四 数据采集与预处理 任务4-1 数据采集初识 任务4-2 互联网数据采集 任务4-3 Windows下Python爬虫开发环境的搭建 任务4-4 Python爬虫应用程序的编写
项目五 数据计算与数据存储 任务5-1 大数据计算框架初识 任务5-2 大数据存储初识 任务5-3 Spark和HBase开发环境的搭建 任务5-4 Spark应用程序的编写
项目六 数据分析与可视化 任务6-1 大数据分析初识 任务6-2 大数据可视化初识 任务6-3 房屋数据分析可视化案例编程

来源:西安电子科技大学出版社
|