账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
图书查询索引 版别索引 分类索引 中图法分类 专业分类 用途分类 制品类型 读者对象 自分类 最新 畅销 推荐 特价 教材征订
综合查询
大数据技术科普3——大数据分析与挖掘 - 大数据技术系列丛书 - 中国高校教材图书网
书名: 大数据技术科普3——大数据分析与挖掘 大数据技术系列丛书
ISBN:978-7-5606-6783-6 责任编辑:
作者: 程恺  相关图书 装订:平装
印次:1-1 开本:16开
定价: ¥27.00  折扣价:¥25.65
折扣:0.95 节省了1.35元
字数:
出版社: 西安电子科技大学出版社 页数:
出版日期: 2023-04-01 每包册数:
国家规划教材: 省部级规划教材:
入选重点出版项目: 获奖信息:
小团购 订购 咨询 推荐 打印 放入存书架

内容简介:
本书是大数据分析技术的入门图书,内容分为大数据分析与挖掘概述、Spark SQL结构化数据分析与处理、Spark Streaming流数据分析与处理、Spark GraphX图数据分析与处理、Spark MLlib机器学习和大数据分析系统等6章。通过每章的章节导读,读者能够快速了解本章相关内容的背景意义;通过相关理论及概念的介绍,读者能够对大数据分析的基本方法有整体认识和了解;通过典型案例的讲解,读者能够对大数据分析技术的应用有深刻认识。本书既注重基础知识也关注前沿问题,通过知识链接、小贴士等板块补充相关前沿知识内容。

本书可作为数据科学与大数据专业人员的入门读物,也可作为相关职业教育课程的参考书,还可作为大数据技术应用的爱好者以及各领域大数据建设、管理和运用者的参考书。

作者简介:
 
章节目录:
第1章 大数据分析与挖掘概述

1.1 大数据分析的计算模式

1. 批处理计算

2. 查询分析计算

3. 流计算

4. 图计算

5. 机器学习

1.2 认识大数据分析计算框架Spark

1. Spark简介

2. Spark的特点

3. Spark与Hadoop MapReduce的对比



第2章 Spark SQL结构化数据分析与处理

2.1 Spark SQL简介

1. Hive

2. Shark

2.2 DataFrame概述

1. DataFrame简介

2. DataFrame与RDD的区别

2.3 DataFrame 的转换

1. 宽依赖与窄依赖

2. DataFrame和Dataset以及RDD之间的相互转换


第3章 Spark Streaming 流数据分析与处理

3.1 流计算概述

1. 静态数据与流数据

2. 流计算的基本理念

3. 流计算框架

3.2 Spark Streaming

1. 工作原理

2. 数据抽象DStream

3. 性能调优

4. 容错处理

5. Spark Streaming与Storm的关系

3.3 Spark Structured Streaming

1.Spark Structured Streaming简介

2.Spark Structured Streaming的特点

3.Spark Structured Streaming的数据模型


第4章 Spark GraphX 图数据分析与处理

4.1 图计算概述

1. 图计算

2. 图的表示

3. 图的结构

4. 图处理技术

5. 图处理工具

6. 图计算应用

4.2 Spark GraphX

1. Spark GraphX概述

2. Spark GraphX模块

3. Spark GraphX的发展历程

4. Spark GraphX的整体架构


第5章 Spark MLlib 机器学习

5.1 基于大数据的机器学习

1. 机器学习

2. 模型与算法的关系

3. 基于大数据的机器学习

4. 基于大数据的机器学习与传统机器学习的区别

5. Spark对于机器学习的优势

5.2 Spark MLlib

1. Spark MLlib的特点

2. Spark MLlib的适用范围

3. Spark MLlib库

4. Spark ML库

5.3 Spark中几种典型的机器学习算法

1. 分类与预测

2. 逻辑回归

3. 协同过滤

4. 聚类分析



第6章 大数据分析系统

6.1 大数据分析系统的背景与构架

1. 大数据分析系统的背景

2. 应用架构

6.2 业务实现与统计分析

1. 流量、性能的实时分析

2. 流量、性能的统计分析

3. 业务关联分析

4. 离线报表分析

6.3 系统资源分析平台

1. 应用架构

2. 代码实现

3. 结果验证

6.4 在Spark上训练LR模型

1. 数据格式

2. MLlib中LR模型源码介绍

参考文献

精彩片段:
 
书  评:
 
其  它:
 



| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云章科技