大数据分析技术 - 高等学校新工科计算机类专业系列教材 - 中国高校教材图书网
|
书名: |
大数据分析技术
高等学校新工科计算机类专业系列教材
|
ISBN: | 9787560674223 |
条码: | |
作者: |
蒋剑军
相关图书
|
装订: | |
印次: | 1-1 |
开本: | 16开 |
定价: |
¥57.00
折扣价:¥54.15
折扣:0.95
节省了2.85元
|
字数: |
320千字
|
出版社: |
西安电子科技大学出版社 |
页数: |
475页
|
发行编号: | 5606 |
每包册数: |
8
|
出版日期: |
2025-1-3 |
|
内容简介: |
本书主要介绍机器学习与大数据分析技术,共分为十章,系统地介绍了数据预处理、插值与拟合、回归分析、Logistic回归、树结构模型、支持向量机、特征降维、聚类分析、复杂网络分析、深度学习。书中力求阐明各种机器学习模型“是什么”,并用丰富的案例介绍各种机器学习模型“怎么用”。 本书可以作为应用型本科院校数据科学与大数据技术、应用统计学等相关专业的本科生教材,也可以作为相关专业的研究生教辅,以及高校教师、科研人员和相关培训机构的参考资料,还可以作为人工智能、智能制造等工程应用方面的技术资料。
|
作者简介: |
|
章节目录: |
绪论 1
0.1 大数据简史 1
0.1.1 美国的大数据发展简史 1
0.1.2 中国的大数据发展简史 2
0.2 大数据的概念 3
0.2.1 数据 3
0.2.2 大数据 4
0.3 机器学习 5
0.3.1 变量 6
0.3.2 机器学习的分类 6
0.3.3 机器学习在数据分析中的应用流程 8
习题0 9
第1章 数据预处理 11
1.1 数据预处理的必要性及流程 11
1.1.1 数据预处理的必要性 11
1.1.2 数据预处理的流程 12
1.2 数据集成 12
1.2.1 数据集成的概念 13
1.2.2 合并数据 13
1.3 数据清洗 19
1.3.1 可简单处理的清洗项 19
1.3.2 重复值的检测与处理 20
1.3.3 缺失值的检测与处理 22
1.3.4 异常值的检测与处理 26
1.3.5 含噪声数据的处理方法 28
1.4 数据变换 33
1.4.1 定性变量的赋值方法 33
1.4.2 连续型数据的离散化 36
1.4.3 数据变换 38
习题1 50
第2章 插值与拟合 52
2.1 插值 52
2.1.1 数据填充问题 52
2.1.2 插值的概念 53
2.1.3 插值方法 54
2.1.4 插值法的实现 56
2.2 曲线拟合 64
2.2.1 曲线拟合的概念 64
2.2.2 曲线拟合的实现 66
习题2 78
第3章 回归分析 79
3.1 线性回归分析 79
3.1.1 一元线性回归 79
3.1.2 多元线性回归 85
3.2 非线性回归分析 95
3.2.1 一元非线性回归 96
3.2.2 多元非线性回归 106
习题3 116
第4章 Logistic回归 118
4.1 Logistic回归的类型 118
4.2 Logistic回归的概念 119
4.2.1 Logistic回归的思想 119
4.2.2 Logistic回归模型 120
4.3 Logistic回归的实现 121
习题4 126
第5章 树结构模型 128
5.1 决策树 129
5.1.1 决策树的概念 129
5.1.2 决策树的数学原理 138
5.1.3 决策树的实现 142
5.2 随机森林 146
5.2.1 随机森林的概念 146
5.2.2 随机森林的生成 148
5.2.3 特征重要度 152
5.2.4 随机森林的Python实现 154
5.3 轻梯度提升机器 159
5.3.1 LightGBM的概念 159
5.3.2 LightGBM计算特征重要性的方法 166
5.3.3 LightGBM的安装及使用方法简介 166
习题5 174
第6章 支持向量机 175
6.1 数学原理 175
6.1.1 支持向量 175
6.1.2 对偶问题 178
6.1.3 SVM优化 180
6.1.4 软间隔 182
6.1.5 核函数 184
6.2 Python实现 186
习题6 192
第7章 特征降维 193
7.1 主成分分析 193
7.1.1 主成分分析的概念 193
7.1.2 主成分分析的Python实现 199
7.2 独立成分分析 204
7.2.1 独立成分分析的概念 205
7.2.2 独立成分分析的Python实现 206
7.3 t分布随机邻近嵌入 210
7.3.1 t-SNE基本理论 210
7.3.2 t-SNE的Python实现 211
习题7 212
第8章 聚类分析 214
8.1 聚类分析的一般理论 214
8.1.1 聚类分析的概念 214
8.1.2 聚类分析的步骤 215
8.1.3 聚类评估 217
8.2 模糊c均值聚类 218
8.2.1 模糊c均值聚类算法简介 218
8.2.2 模糊c均值聚类算法的Python实现 219
8.3 k-Means和k-Means++ 220
8.3.1 k-Means算法描述 221
8.3.2 k-Means++算法描述 221
8.3.3 k-Means聚类算法的实现 221
8.4 密度聚类算法 223
8.4.1 基于密度的带噪声的应用空间聚类 223
8.4.2 基于层次密度的带噪声的应用空间聚类 228
习题8 232
第9章 复杂网络分析 234
9.1 复杂网络的概念 234
9.1.1 复杂网络的定义 234
9.1.2 复杂网络的特性 237
9.1.3 复杂网络的应用 238
9.2 复杂网络的分析方法 239
9.2.1 中心性分析 239
9.2.2 社区检测 241
9.3 复杂网络分析的Python实现 242
9.3.1 网络可视化 242
9.3.2 查看网络基本信息 247
9.3.3 中心性分析 248
9.3.4 社区检测 248
习题9 251
第10章 深度学习 253
10.1 神经网络 253
10.1.1 神经网络原理 253
10.1.2 神经网络的极简入门 263
10.1.3 神经网络的Python实现 267
10.2 深度学习 271
10.2.1 PyTorch介绍 271
10.2.2 循环神经网络 276
10.2.3 卷积神经网络 296
习题10 310
参考文献 311
后记 312
|
精彩片段: |
|
书 评: |
|
其 它: |
|
|
|