数据分析与挖掘实践(Python版) - 大数据技术系列丛书 - 中国高校教材图书网
|
书名: |
数据分析与挖掘实践(Python版)
大数据技术系列丛书
|
| ISBN: | 9787560667973 |
责任编辑: | |
| 作者: |
程恺
相关图书
|
装订: | 0 |
| 印次: | 1-1 |
开本: | 16开 |
| 定价: |
¥59.00
折扣价:¥56.05
折扣:0.95
节省了2.95元
|
字数: |
336千字
|
| 出版社: |
西安电子科技大学出版社 |
页数: |
499页
|
| 出版日期: |
2023-05-08 |
每包册数: |
8
|
| 国家规划教材: |
|
省部级规划教材: |
|
| 入选重点出版项目: |
|
获奖信息: |
|
|
|
| 内容简介: |
本书主要介绍Python数据分析与挖掘实践,全书共11章,分为基础篇和综合篇。第1~5章为基础篇,包括Python数据分析与挖掘概述、Python数据分析与挖掘基础、数据探索、数据预处理、挖掘建模等内容;第6~11章为综合篇,列举分析了6个实用案例,包括基于关联规则进行商品推荐案例、电信用户流失分类预测案例、二手车交易价格回归预测案例、航空公司客户价值聚类分析案例、基于LGB进行新闻文本分类案例、基于PyTorch进行昆虫图像分类案例。通过基础篇和综合篇的学习,可以掌握数据分析与挖掘的实践技能,能够综合利用数据分析与挖掘技术解决实际问题。 本书可作为大数据工程专业数据分析与挖掘课程的实验指导书,也可作为数据分析与挖掘及软件开发人员的参考书。
|
| 作者简介: |
|
|
| 章节目录: |
基 础 篇 第1章 Python数据分析与挖掘概述 2 1.1 Python语言概述 2 1.2 常用的扩展库 3 1.3 Anaconda的安装与使用 5 1.4 PyCharm的安装与使用 19 第2章 Python数据分析与挖掘基础 29 2.1 NumPy的基本操作 29 2.2 Pandas的基本操作 43 2.3 Matplotlib的基本操作 56 2.4 Scikit-Learn的基本操作 74 2.5 利用Pandas进行数据分析 77 第3章 数据探索 86 3.1 异常值分析 86 3.2 缺失值分析 86 3.3 统计量分析 87 3.4 相关性分析 88 3.5 对比分析 90 3.6 准备数据 91 3.7 探索性分析 92 3.8 相关性分析 93 3.9 数据特征分布 95 3.10 数据分布可视化 96 3.11 分类模型 106 第4章 数据预处理 111 4.1 数据清洗 111 4.2 数据集成 113 4.3 数据归约 115 4.4 数据转换 117 4.5 数据清理:缺失值的检测与填补 119 4.6 数据集成:冗余和相关性分析 124 4.7 数据归约 130 4.8 数据变换 139 第5章 挖掘建模 150 5.1 关联规则挖掘 150 5.2 分类和预测 151 5.3 聚类分析 156 5.4 关联规则挖掘实验 160 5.5 决策树分类实验 171 5.6 模型评估实验 178 5.7 管道和超参数调优实验 187 5.8 支持向量机实验 197 5.9 神经网络实验 203 5.10 基于划分方法聚类实验 206 5.11 基于层次方法聚类实验 210 5.12 基于密度方法聚类实验 213 5.13 聚类评估实验 217 综 合 篇 第6章 基于关联规则进行商品推荐案例 226 6.1 案例概述 226 6.2 电影数据准备 227 6.3 利用关联规则实现电影推荐实战 228 6.4 优化思路 240 第7章 电信用户流失分类预测案例 241 7.1 案例概述 241 7.2 数据介绍 242 7.3 数据预处理 244 7.4 可视化分析 247 7.5 特征工程 259 7.6 模型预测 262 7.7 模型评估 265 7.8 分析与决策 267 7.9 优化思路 269 第8章 二手车交易价格回归预测案例 270 8.1 案例概述 270 8.2 导入函数工具箱 272 8.3 数据读取 272 8.4 特征与标签构建 278 8.5 模型训练与预测 280 第9章 航空公司客户价值聚类分析案例 284 9.1 案例概述 284 9.2 数据预处理 286 9.3 特征工程 291 9.4 模型训练与对数据的预测 293 9.5 尝试使用RFM模型 294 9.6 分析与决策 294 9.7 LCRFM模型作图 296 9.8 RFM模型作图 297 9.9 DBSCAN模型对LCRFM特征进行计算 298 9.10 根据LCRFM结果进行分析 299 9.11 优化思路 301 第10章 基于LGB进行新闻文本分类案例 302 10.1 案例概述 302 10.2 数据分析 303 10.3 数据读取与预处理 305 10.4 文本特征提取 311 10.5 最优化参数搜索 312 10.6 优化思路 313 第11章 基于PyTorch进行昆虫图像分类案例 315 11.1 案例概述 315 11.2 从零实现一个用于图像分类的卷积神经网络 316 11.3 数据处理 318 11.4 训练模型 321 11.5 可视化模型预测结果 323 11.6 使用模型 325 11.7 优化思路 327 参考文献 328
|
| 精彩片段: |
|
|
| 书 评: |
|
|
| 其 它: |
|
|
|