基于R的统计分析与数据挖掘(统计数据分析与应用丛书) - 中国高校教材图书网
|
|
书名: |
基于R的统计分析与数据挖掘(统计数据分析与应用丛书)
|
ISBN: | 978-7-300-19074-7 |
条码: | |
作者: |
薛薇
相关图书
|
装订: | 平装 |
印次: | 1-1 |
开本: | 16开 |
定价: |
¥48.00
折扣价:¥43.20
折扣:0.90
节省了4.8元
|
字数: |
596千字
|
出版社: |
中国人民大学出版社 |
页数: |
|
发行编号: | 190747 |
每包册数: |
7
|
出版日期: |
2014-05-04 |
|
内容简介: |
本书聚焦当今备受国内外数据分析师和数据应用者关注的R语言,关注如何借助R实现统计分析和数据挖掘。它既不是仅侧重理论讲解的统计分析和数据挖掘教科书,也不是仅侧重R编程操作的使用手册,而是以数据分析贯穿全书的两者的有机结合。 本书特色在于:以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的解读理解。 本书定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。
|
作者简介: |
薛薇,工学硕士,经济学博士,中国人民大学应用统计科学研究中心副主任,中国人民大学统计学院副教授。关注数据挖掘及统计建模、统计和数据挖掘软件应用、统计数据库系统研发等方面。涉足网络新媒体舆论传播和互动建模、政府和官方微博分析、电商数据分析、学科学术热点跟踪等文本挖掘,以及社会网络分析和以数据挖掘为依托的客户关系管理等领域。主要著作:《SPSS统计分析方法及应用》、《SPSS Modeler数据挖掘方法及应用》、《基于R的统计分析和数据挖掘》、《基于信息技术的统计信息系统》等。
|
章节目录: |
第1章 关于R 1.1 为什么选择R 1.2 如何学习R 1.3 R入门必备 1.4 小 结 第2章 R的数据组织 2.1 R的数据对象 2.2 创建和访问R的数据对象 2.3 从文本文件读数据 2.4 外部数据的导入 2.5 R数据组织的其他问题 2.6 小 结 第3章 R的数据管理 3.1 数据合并 3.2 数据排序 3.3 缺失数据报告 3.4 变量计算 3.5 变量值的重编码 3.6 数据筛选 3.7 数据保存 3.8 数据管理中控制流程 3.9 小 结 第4章 R的基本数据分析:描述和相关 4.1 数值型单变量的描述 4.2 分类型单变量的描述 4.3 两数值型变量相关性的分析 4.4 两分类型变量相关性的分析 4.5 小 结 第5章 R的基本数据分析:可视化 5.1 绘图基础 5.2 数值型单变量分布的可视化 5.3 分类型变量分布和相关性的可视化 5.4 两数值型变量相关性的可视化 5.5 lattice绘图 5.6 小 结 第6章 R的两均值比较检验 6.1 两独立样本的均值检验 6.2 两配对样本的均值检验 6.3 样本均值检验的功效分析 6.4 两总体分布差异的非参数检验 6.5 两样本均值差的置换检验 6.6 两样本均值差的自举法检验 6.7 小 结 第7章 R的方差分析 7.1 单因素方差分析 7.2 单因素协方差分析 7.3 多因素方差分析 7.4 小 结 第8章 R的回归分析:一般线性模型 8.1 回归分析概述 8.2 建立线性回归模型 8.3 线性回归方程的检验 8.4 回归诊断:误差项是否满足高斯马尔科夫假定 8.5 回归诊断:诊断数据中的异常观测点 8.6 回归诊断:多重共线性的诊断 8.7 回归建模策略 8.8 回归模型验证 8.9 带虚拟变量的线性回归分析 8.10 小 结 第9章 R的回归分析:广义线性模型 9.1 广义线性模型概述 9.2 logistic回归分析:连接函数和参数估计 9.3 logistic回归分析:解读模型和模型检验 9.4 logistic回归分析:R函数和示例 9.5 logistic回归分析:回归诊断 9.6 泊松回归分析 9.7 广义线性模型的交叉验证 9.8 小 结 第10章 R的聚类分析 10.1 聚类分析概述 10.2 K-Means聚类 10.3 层次聚类 10.4 两步聚类 10.5 小 结 第11章 R的因子分析:变量降维 11.1 因子分析概述 11.2 构造因子变量:基于主成分分析法 11.3 构造因子变量:基于主轴因子法 11.4 因子变量的命名 11.5 计算因子得分 11.6 小 结 第12章 R的线性判别分析:分类模型 12.1 距离判别 12.2 Fisher判别 12.3 小 结 第13章 R的决策树:预测模型 13.1 决策树算法概述 13.2 分类回归树的生长过程 13.3 分类回归树的剪枝 13.4 建立分类回归树的R函数和示例 13.5 建立分类回归树的组合预测模型 13.6 随机森林 13.7 小 结 第14章 R的人工神经网络:预测和聚类 14.1 人工神经网络概述 14.2 B-P反向传播网络 14.3 B-P反向传播网络的R函数和示例 14.4 SOM自组织映射网络 14.5 小 结
|
精彩片段: |
R是一款应用前景广阔的数据分析工具,一个共享的开源软件平台。 R的不断发展受惠于这个方兴未艾的大数据时代,此谓天时。互联网、物联网和移动客户端的广泛应用,让人们置身于数据的汪洋大海和崇山峻岭之中。对于一个有进取心的探险者来说,商机与危机同在,机遇与挑战共存。利用R开展有效的数据分析工作,无疑是前进征途的指南针,同时也是挖掘职业生涯宝藏的利器。 R在国内的逐步普及得益于这个复杂激烈的市场竞争环境,此谓地利。目前以及未来相当长的一段时期,是我国改革开放的关键时期,也是产业结构转型和企业升级换代的重要战略机遇。面临竞争国际化、利益多元化、服务个性化、方式便利化的市场形势,以数据分析为重要管理手段,是促使国家科学决策和企业健康发展的战略选择。 R在全球广泛应用的根源在于其一贯的软件免费和程序代码开放策略,此谓人和。R像一个数据分析的生态群落,从封闭的实验室迁生到互联网的开放环境中,按照全新的生存法则迅速发展。任何人只需访问相应网站,便可免费下载获得R的系统、文档、数据集等全部相关资源。同时,R今天的学习者完全有可能成为明天的合作开发者。 《基于R的统计分析与数据挖掘》聚焦当今备受国内外数据分析师和数据应用者关注的R语言,企图借助R实现统计分析和数据挖掘。理由很简单:R不仅囊括了几乎所有的经典统计方法,而且拥有众多前沿的现代统计模型、数据挖掘算法以及顶尖的绘图功能;不仅可以解决数据分析的共性问题,而且能够服务于电商、金融、医学、生物、地理、环境、传媒等领域的特色数据应用;不仅适合统计分析的学习者、学术研究的探索者,而且适合致力数据应用开发的实践者和掘金者。 一方面,本书全面系统地介绍了R的数据对象、常用系统函数、用户自定义函数以及流程控制等与统计编程和数据模拟相关的基础知识;另一方面,以由浅入深的数据分析过程为线索,详细讨论R的数据组织、数据加工和可视化图形处理、回归预测建模、变量降维处理以及分类和聚类研究等。内容上涵盖从基础编程到统计模拟,从单变量描述性分析到多变量相关性研究,从线性模型到非线性模型,从满足分布假设的经典统计模型到以随机化为基础的现代统计建模乃至数据挖掘等众多方面。 本书既不是仅侧重理论讲解的统计分析和数据挖掘教材,也不是仅侧重编程操作的R的使用手册,而是以数据分析贯穿全书,是两者的有机结合。在以数据模拟的直观方式论述方法原理的同时,通过案例强化R的操作实践性;在以解决应用问题为目标讨论R操作的同时,通过原理论述强化模型结果的理解解读。 本书定位于统计分析和数据挖掘的学习者、实践者和研究者,旨在使读者理解统计分析原理,熟练操控R软件,拓展数据应用,提升研究水平。 掌握基于R的主流数据分析技术,以洞察大数据的敏锐智慧,懂得大数据分析精髓的务实态度,掌控大数据分析的卓越能力,每个人都可能成为大数据分析师。数里淘金,R的大数据时代即将到来。 请读者到人大经管图书在线(http://www.rdjg.com.cn)下载本书案例数据和R程序代码。在此特别感谢中国人民大学出版社对本书出版的大力支持。北京城市学院经管学部2013级陈笑语等同学,为本书案例数据的收集和整理做了很多工作, 这里也一并表示感谢。 书中不妥和错误之处,望读者不吝指正。
|
书 评: |
|
其 它: |
|
|
|