“管理即决策”,图灵奖和诺贝尔经济学奖获得者赫伯特·西蒙(Herbert A. Simon)这样认为。在大数据时代,整个社会各维度生产组织活动愈加信息化和数据化,利用数据挖掘和人工智能技术从大量数据中发现有用的信息和知识,指导和优化决策过程,已经成为一种新范式,将对人类社会的各个方面以及科学研究的各个领域产生深远影响。在变革浪潮中,如何将企业生产经营决策与大数据和人工智能技术相结合显得尤为迫切,这也是新时代新商科的发展趋势。 数据挖掘往往涉及许多人工智能和机器学习算法,需要学生有较强的数理基础和编程能力。商学院以及人文社科领域的学生由于课程设置和专业要求不同,在代码编程能力要求方面无法与理工科学生同等对待,亟须采用一种编程门槛较低的方式以学习和实现数据挖掘中的各类算法。不同于Python这一目前被广泛运用的机器学习编程环境,RapidMiner(被Altair公司收购之后于2023年3月更名为Altair AI Studio)是一个国际流行的数据挖掘可视化软件,具备图形用户界面易于操作的特点,非常适合用作数据挖掘领域的入门学习平台。 本书是由编者在中山大学管理学院多年讲授“大数据与商业智能”等本科生和研究生课程的教学基础之上,结合数据挖掘和人工智能领域的学科知识特点,充分考虑商学院学生的背景知识结构,组织教学团队骨干教师共同编著而成。其中第1章(绪论)、第3章(数据预处理)、第14章(RapidMiner高阶功能)和附录(数据挖掘任务实践与示例)由夏俐撰写,第2章(数据统计与可视化)和第13章(文本分析)由吴记撰写,第6章(决策树)、第8章(朴素贝叶斯)和第9章(K近邻)由卓晓坡撰写,第5章(回归分析)和第7章(模型评估与集成学习)由沈华晓撰写,第10章(支持向量机)和第11章(神经网络)由王杉撰写,第4章(关联规则挖掘)和第12章(聚类分析)由吴浩然撰写。本书可用作各大院校商学院和人文社科领域的本科生和研究生教材,也可供对数据挖掘和机器学习感兴趣的社会人士学习参考。本书的出版承蒙国家自然科学基金项目(72342006,72371253)和广东省高等教育教学研究和改革项目的资助,也得到了Altair公司的大力支持,在此一并致谢。 各大院校的授课教师如果需要参考课程课件及相关电子资料,在明确授课用途的前提下,可以与编者联系索取:夏俐,中山大学管理学院,xiali5@sysu.edu.cn。