本教材的内容,分为四大模块,分别是: (1) 数据科学基础(Fundamentals):讲述数据科学的基本概念和原则。 (2) 数据和数据上的计算(Data and Computing on Data):讲述不同的数据类型及其分析方法,数据类型包括结构化数据、非结构化数据、半结构化数据,分析方法包括统计学方法、数据挖掘方法、和机器学习方法等。 (3) 数据处理基础设施、平台和工具(Infrastructure, Platforms and Tools):讲述云计算平台、数据库、大数据平台及工具、以及编程语言 Python 等。 (4) 数据科学案例和实践(Applications and Practice):讲述大数据应用的案例;并且面向金融领域的量化交易应用,从数据采集、模型训练、预测、评价、到可视化等环节,带领读者完成数据分析处理的实践。