|

《初识数据科学》(订购) [美国]山姆·刘(Sam Lau) [美国]约瑟夫·冈萨雷斯(Joseph Gonzalez) [美国]德博拉·诺兰(Deborah Nolan) 著 门佳 译 东南大学出版社
本书特色
作为一名有抱负的数据科学家,你理解为什么组织机构的重要决策都依赖于数据 ——无论是设计网站的公司、决定如何改善服务的城市,还是致力于阻止疾病传播的科学家组织。你需要具备将一堆杂乱的数据提炼成可操作的洞见所需的技能。我们称之为数据科学生命周期:收集、整理、分析数据并从中得出结论的过程。本书源于作者在加州大学伯克利分校开设的“Data 100”课程。
推荐语
“我真希望在第一次用‘数据科学家’这个词来描述做我们所做工作的人时能有这本书。如果你想从事数据科学/工程、AI或机器学习,这本书就是你的起点。”
——DJ Patil博士,美国第一位首席数据科学家
内容简介
本书是一本兼顾编程和统计学基础技能的书籍,内容涵盖了整个数据科学生命周期。它面向那些希望成为数据科学家或与数据科学家合作的读者,以及希望跨越“技术/非技术”界限的数据分析师。如果具备基本的Python编程知识,你将学到如何使用像pandas这样的行业标准工具来处理数据。
▪ 将感兴趣的问题提炼为可通过数据研究的问题
▪ 进行数据收集可能涉及的文本处理、Web抓取等技术
▪ 通过数据清洗、探索和可视化获得有价值的洞见
▪ 学习如何使用建模来描述数据
▪ 将研究结果推广到数据之外
作者简介
山姆·刘(Sam Lau)是加州大学圣地亚哥分校Halıcıoğlu数据科学研究所的助理教学教授。Sam拥有十年的教学经验,并曾在加州大学伯克利分校和加州大学圣地亚哥分校设计并教授一流的数据科学课程。
约瑟夫·冈萨雷斯(Joseph Gonzalez)是加州大学伯克利分校电子工程与计算机科学系副教授,是伯克利人工智能研究组成员,也是伯克利RISE实验室创始成员。他还共同创立了Turi Inc.和Aqueduct,为数据科学家开发各种工具。
德博拉·诺兰(Deborah Nolan)是加州大学伯克利分校计算机、数据科学和社会学院的统计学名誉教授兼学生事务副院长。
来源:东南大学出版社
|