账号: 密码:
首页  |  宏观指导  |  出版社天地  |  图书代办站  |  教材图书信息 |  教材图书评论 |  在线订购 |  教材征订
  图书分类 - 中图法分类  专业分类  用途分类  自分类  制品类型  读者对象  版别索引 
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
图书查询索引 版别索引 分类索引 中图法分类 专业分类 用途分类 制品类型 读者对象 自分类 最新 畅销 推荐 特价 教材征订
综合查询
数据采集与处理:基于Python(新编21世纪数据科学与大数据技术系列教材) - 中国高校教材图书网
相关类别图书
作 者:付东普
出版社:中国人民大学出版社
用 途:
中 图:工业技术
专 业:
制 品:图书
读 者:
最新可供书目

战争与文明:从路易十四到拿破仑

中国人民大学出版社


一本书读懂30部管理学经典

清华大学出版社


算法传播十讲

苏州大学出版社


人文职场英语(第2版)学生用书

上海外语教育出版社


数字时代的银龄行动——亚太地区老年人数字素养与技能现状调研

国家开放大学出版社

书名: 数据采集与处理:基于Python(新编21世纪数据科学与大数据技术系列教材)
ISBN:978-7-300-32568-2 条码:
作者: 付东普  相关图书 装订:
印次:1-1 开本:16
定价: ¥39.00  折扣价:¥35.10
折扣:0.90 节省了3.9元
字数: 400千字
出版社: 中国人民大学出版社 页数:
发行编号:325682 每包册数:
出版日期: 2024-04-01
小团购 订购 咨询 推荐 打印 放入存书架 相关评论

内容简介:
本书的主旨是介绍如何结合Python3语言进行各类结构化和非结构化数据的采集、预处理和存储,涉及统计概率、数据格式与编码、网页开发、自然语言处理、数据科学等不同领域的内容。全书共分为11章,包括数据科学概述、Python基础、统计与概率基础、文件读写与操作、数据可视化、网络数据爬取等多个主题。内容覆盖本地文件、网页数据、大数据访问等编程中的主要知识和技术,在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示了数据采集、处理与存储的核心流程。本书适合高等院校计算机、数据科学与大数据技术、软件工程、统计等相关专业的师生以及Python语言初学者、网络爬虫技术爱好者、数据分析从业人士阅读。

作者简介:
付东普,首都经济贸易大学管理工程学院副教授,中国人民大学管理学博士,北京交通大学应用经济学博士后,高级系统架构设计师。研究领域包括电子商务、消费者行为和互联网金融,讲授课程包括数据分析理论与实践、数据采集与存储、互联网金融、管理信息系统、现代软件工程等。在《管理科学学报》《经济管理》《经济与管理研究》、Electronic Commerce Research等国内外学术期刊及国际会议发表论文20余篇,出版专著2部。有十多年软件开发、设计和管理经验,成功完成了多个数据分析项目。

章节目录:
第一章 概 述
第一节 数据科学概述
第二节 数据采集概述
第三节 数据存储概述
第四节 Python相关数据科学工具
思考与练习
延伸阅读材料
第二章 Python基础
第一节 Python简介
第二节 Python基本语法与命令
第三节 运算符、表达式与内置对象
第四节 函数
第五节 异常及其处理
思考与练习
延伸阅读材料
第三章 numpy与pandas基础
第一节 numpy基础
第二节 pandas基础
思考与练习
延伸阅读材料
第四章 数据可视化
第一节 数据可视化概述
第二节 matplotlib绘图工具
第三节 其他数据可视化工具
思考与练习
延伸阅读材料
第五章 文件读写与操作
第一节 文件读写基本操作
第二节 CSV文件读写
第三节 XML文件读写
第四节 JSON文件读写
第五节 HDF文件读写
第六节 Office文件读写
第七节 PDF文件读写
第八节 图像文件读写
思考与练习
延伸阅读材料
第六章 统计与概率基础
第一节 统计基础
第二节 概率与分布
思考与练习
延伸阅读材料
第七章 数据清洗与预处理
第一节 数据清洗
第二节 数据整合
第三节 数据变换
第四节 聚合与分组统计
第五节 数据归约
思考与练习
延伸阅读材料
第八章 网络数据采集
第一节 爬虫的相关概念与知识
第二节 HTML与JavaScript基础
第三节 静态网页内容爬取与解析
第四节 动态网页内容爬取
第五节 爬虫框架Scrapy与应用
思考与练习
延伸阅读材料
第九章 关系型数据库连接与访问
第一节 关系型数据库概述
第二节 SQLite数据库连接与访问
第三节 MySQL数据库连接与访问
思考与练习
延伸阅读材料
第十章 大数据存储与访问技术
第一节 大数据技术
第二节 非关系型数据库简介
第三节 MongoDB数据库连接与访问
思考与练习
延伸阅读材料
第十一章 数据集成与ETL技术
第一节 数据集成
第二节 ETL相关技术与工具
思考与练习
延伸阅读材料
参考文献

精彩片段:
数据可视化是艺术与技术的结合。它将各种数据用图形化的方式呈现出来,为用户展示已知数据之间的规律、趋势和相关关系,帮助用户认识数据,发现这些数据反映的实质。因此,数据可视化是数据探索性分析的重要组成部分,有助于用户发现数据之间的分布特征、相互关系和总体趋势,为进一步的数据处理和分析提供直观参考。
比如,使用pyecharts可以让开发者轻松地实现大数据的可视化。例如,用pyecharts的v 1.x版本绘制四个商家衬衫、羊毛衫、雪纺衫、裤子、高跟鞋、袜子的销量的柱状图,相关代码及结果如下:
import random
import pyecharts.options as opts
from pyecharts.charts import Bar
x_vals = ['衬衫', '羊毛衫', '雪纺衫', '裤子', '高跟鞋', '袜子']
bar = (
Bar()
.add_xaxis(x_vals)
.add_yaxis('商家A', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家B', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家C', [random.randint(10, 100) for_in range(6)])
.add_yaxis('商家D', [random.randint(10, 100) for_in range(6)])
.set_series_opts(label_opts=opts.LabelOpts(is_show=True, font_size=14), markline_opts=opts. MarkLineOpts(data=[opts.MarkLineItem(y=40, name="达标线=40")]))
.set_global_opts(title_opts=opts.TitleOpts(title='柱状图示例-销量', subtitle='四个商家'), xaxis_opts=opts.AxisOpts(name='商品'),yaxis_opts=opts.AxisOpts(name='单位:件')))
bar.render('柱状图.html')

书  评:
 
其  它:
 

专业分类
经济学  公共课与文化课  政治法律  教育学  文学艺术  历史学  理学  工学  农学  医学  计算机/网络  管理学  其他  外语  哲学
用途分类
大学本科教材 大学本科以上教材 大学教学参考书 考研用书 自学考试教材 高职高专教材 中职、中专类教材 中小学教材、教辅
电大用书 学术专著 考试辅导类图书 工具书 培训教材 其他
中图法分类
医药、卫生  语言、文字  工业技术  交通运输  航空、航天  环境科学、安全科学  综合性图书  文学  艺术  历史、地理  自然科学总论  数理科学和化学  天文学、地球科学  生物科学  哲学、宗教  社会科学总论  政治、法律  军事  经济  马克思主义、列宁主义、毛泽东思想、邓小平理论  文化、科学、教育、体育  农业科学
版别索引
北京大学出版社 北京师范大学出版社 清华大学出版社 中国人民大学出版社
北京工业大学出版社 北京大学医学出版社 北京航空航天大学出版社 北京交通大学出版社
北京理工大学出版社 北京体育大学出版社 北京邮电大学出版社 中央音乐学院出版社
北京语言大学出版社 对外经济贸易大学出版社 国家开放大学出版社 首都经济贸易大学出版社
首都师范大学出版社 外语教学与研究出版社
更多...
网上购书指南
一、我的账户
用户注册
用户登录
修改用户密码
修改个人资料
二、查询图书
快速查询
分类查询
综合查询
三、订购图书
第一步点击“订购”按钮
第二步确定收货人信息
第三步提交订单
存书架
四、邮购方式
普通邮寄
特快专递
五、付款方式
支付宝
邮局汇款
六、我的订单
查询订单
修改或取消订单
联系我们

| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息