账号: 密码:
首页  |  宏观指导  |  出版社天地  |  图书代办站  |  教材图书信息 |  教材图书评论 |  在线订购 |  教材征订
  图书分类 - 中图法分类  专业分类  用途分类  自分类  制品类型  读者对象  版别索引 
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
图书查询索引 版别索引 分类索引 中图法分类 专业分类 用途分类 制品类型 读者对象 自分类 最新 畅销 推荐 特价 教材征订
综合查询
自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据 - 中国高校教材图书网
相关类别图书
作 者:王侃
出版社:西安电子科技大学出版社
用 途:
中 图:
专 业:
制 品:图书
读 者:
最新可供书目

战争与文明:从路易十四到拿破仑

中国人民大学出版社


一本书读懂30部管理学经典

清华大学出版社


算法传播十讲

苏州大学出版社


人文职场英语(第2版)学生用书

上海外语教育出版社


数字时代的银龄行动——亚太地区老年人数字素养与技能现状调研

国家开放大学出版社

书名: 自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据
ISBN:9787560660219 条码:
作者: 王侃  相关图书 装订:
印次:1-1 开本:16开
定价: ¥48.00  折扣价:¥45.60
折扣:0.95 节省了2.4元
字数: 178千字
出版社: 西安电子科技大学出版社 页数: 176页
发行编号: 每包册数: 14
出版日期: 2021-04-27
小团购 订购 咨询 推荐 打印 放入存书架 相关评论

内容简介:
本书系统介绍了基于机器学习和深度学习对文本数据进行挖掘和分析的方法,从文本分类、语音识别、主题建模、文本总结、文本生成、情感分析等多个自然语言处理的应用角度出发,对自然语言处理进行了深入解读,通过大量Python代码帮助读者快速学习并实现基本的甚至较高级的自然语言处理技术。
全书共六章。第1章介绍数据的收集和提取,包括从网页、PDF、Word、HTML、JSON中收集数据;第2章介绍文本数据的处理,包括形式转换、删除标点符号、拼写校正、词干提取、词形还原等;第3章介绍文本特征工程,采用的技术包括One Hot编码、统计向量化、N-grams、哈希向量化、共生矩阵等;第4章介绍高级自然语言处理,包括文本相似度计算、词性标注、提取实体、提取主题、情感分析、语音和文本互转等;第5章介绍自然语言处理的行业应用,如多类分类、文本数据总结、文档聚类、自然语言处理在搜索引擎中的应用等;第6章介绍基于深度学习的自然语言处理,通过深度学习实现信息检索、文本分类和单词预测。
本书注重理论与实践相结合,具有较好的实用性,可为自然语言处理或机器学习的相关从业人员以及爱好者提供业务学习指导,也可为Python程序员提供技术参考,还可为高等院校相关专业的本科生和研究生提供学习参考。

作者简介:
 
章节目录:
引言 1
第1章 提取数据 5
概述 5
方法1-1 使用API收集文本数据 6
方法1-2 从PDF中收集数据 7
方法1-3 从Word文件中收集数据 8
方法1-4 从JSON中收集数据 9
方法1-5 从HTML中收集数据 11
方法1-6 使用正则表达式解析文本 14
方法1-7 处理字符串 21
方法1-8 从网页抓取文本 23
第2章 探索和处理文本数据 28
方法2-1 将文本数据转换为小写形式 29
方法2-2 删除标点符号 30
方法2-3 删除停止词 32
方法2-4 文本标准化 34
方法2-5 拼写校正 35
方法2-6 文本分词 37
方法2-7 词干提取 39
方法2-8 词形还原 40
方法2-9 探索文本数据 41
方法2-10 建立一个文本预处理流水线 45
第3章 文本特征工程 49
方法3-1 使用One Hot编码将文本转换为特征 49
方法3-2 使用统计向量器将文本转换为特征 50
方法3-3 生成N-grams 52
方法3-4 生成共生矩阵 54
方法3-5 使用哈希向量器 56
方法3-6 使用词频-逆文档频率将文本转换为特征 57
方法3-7 实现词嵌入 58
方法3-8 实现fastText 66
第4章 高级自然语言处理 69
方法4-1 提取名词短语 70
方法4-2 查找文本之间的相似度 71
方法4-3 词性标注 73
方法4-4 从文本中提取实体 75
方法4-5 从文本中提取主题 77
方法4-6 文本分类 79
方法4-7 情感分析 83
方法4-8 消除文本二义性 84
方法4-9 语音转换为文本 85
方法4-10 文本转换为语音 87
方法4-11 语言翻译 88
第5章 自然语言处理的行业应用 90
方法5-1 消费者投诉分类 90
方法5-2 实现情感分析 97
方法5-3 应用文本相似度函数 107
方法5-4 文本数据总结 117
方法5-5 文档聚类 122
方法5-6 搜索引擎中的自然语言处理 128
第6章 基于深度学习的自然语言处理 132
方法6-1 利用深度学习进行信息检索 138
方法6-2 使用深度学习对文本进行分类 143
方法6-3 对邮件使用长短时记忆预测下一个单词/序列 156

精彩片段:
 
书  评:
 
其  它:
 

专业分类
经济学  公共课与文化课  政治法律  教育学  文学艺术  历史学  理学  工学  农学  医学  计算机/网络  管理学  其他  外语  哲学
用途分类
大学本科教材 大学本科以上教材 大学教学参考书 考研用书 自学考试教材 高职高专教材 中职、中专类教材 中小学教材、教辅
电大用书 学术专著 考试辅导类图书 工具书 培训教材 其他
中图法分类
医药、卫生  语言、文字  工业技术  交通运输  航空、航天  环境科学、安全科学  综合性图书  文学  艺术  历史、地理  自然科学总论  数理科学和化学  天文学、地球科学  生物科学  哲学、宗教  社会科学总论  政治、法律  军事  经济  马克思主义、列宁主义、毛泽东思想、邓小平理论  文化、科学、教育、体育  农业科学
版别索引
北京大学出版社 北京师范大学出版社 清华大学出版社 中国人民大学出版社
北京工业大学出版社 北京大学医学出版社 北京航空航天大学出版社 北京交通大学出版社
北京理工大学出版社 北京体育大学出版社 北京邮电大学出版社 中央音乐学院出版社
北京语言大学出版社 对外经济贸易大学出版社 国家开放大学出版社 首都经济贸易大学出版社
首都师范大学出版社 外语教学与研究出版社
更多...
网上购书指南
一、我的账户
用户注册
用户登录
修改用户密码
修改个人资料
二、查询图书
快速查询
分类查询
综合查询
三、订购图书
第一步点击“订购”按钮
第二步确定收货人信息
第三步提交订单
存书架
四、邮购方式
普通邮寄
特快专递
五、付款方式
支付宝
邮局汇款
六、我的订单
查询订单
修改或取消订单
联系我们

| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息