自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据 - 中国高校教材图书网

账号：密码：

首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订

　图书分类 - 中图法分类专业分类用途分类自分类制品类型读者对象版别索引

搜索新闻图书 ISBN 作者音像出版社代办站教材征订

购书请登录免费注册客服电话:010-62510665 62510769

购书指南购物车我的订单征订单存书架小团购二手书优惠活动关于我们

图书查询索引 版别索引分类索引中图法分类专业分类用途分类制品类型读者对象自分类最新畅销推荐特价教材征订

准确查询综合查询

自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据 - 中国高校教材图书网

相关类别图书

作　者：王侃

出版社：西安电子科技大学出版社

用　途：

中　图：

专　业：

制　品：图书

读　者：

最新可供书目

战争与文明：从路易十四到拿破仑

中国人民大学出版社

一本书读懂30部管理学经典

清华大学出版社

算法传播十讲

苏州大学出版社

人文职场英语（第2版）学生用书

上海外语教育出版社

数字时代的银龄行动——亚太地区老年人数字素养与技能现状调研

国家开放大学出版社

	书名：	自然语言处理方法——使用Python基于机器学习和深度学习发掘文本数据
	ISBN：	9787560660219	条码：
	作者：	王侃相关图书	装订：
	印次：	1-1	开本：	16开
	定价：	￥48.00　折扣价：￥45.60 折扣：0.95 节省了2.4元	字数：	178千字
	出版社：	西安电子科技大学出版社	页数：	176页
	发行编号：		每包册数：	14
	出版日期：	2021-04-27
	    

小团购订购咨询推荐打印放入存书架相关评论

内容简介：
本书系统介绍了基于机器学习和深度学习对文本数据进行挖掘和分析的方法，从文本分类、语音识别、主题建模、文本总结、文本生成、情感分析等多个自然语言处理的应用角度出发，对自然语言处理进行了深入解读，通过大量Python代码帮助读者快速学习并实现基本的甚至较高级的自然语言处理技术。全书共六章。第1章介绍数据的收集和提取，包括从网页、PDF、Word、HTML、JSON中收集数据；第2章介绍文本数据的处理，包括形式转换、删除标点符号、拼写校正、词干提取、词形还原等；第3章介绍文本特征工程，采用的技术包括One Hot编码、统计向量化、N-grams、哈希向量化、共生矩阵等；第4章介绍高级自然语言处理，包括文本相似度计算、词性标注、提取实体、提取主题、情感分析、语音和文本互转等；第5章介绍自然语言处理的行业应用，如多类分类、文本数据总结、文档聚类、自然语言处理在搜索引擎中的应用等；第6章介绍基于深度学习的自然语言处理，通过深度学习实现信息检索、文本分类和单词预测。本书注重理论与实践相结合，具有较好的实用性，可为自然语言处理或机器学习的相关从业人员以及爱好者提供业务学习指导，也可为Python程序员提供技术参考，还可为高等院校相关专业的本科生和研究生提供学习参考。
作者简介：

章节目录：
引言 1 第1章提取数据 5 概述 5 方法1-1 使用API收集文本数据 6 方法1-2 从PDF中收集数据 7 方法1-3 从Word文件中收集数据 8 方法1-4 从JSON中收集数据 9 方法1-5 从HTML中收集数据 11 方法1-6 使用正则表达式解析文本 14 方法1-7 处理字符串 21 方法1-8 从网页抓取文本 23 第2章探索和处理文本数据 28 方法2-1 将文本数据转换为小写形式 29 方法2-2 删除标点符号 30 方法2-3 删除停止词 32 方法2-4 文本标准化 34 方法2-5 拼写校正 35 方法2-6 文本分词 37 方法2-7 词干提取 39 方法2-8 词形还原 40 方法2-9 探索文本数据 41 方法2-10 建立一个文本预处理流水线 45 第3章文本特征工程 49 方法3-1 使用One Hot编码将文本转换为特征 49 方法3-2 使用统计向量器将文本转换为特征 50 方法3-3 生成N-grams 52 方法3-4 生成共生矩阵 54 方法3-5 使用哈希向量器 56 方法3-6 使用词频-逆文档频率将文本转换为特征 57 方法3-7 实现词嵌入 58 方法3-8 实现fastText 66 第4章高级自然语言处理 69 方法4-1 提取名词短语 70 方法4-2 查找文本之间的相似度 71 方法4-3 词性标注 73 方法4-4 从文本中提取实体 75 方法4-5 从文本中提取主题 77 方法4-6 文本分类 79 方法4-7 情感分析 83 方法4-8 消除文本二义性 84 方法4-9 语音转换为文本 85 方法4-10 文本转换为语音 87 方法4-11 语言翻译 88 第5章自然语言处理的行业应用 90 方法5-1 消费者投诉分类 90 方法5-2 实现情感分析 97 方法5-3 应用文本相似度函数 107 方法5-4 文本数据总结 117 方法5-5 文档聚类 122 方法5-6 搜索引擎中的自然语言处理 128 第6章基于深度学习的自然语言处理 132 方法6-1 利用深度学习进行信息检索 138 方法6-2 使用深度学习对文本进行分类 143 方法6-3 对邮件使用长短时记忆预测下一个单词/序列 156
精彩片段：

书　　评：

其　　它：
相关评论发表评论

经济学　公共课与文化课　政治法律　教育学　文学艺术　历史学　理学　工学　农学　医学　计算机/网络　管理学　其他　外语　哲学

大学本科教材	大学本科以上教材	大学教学参考书	考研用书	自学考试教材	高职高专教材	中职、中专类教材	中小学教材、教辅
电大用书	学术专著	考试辅导类图书	工具书	培训教材	其他

中图法分类

医药、卫生　语言、文字　工业技术　交通运输　航空、航天　环境科学、安全科学　综合性图书　文学　艺术　历史、地理　自然科学总论　数理科学和化学　天文学、地球科学　生物科学　哲学、宗教　社会科学总论　政治、法律　军事　经济　马克思主义、列宁主义、毛泽东思想、邓小平理论　文化、科学、教育、体育　农业科学

版别索引

北京大学出版社	北京师范大学出版社	清华大学出版社	中国人民大学出版社
北京工业大学出版社	北京大学医学出版社	北京航空航天大学出版社	北京交通大学出版社
北京理工大学出版社	北京体育大学出版社	北京邮电大学出版社	中央音乐学院出版社
北京语言大学出版社	对外经济贸易大学出版社	国家开放大学出版社	首都经济贸易大学出版社
首都师范大学出版社	外语教学与研究出版社

全国大学出版社

安徽　北京　福建　甘肃　广东　广西　贵州　河北　河南　黑龙江　湖北　湖南　吉林　江苏　江西　辽宁　内蒙古　山东　陕西　上海　四川　天津　未知　新疆　云南　浙江　重庆

版别索引　分类索引　中图法分类　专业分类　用途分类　制品类型　读者对象　自分类　最新　畅销　推荐　特价　教材征订

网上购书指南

一、我的账户

修改用户密码

修改个人资料

二、查询图书

三、订购图书

第一步点击“订购”按钮

第二步确定收货人信息

第三步提交订单

四、邮购方式

五、付款方式

六、我的订单

修改或取消订单

友情链接

政府网站

中华人民共和国教育部

中华人民共和国新闻出版总署

中华人民共和国国家版权局

中华人民共和国工业和信息化部

出版社

全国各大学出版社

中国人民大学出版社

清华大学出版社

北京大学出版社

报刊媒体

中国新闻出版广电网

中国出版传媒商报

中国教育新闻网

中华读书报

相关网站

中国高校教材图书网微博

中国高校人文社会科学信息网

| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网京ICP备10054422号-7 京公网安备110108002480号出版物经营许可证：新出发京批字第版0234号
经营许可证编号：京ICP证130369号技术支持：云因信息