账号: 密码:
首页  |  宏观指导  |  出版社天地  |  图书代办站  |  教材图书信息 |  教材图书评论 |  在线订购 |  教材征订
  图书分类 - 中图法分类  专业分类  用途分类  自分类  制品类型  读者对象  版别索引 
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
图书查询索引 版别索引 分类索引 中图法分类 专业分类 用途分类 制品类型 读者对象 自分类 最新 畅销 推荐 特价 教材征订
综合查询
网络信息检索 - 中国高校教材图书网
相关类别图书
作 者:董守斌 袁 华
出版社:西安电子科技大学出版社
用 途:大学本科以上教材
中 图: 自动化技术、计算机技术
专 业:计算机/网络>网络技术
制 品:图书
读 者:普通读者
最新可供书目

战争与文明:从路易十四到拿破仑

中国人民大学出版社


一本书读懂30部管理学经典

清华大学出版社


算法传播十讲

苏州大学出版社


人文职场英语(第2版)学生用书

上海外语教育出版社


数字时代的银龄行动——亚太地区老年人数字素养与技能现状调研

国家开放大学出版社

书名: 网络信息检索
ISBN:978-7-5606-2378-8 条码:
作者: 董守斌 袁 华  相关图书 装订:平装
印次:1-1 开本:16开
定价: ¥32.00  折扣价:¥30.40
折扣:0.95 节省了1.6元
字数: 529千字
出版社: 西安电子科技大学出版社 页数:
发行编号:2670001-1 每包册数:
出版日期: 2010-04-01
小团购 订购 咨询 推荐 打印 放入存书架 相关评论

内容简介:
内 容 简 介
本书详细介绍了网络信息检索的原理和技术,内容包括信息检索模型、网络信息的自动获取、网络信息预处理和索引、查询语言和查询优化等。针对网络信息检索的广泛应用,书中对搜索引擎、中文和跨语言信息检索、多媒体检索、并行和分布式信息检索、信息分类和聚类、信息提取与自动问答等重要应用的关键技术也进行了深入的探讨。
本书层次分明,深入浅出;既有原理阐述和理论推导,也有大量的实例分析,阐述力求系统性和科学性。本书可作为高等院校计算机科学与技术、信息管理与信息系统、电子商务等专业的高年级本科生或研究生的教科书和参考书,对广大从事网络信息检索、数字图书馆、信息管理、人工智能、Web数据挖掘等研究和应用开发的科技人员也有较大的参考价值。

作者简介:
 
章节目录:
目 录





第1章 绪论 1

1.1 网络信息检索概述 1

1.1.1 网络信息 1

1.1.2 信息检索 2

1.1.3 网络信息检索 3

1.2 信息检索的发展 4

1.2.1 手工检索 4

1.2.2 脱机批处理检索 4

1.2.3 联机检索 5

1.2.4 网络信息检索 6

1.3 网络信息检索的应用 6

1.3.1 搜索引擎 6

1.3.2 多媒体信息检索 8

1.3.3 话题识别与跟踪 10

1.3.4 信息过滤 11

1.3.5 问题回答 13

思考题 15

参考文献 15

第2章 信息检索模型 16

2.1 检索模型定义 17

2.2 布尔模型 18

2.3 向量模型 20

2.3.1 索引项权重 21

2.3.2 相似度量 22

2.3.3 计算方法 23

2.4 概率模型 26

2.5 扩展的布尔模型 31

2.5.1 模糊集合模型 31

2.5.2 扩展布尔模型 33

2.6 扩展的向量模型 35

2.6.1 广义向量空间模型 35

2.6.2 潜语义标引模型 38

2.6.3 神经网络模型 41

2.7 扩展的概率模型 43

2.7.1 推理网络模型 44

2.7.2 信任度网络模型 47

2.7.3 语言模型 49

2.8 小结 51

思考题 52

习题 52

参考文献 55

第3章 网络信息的自动搜集 57

3.1 网络信息的特点 57

3.1.1 Web的组成 57

3.1.2 Web的特点 62

3.2 网络信息搜集的原理 64

3.2.1 信息搜集的基本流程 64

3.2.2 遍历策略 66

3.2.3 页面解析 68

3.3 网络信息搜集的礼貌原则 69

3.3.1 机器人排斥协议 69

3.3.2 机器人元标签 70

3.4 高性能信息搜集 71

3.4.1 并行搜集 71

3.4.2 DNS优化 72

3.4.3 优先搜集策略 74

3.4.4 网页更新 74

3.4.5 网页消重 75

3.4.6 避免蜘蛛陷阱 76

3.5 专题信息搜集 77

3.5.1 网页的主题特性 77

3.5.2 专题信息搜集算法 78

3.6 小结 80

思考题 80

习题 80

参考文献 83

第4章 网页文本处理和索引 85

4.1 文本的特性 86

4.1.1 信息熵 86

4.1.2 统计定律 87

4.2 网页信息的特征 89

4.2.1 网页结构 89

4.2.2 网页类型 91

4.3 网页去噪 93

4.3.1 基于网页结构的方法 93

4.3.2 基于模板的方法 96

4.4 文本处理 99

4.4.1 词汇分析 99

4.4.2 排除停用词 100

4.4.3 词干提取 101

4.4.4 索引词选择 101

4.5 索引 102

4.5.1 Trie树 102

4.5.2 后缀树 103

4.5.3 签名档 105

4.5.4 倒排文件 106

4.6 小结 112

思考题 113

习题 113

参考文献 114

第5章 查询语言与查询处理 116

5.1 Web查询语言 116

5.1.1 WebSQL查询语言 117

5.1.2 W3QL查询语言 119

5.1.3 WebOQL查询语言 119

5.2 查询方式 121

5.2.1 基于关键字的查询 121

5.2.2 模式匹配 124

5.3 相关反馈 125

5.3.1 向量空间模型中的相关反馈 126

5.3.2 概率模型中的相关反馈 128

5.4 查询扩展 129

5.4.1 基于字典的简单查询扩展 129

5.4.2 自动局部分析 132

5.4.3 自动全局分析 135

5.5 小结 139

思考题 140

习题 140

参考文献 142

第6章 信息检索性能评价 144

6.1 信息检索评价指标 144

6.1.1 查全率和查准率 144

6.1.2 其他评价指标 148

6.2 信息检索评价基准 156

6.2.1 基准测试 156

6.2.2 TREC评测 158

6.2.3 Web检索评价 162

6.2.4 CWIRF评测 164

6.3 小结 166

思考题 166

习题 167

参考文献 168

第7章 搜索引擎 170

7.1 概述 171

7.1.1 发展概况 171

7.1.2 术语与定义 172

7.1.3 工作原理 174

7.2 链接分析 178

7.2.1 PageRank 178

7.2.2 HITS 186

7.2.3 算法比较 189

7.3 相关排序 190

7.3.1 Lucene检索模型 190

7.3.2 Nutch排序算法 193

7.4 大规模搜索引擎 198

7.4.1 体系架构 199

7.4.2 数据结构 200

7.4.3 检索算法 202

7.4.4 相关排序 202

7.5 小结 203

思考题 204

习题 204

参考文献 207

第8章 并行和分布式信息检索 209

8.1 并行信息检索 209

8.1.1 并行计算的概念 209

8.1.2 并行信息检索体系架构 210

8.1.3 并行编程 212

8.1.4 数据并行 214

8.2 分布式信息检索 217

8.3 元搜索引擎 218

8.3.1 系统架构 220

8.3.2 资源选择 222

8.3.3 文档选择 227

8.3.4 信息融合 228

8.4 P2P网络信息检索 234

8.4.1 P2P网络信息检索的原理 235

8.4.2 非结构化P2P网络信息检索 236

8.4.3 结构化P2P网络信息检索 238

8.5 小结 241

思考题 241

习题 242

参考文献 244

第9章 中文和跨语言信息检索 247

9.1 中文预处理 247

9.1.1 中文编码及转换 248

9.1.2 中文分词 250

9.2 中文信息检索 256

9.2.1 中文检索模型 256

9.2.2 中文索引 258

9.3 跨语言信息检索 260

9.3.1 基本原理 260

9.3.2 基于GVSM的跨语言检索 264

9.3.3 基于LSI的跨语言检索 268

9.4 小结 271

思考题 271

习题 271

参考文献 273

第10章 多媒体信息检索 274

10.1 基于内容的图像信息检索 275

10.2 图像特征提取 277

10.2.1 颜色特征 277

10.2.2 形状特征提取 284

10.2.3 纹理特征提取 285

10.3 图像相似量度 290

10.4 基于内容的视频信息检索 291

10.4.1 镜头分割 292

10.4.2 关键帧提取 293

10.5 基于内容的音频信息检索 294

10.6 小结 295

思考题 296

习题 296

参考文献 297

第11章 信息分类与聚类 299

11.1 基本知识 299

11.1.1 类的概念 299

11.1.2 对象特征描述 300

11.1.3 文档相似性 300

11.1.4 类间距离 302

11.2 特征描述及提取 303

11.2.1 特征提取 303

11.2.2 特征选择 304

11.3 聚类方法 305

11.3.1 划分聚类法 305

11.3.2 层次聚类法 308

11.3.3 其他聚类方法 309

11.4 分类方法 309

11.4.1 Nave Bayes算法 310

11.4.2 kNN算法 313

11.4.3 Rocchio算法 315

11.4.4 SVM算法 316

11.5 方法评测 320

11.5.1 聚类方法评测 320

11.5.2 分类方法评测 321

11.5.3 显著性检验 323

11.6 小结 325

思考题 325

习题 326

参考文献 328

[WTHZ]第12章 Web信息抽取与问答系统[WT] 329

12.1 信息抽取概述 329

12.1.1 信息抽取的发展 330

12.1.2 信息抽取的评价指标 331

12.2 Web信息抽取 331

12.2.1 基于关键字的Web信息抽取 332

12.2.2 基于模式的Web信息抽取 333

12.2.3 基于样本的Web信息抽取 338

12.3 问答系统 341

12.3.1 问题分析 344

12.3.2 信息检索 345

12.3.3 答案抽取 345

12.6 小结 347

思考题 347

参考文献 348





精彩片段:
 
书  评:
前 言

信息检索是信息处理领域的重要基础。随着网络的快速发展和成熟,传统的信息检索技术在网络信息处理上得到了广泛的应用,并逐步形成了新兴的网络信息检索(Network Information Retrieval)技术。网络信息检索的典型应用如搜索引擎,已经成为互联网的重要基础应用。本书系统阐述了网络信息检索的基本原理、技术和应用。
  本书共分两大部分,第一大部分由第1~7章组成,主要介绍网络信息检索技术的基本原理和搜索引擎的应用;第二大部分由第8~12章组成,主要介绍网络信息检索的核心技术和应用。具体来讲,各章的主要内容如下:
  第1章介绍网络信息检索的发展历史,并对网络信息检索的应用进行了综述;第2章主要介绍信息检索的经典模型及多个扩展模型,大部分检索模型都附有实例,以加深读者的理解;第3章对网络信息搜集进行了详细的阐述,首先概述网络信息的载体和分布特点,在此基础上阐述网络信息搜集的基本流程,并详细讨论了搜集策略和性能等问题;第4章主要讲述网络信息处理和索引的关键技术,其中重点是网页去噪和倒排索引等;第5章介绍Web查询语言和查询方式,并重点论述了查询扩展和相关反馈等查询处理技术;第6章讲述评价检索性能的各种量化指标,以及主流的检索评价标准和方法等;第7章介绍搜索引擎的发展历史和工作原理,重点讲述经典链接分析算法,以及大规模搜索引擎中的体系结构和数据结构设计,并以开源系统为例,对搜索引擎的核心排序算法进行了剖析。
  针对海量网络信息的处理问题,第8章主要介绍并行和分布式信息检索的原理以及应用;第9章讲述中文信息检索的关键技术,重点介绍了中文分词技术,以及中文信息检索模型和跨语言信息检索模型;第10章讲述基于内容的多媒体信息检索技术,重点介绍了基于内容的图像信息检索方法;第11章主要讲述自动分类和自动聚类这两种重要并且非常实用的技术,内容包括类的基本知识、特征提取、分类和聚类算法以及方法评测等;第12章介绍Web信息抽取技术以及自动问答系统的相关知识。
  本书适合初学网络信息检索的读者,可作为专科生、本科生、研究生的网络信息检索及相关课程的教材。如果以本书作为本科生教材,相关内容的学时(讲授学时为32,实验学时为16)建议如下,教师可根据不同专业的要求进行调整。
第1章 网络信息检索概述 2学时
第2章 布尔模型、向量空间模型、概率模型 4学时
第2章 扩展模型 4学时
第3章 网络信息分布特点、网络信息搜集、搜索性能问题 4学时
第4章 文本特性、网页去噪、倒排索引 4学时
第5章 查询扩展、相关反馈 4学时
第6章 检索性能评价指标、评测标准和方法 4学时
第7章 搜索引擎工作原理、链接分析、排序算法 6学时
第8~12章 高级应用课题 建议本科生自学
实验 设计一个搜索引擎原型系统 约16学时
本书也可供研究生教学使用。在用于研究生教学时,可适当减少讲授前7章的内容,增加后面5章的内容。
  本书的编撰获得了广东省计算机网络重点实验室的龙卫江老师、方卫东老师、何克晶老师、张晶老师和李粤老师的大力支持,在此表示衷心的感谢;同时要感谢实验室的研究生曹鸿、张元丰、陈晓志、许洋洋、刘鹏飞、何剑飞、张倩、蔡智、胡俊刚、李嘉林、陈晓峰、农双、温泽逢、陈车前、张丽平、叶力洪等同学,感谢他们所做的资料搜集和整理等琐碎而辛苦的工作。
  本书初稿成文于2006年1月,至今已数易其稿,并已在华南理工大学计算机学院本科和研究生教学中多次试用。感谢华南理工大学计算机学院修读“网络信息检索”以及“信息检索与Web挖掘”课程的同学们,他们在使用本书初稿作为辅助教材和讲义时提出了许多很好的建议和意见。
在编写本书的过程中,参考了大量的论文和网络资料,在此向这些参考文献的作者深表感谢。在表述中,本书尽量引用较为经典、规范的表述,并给出了详细的标注。如有缺失,敬请谅解。
  网络信息检索的特点是系统性强,涉及面广,技术新并且发展非常快,而我们的学识和水平有限,因此书中难免出现疏漏和不足之处,敬请读者指正。


作者2010年1月于

其  它:
 

专业分类
经济学  公共课与文化课  政治法律  教育学  文学艺术  历史学  理学  工学  农学  医学  计算机/网络  管理学  其他  外语  哲学
用途分类
大学本科教材 大学本科以上教材 大学教学参考书 考研用书 自学考试教材 高职高专教材 中职、中专类教材 中小学教材、教辅
电大用书 学术专著 考试辅导类图书 工具书 培训教材 其他
中图法分类
医药、卫生  语言、文字  工业技术  交通运输  航空、航天  环境科学、安全科学  综合性图书  文学  艺术  历史、地理  自然科学总论  数理科学和化学  天文学、地球科学  生物科学  哲学、宗教  社会科学总论  政治、法律  军事  经济  马克思主义、列宁主义、毛泽东思想、邓小平理论  文化、科学、教育、体育  农业科学
版别索引
北京大学出版社 北京师范大学出版社 清华大学出版社 中国人民大学出版社
北京工业大学出版社 北京大学医学出版社 北京航空航天大学出版社 北京交通大学出版社
北京理工大学出版社 北京体育大学出版社 北京邮电大学出版社 中央音乐学院出版社
北京语言大学出版社 对外经济贸易大学出版社 国家开放大学出版社 首都经济贸易大学出版社
首都师范大学出版社 外语教学与研究出版社
更多...
网上购书指南
一、我的账户
用户注册
用户登录
修改用户密码
修改个人资料
二、查询图书
快速查询
分类查询
综合查询
三、订购图书
第一步点击“订购”按钮
第二步确定收货人信息
第三步提交订单
存书架
四、邮购方式
普通邮寄
特快专递
五、付款方式
支付宝
邮局汇款
六、我的订单
查询订单
修改或取消订单
联系我们

| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息