账号: 密码:
中国大学出版社协会 | 首页 | 宏观指导 | 出版社天地 | 图书代办站 | 教材图书信息 | 教材图书评论 | 在线订购 | 教材征订
搜索 新闻 图书 ISBN 作者 音像 出版社 代办站 教材征订
购书 请登录 免费注册 客服电话:010-62510665 62510769
图书查询索引 版别索引 分类索引 中图法分类 专业分类 用途分类 制品类型 读者对象 自分类 最新 畅销 推荐 特价 教材征订
综合查询
如何进行语料库语用学研究:基于语用标注数据的言语行为研究(社会科学研究方法系列丛书) - 中国高校教材图书网
书名: 如何进行语料库语用学研究:基于语用标注数据的言语行为研究(社会科学研究方法系列丛书)
ISBN:978-7-300-33943-6 条码:
作者: [德]马丁·维瑟  相关图书 装订:
印次:1-1 开本:异16
定价: ¥79.00  折扣价:¥71.10
折扣:0.90 节省了7.9元
字数: 250千字
出版社: 中国人民大学出版社 页数:
发行编号:339436 每包册数:
出版日期: 2025-10-27
入选重点出版项目: 获奖信息:
小团购 订购 咨询 推荐 打印 放入存书架

内容简介:
在过去的几十年,基于语料库和基于计算机的分析方法已经 “彻底改变”了语言学或自然语言处理的很多研究。《如何进行语料库语用学研究》介绍了一套独特的方法论和研究工具——对话标注研究工具(DART),使得先进的语料库语用学研究成为可能。
本书主要探讨了以下问题:
?针对不同领域的对话(包括限定领域和通用领域),我们可以区分哪些不同层次的意义?
?我们该如何对这些意义层次进行分类和描述,以便将其与语用力/说话人意图的识别联系起来?
?一个合理的通用的言语行为分类体系是什么样的? 需要涵盖哪些内容?
?大规模自动语用标注多大程度上是合理的,如何使其包含不同层级的间/直接性?
大规模自动语用标注如何使基于语料库的语用学研究成为可能?

作者简介:
作者简介
马丁·维瑟(Martin Weisser),国际著名的语料库语言学学者,获兰卡斯特大学博士学位,目前致力于对话语料库标注体系的设计、标注工具的开发,以及基于语料库的语用分析。先后在国内外多所高校供职,2013—2020年就职于广东外语外贸大学,并获“云山杰出学者”称号。出版专著5部,发表论文30多篇。

译者简介
李艳娇,博士,毕业于香港城市大学翻译及语言学系,现为山东大学文化传播学院教师。研究方向为语料库语言学。主持国家社科基金项目、山东省社会科学规划研究项目、博士后科学基金面上资助项目等,在国内外期刊发表论文多篇,出版专著1部,多次获得威海市社会科学优秀成果奖。

章节目录:
第一章 绪论
1.1前人的语用学和话语研究路径
1.2言语行为
1.3基于语料库/计算机的语用学研究方法
1.4本书的框架
1.5本书所使用的规范

第二章 语用学中的计算机数据
2.1语料库与语用学
2.2文本表示与文本标注的问题和标准
2.2.1基于计算机的一般表示法
2.2.2文本与元信息
2.2.3通用语言信息标注
2.3口语转写中的问题和具体细节
2.3.1关于正字法表示的问题
2.3.2关于韵律问题
2.3.3关于音段和其他特征的问题
2.3.4关于序列完整性的问题
2.3.5关于多模态的问题

第三章 数据、工具以及资源
3.1研究使用的语料库数据
3.1.1 SPAADIA Trainline语料库
3.1.2 Trains 93语料库的选取
3.1.3 Switchboard标注对话语料库的选取
3.1.4摒弃的数据
3.1.5补充数据
3.2 DART的实施及其在处理对话数据中的使用
3.2.1 DART的功能
3.2.2 DART XML格式
3.3语用分析所需的形态句法资源
3.3.1通用词典的概念
3.3.2 DART标记集
3.3.3形态学和形态句法
3.3.4“合成”限定领域词典

第四章 口语单位的句法
4.1句子vs句法类型(C单位)
4.2语用目的的单位分析和频次标准化
4.3单位类型和基本语用功能
4.3.1 yes单位
4.3.2 no单位
4.3.3话语标记
4.3.4称谓方式
4.3.5特殊疑问句
4.3.6一般疑问句和选择疑问句
4.3.7陈述句
4.3.8祈使句
4.3.9片段和感叹句

第五章 语义学与语义语用学
5.1 DAMSL标注体系
5.2语式
5.2.1语法语式
5.2.2交互语式
5.2.3观点语式
5.2.4意愿和个人立场语式
5.2.5社交语式
5.2.6句法指示语式
5.3话题
5.3.1通用话题
5.3.2限定领域的话题

第六章 标注过程
6.1口语对话处理的一般问题
6.1.1预处理——手动化和自动化单位确定
6.1.2填充项、暂停、反馈、重叠等
6.1.3起始连接词、介词和副词
6.1.4不流畅的开始
6.1.5句法目的的自动句法分析和语块切分
6.2自动识别和标注单位类型
6.2.1更短单位的切分和标注
6.2.2特殊疑问句的标注
6.2.3一般疑问句的标注
6.2.4片段、祈使句和陈述句的标注
6.3C单位之上
6.3.1回答和其他回复
6.3.2重复
6.4识别话题和语式
6.5推断、确定或修正言语行为

第七章 言语行为——语料库中的类型、功能和分布
7.1信息寻求类言语行为
7.2(非)衔接性言语行为
7.3信息提供类和指称类言语行为
7.4协商类言语行为
7.5建议或承诺类言语行为
7.6评价或态度类言语行为
7.7强化类言语行为
7.8社交类、规约化的言语行为
7.9其他言语行为

第八章 结语

附录DART言语行为分类(2.0版)
参考文献
译后记

精彩片段:
近年来,以人工智能为核心的人机对话系统发展迅猛,如何让计算机在动态语境中正确理解人类的话语意图是人机交互的重点,也是计算机自然语言理解的最终目的。这一背景下,基于对话数据的语用分析和研究成为关注的焦点。
而实际上,对话语料库无论在语料收集还是语料加工上,难度都远远超过书面语语料库,涉及大量互动和转换,例如,插入、中断、重叠、修正等。由此带来的问题是,基于对话资源的口语现象考察在数量和深度上都要落后于书面语,对语用层面交际功能和交际策略的研究更是少之又少,这反过来又会限制我们对对话的理解。因此,利用大规模对话语料库探究自然语言的会话机制和交际策略,对提升人机对话系统的性能有着深远的意义。
马丁·维瑟(Martin Weisser)是国际知名的语料库语言学专家,曾与利奇(Leech)合作进行对话交际功能的相关研究。本书正是其前期工作的拓展和延伸,书中系统讲述了英语对话语料库中言语行为的分类和自动标注。第一章主要介绍语用学及话语分析的研究路径,阐述言语行为理论的来源和基本内容,概括描述了基于语料库/计算机的语用学研究方法。第二章关注用于语用分析的语言数据,讨论了文本表示与文本标注的问题和标准,以及口语转写的问题和细节。第三章介绍书中使用的语料库、分析工具DART以及实现标注任务所需的形态句法资源。第四章分析了口语单位的句法类型和语用功能,以及需要特殊计算处理的方面。本章还比较了所使用的不同语料库中句法类别和基本交际功能的分布情况。语义学和语义语用学对言语行为的实现做出了重要贡献,对其层次的描述是第五章的主要内容,具体涉及各种语式和话题。第六章概述DART的自动标注过程,涉及口语现象的处理,标注单位的切分和类型的自动识别,话题和语式的自动识别,以及推断、确定或修正言语行为。第七章以讨论DART言语行为分类体系的形式讨论进一步的研究结果,包括对不同数据集中各种行为的分布进行比较,从而说明本研究标注体系在功能描述方面的适用性。第八章总结并展望DART方法的改进方向和未来应用。
这本书的主要贡献在于以下几个方面。第一,相比书面语语料库,口语语料库的建设加工难度更大、耗费更高,因此,对口语语料库的研究本身具有挑战性和创新性。第二,过去对口语语料库的研究主要停留在语音、词汇、句法层面,而本书的研究涉及句法、语义、语用等多个层面,且重点在语用层面的言语行为,讨论更加深入,在理论和实践上为语用信息的分析描述做出实质性贡献。第三,过去的口语研究,定性居多,语料库方法的引入,实现了定量统计,拓展了口语研究的范围和层次。第四,开发了言语行为的自动识别工具DART,为更大规模对话资源的加工奠定了基础。
书中所开展的研究主要基于英语数据,作者只是偶尔引用其他语言的材料,用以说明这种方法背后的理论概念在很大程度上是可转移的。而我们翻译的目的,很大程度是学习英语数据的处理和分析方法,实现对汉语言语行为的自动标注和分析,以加深对汉语会话机制的认识和理解。

书  评:
 
其  它:
 



| 我的帐户 | 我的订单 | 购书指南| 关于我们 | 联系我们 | 敬告 | 友情链接 | 广告服务 |

版权所有 © 2000-2002 中国高校教材图书网    京ICP备10054422号-7    京公网安备110108002480号    出版物经营许可证:新出发京批字第版0234号
经营许可证编号:京ICP证130369号    技术支持:云因信息