变速率语音编码 - 中国高校教材图书网
|
|
书名: |
变速率语音编码
|
ISBN: | 7-5606-1382 - 9 |
条码: | |
作者: |
王炳锡 王洪
相关图书
|
装订: | 平装 |
印次: | 1-1 |
开本: | 16开 |
定价: |
¥34.00
折扣价:¥32.30
折扣:0.95
节省了1.7元
|
字数: |
528千字
|
出版社: |
西安电子科技大学出版社 |
页数: |
|
发行编号: | 165300 |
每包册数: |
|
出版日期: |
2004-06-01 |
|
内容简介: |
本书主要讲解了目前最前沿的变速率语音编码及其相关技术。首先简单介绍了变速率语音编码技术的历史与发展现状,再简明地讲解了语音编码的基本原理及其性能评价方法,对在变速率语音编码中最常用的码激励线性预测原理进行了单独介绍,然后对变速率语音编码的相关技术及其背景进行了比较性的讲解,最后对QCELP、EVRC、AMR和SMV四种变速率语音编码技术的原理进行了详细的、深入浅出的讲解,并根据我们的研究与实验结果提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与适用性。该书是国内第一本讲解变速率语音编码技术的书籍,具有很高的实用价值和参考价值。 全书既简明扼要地介绍了语音压缩编码的基本原理,又详细地讲解了国际上最新、最流行的变速率语音编码标准,章节之间紧密配合、前后呼应,具有很强的系统性。通过使用本书,读者可以了解目前最前沿的变速率语音编码技术,掌握语音编码的基本知识和理论,获得语音编码技术的基本技能。同时,通过书中反映出来的研究过程和研究方法,读者能够在以后的研究工作中得到很大的启发。 本书可作为高等学校理工科通信和信息处理及相关专业的高年级本科生和研究生(硕士、博士)的教材和参考书,也可供相关专业的工程技术人员和科研人员参考。
|
作者简介: |
|
章节目录: |
第一章 绪论 1
1.1 概述 1
1.2 语音编码算法综述 2
1.3 定速率语音编码向变速率语音编码的过渡 3
1.4 变速率语音编码的发展现状 4
1.5 变速率语音编码的速率控制方式 6
1.6 变速率语音编码的发展方向 6
参考文献 7
第二章 语音编码基础 8
2.1 概述 8
2.2 语音信号及其模型 8
2.2.1 发音的生理机构与过程 9
2.2.2 语音听觉器官的生理 9
2.2.3 语音听觉的心理和两种听觉实验 11
2.2.4 语音信号模型 14
2.3 语音信号的线性预测分析 16
2.3.1 线性预测的基本原理 16
2.3.2 线性预测误差滤波 18
2.3.3 语音信号的线性预测分析 20
2.3.4 线性预测分析的解法 22
2.3.5 线性预测分析的应用 24
2.4 语音信号的矢量量化 31
2.4.1 矢量量化的基本原理 31
2.4.2 失真测度 32
2.4.3 快速搜索问题 34
2.4.4 最佳矢量量化器和码本的设计 36
2.4.5 降低复杂度的矢量量化系统 38
2.4.6 有记忆的矢量量化 40
2.5 语音信号编码 41
2.5.1 基本原理 41
2.5.2 语音信号的剩余度 42
2.5.3 两种编码方法 43
2.6 语音编码的性能评价方法 44
2.6.1 编码速率 44
2.6.2 合成语音质量 44
2.6.3 编解码延时 46
2.6.4 算法复杂度 46
2.6.5 其它性能 46
2.7 小结 47
参考文献 47
第三章 码激励线性预测声码器 49
3.1 概述 49
3.2 CELP编码原理 49
3.3 知觉加权 51
3.4 CELP码本搜索 52
3.4.1 CELP码本搜索算法 53
3.4.2 自适应码本搜索 54
3.4.3 固定码本搜索 57
3.5 自适应后置滤波 58
3.5.1 短时后置滤波器 59
3.5.2 频谱补偿滤波器 60
3.5.3 长时后置滤波器 61
3.5.4 自动增益控制(AGC) 61
3.6 小结 62
参考文献 62
第四章 变速率语音编码的相关技术 63
4.1 概述 63
4.2 话音激活检测(VAD)技术 63
4.2.1 VAD技术的基本原理 63
4.2.2 VAD参数的计算 64
4.2.3 VAD判决方法 71
4.2.4 变速率语音编码中VAD技术的比较 72
4.3 速率判决(RDA)技术 73
4.3.1 RDA技术的基本原理 73
4.3.2 信源控制速率(SCR)的原理 74
4.3.3 信道控制速率(CCR)的原理 81
4.3.4 变速率语音编码中RDA技术的比较 84
4.4 差错隐藏(ECU)技术 85
4.4.1 ECU技术的基本原理 85
4.4.2 差错检测的方法 85
4.4.3 差错隐藏的方法 86
4.4.4 变速率语音编码中ECU技术的比较 93
4.5 舒适背景噪声(CNA)生成技术 93
4.5.1 CNA生成技术的基本原理 93
4.5.2 AMR中的CNA生成技术 93
4.6 小结 96
参考文献 97
第五章 QCELP变速率语音编码 98
5.1 概述 98
5.2 TIA/EIA/IS-96C 8k QCELP概述 98
5.2.1 编码 100
5.2.2 解码 101
5.2.3 延时要求 101
5.3 8k QCELP编码原理 102
5.3.1 预处理 102
5.3.2 线性预测分析和量化 102
5.3.3 知觉加权 108
5.3.4 速率判决 108
5.3.5 自适应码本搜索 109
5.3.6 固定码本搜索 111
5.3.7 编码器的存储器更新 119
5.3.8 空帧 120
5.3.9 参数格式化输出 120
5.4 8k QCELP解码器功能说明 124
5.4.1 解码器的工作流程 124
5.4.2 后置处理 125
5.5 13k QCELP编解码原理 126
5.5.1 TIA/EIA/IS-733 13k QCELP概述 126
5.5.2 LSP参数的量化 128
5.5.3 速率判决 135
5.5.4 基音延迟的量化 137
5.5.5 固定码本搜索 137
5.5.6 参数格式化输出 143
5.5.7 13k QCELP解码器 147
5.6 QCELP编解码器工作流程总结 149
5.6.1 8k QCELP编解码器工作流程 149
5.6.2 13k QCELP编解码器工作流程 153
5.7 QCELP性能测试及模拟结果 156
5.7.1 平均编码速率测试 156
5.7.2 合成语音质量测试 157
5.7.3 模拟结果 157
5.7.4 QCELP与其它语音编码算法的比较 159
5.8 小结 160
参考文献 160
第六章 增强型变速率语音编解码器(EVRC) 161
6.1 概述 161
6.2 编码器原理 162
6.2.1 预处理 163
6.2.2 模型参数估计 167
6.2.3 速率判决算法 170
6.2.4 LSP参数的量化 172
6.2.5 各种速率下的编码量化过程 173
6.2.6 数据包格式 185
6.3 解码器原理 186
6.3.1 差错隐藏技术 186
6.3.2 全速率和半速率解码 187
6.3.3 1/8速率解码 189
6.3.4 后置滤波器 190
6.4 EVRC性能测试及模拟结果 192
6.4.1 平均编码速率测试 192
6.4.2 合成语音质量测试 193
6.4.3 模拟结果 193
6.4.4 EVRC与其它语音编码算法的比较 194
6.5 EVRC算法特色及改进 194
6.5.1 噪声抑制算法 194
6.5.2 速率判决算法 195
6.5.3 RCELP算法 195
6.5.4 量化和码本搜索 196
6.5.5 对EVRC算法的改进 197
6.6 小结 200
参考文献 201
第七章 自适应多速率(AMR)语音编码 202
7.1 概述 202
7.2 编码器原理 205
7.2.1 预处理 205
7.2.2 线性预测分析和量化 206
7.2.3 开环基音分析 229
7.2.4 脉冲响应的计算 233
7.2.5 目标信号的计算 233
7.2.6 自适应码本搜索和增益控制 233
7.2.7 代数码本的结构和搜索 237
7.2.8 自适应码本增益和固定码本增益的量化 243
7.2.9 修改存储器 245
7.3 解码器原理 245
7.3.1 解码和语音合成 246
7.3.2 后置处理 248
7.4 AMR语音编码器帧结构 249
7.4.1 AMR IF1帧结构 249
7.4.2 AMR IF2帧结构 264
7.5 AMR性能测试及模拟结果 265
7.5.1 平均编码速率测试 266
7.5.2 合成语音质量测试 266
7.5.3 模拟结果 267
7.6 采用AMR的实际系统模型 270
7.7 小结 271
参考文献 271
第八章 可选模式声码器(SMV) 273
8.1 概述 273
8.2 编码算法原理 275
8.2.1 预处理 276
8.2.2 线性预测(LPC)分析 283
8.2.3 参数内插 285
8.2.4 感觉加权滤波 288
8.2.5 开环基音分析 289
8.2.6 语音帧分类 290
8.2.7 信号修正 295
8.2.8 速率和编码类型选择 302
8.2.9 自适应码本搜索 304
8.2.10 固定码本搜索 307
8.2.11 量化机制 316
8.3 解码算法原理 323
8.3.1 解码器算法概述 323
8.3.2 LSP的解码 323
8.3.3 激励解码 324
8.3.4 差错隐藏算法 325
8.3.5 后处理 327
8.4 SMV中的关键技术 329
8.4.1 概述 329
8.4.2 信号修正机制 330
8.4.3 增益判定机制 331
8.4.4 固定码本结构 331
8.5 SMV性能测试及模拟结果 332
8.5.1 平均编码速率测试 332
8.5.2 合成语音质量测试 332
8.5.3 模拟结果 333
8.5.4 SMV与其它语音编码算法的比较 337
8.6 小结 337
参考文献 338
附录 英汉名词对照 339
|
精彩片段: |
|
书 评: |
《变速率语音编码》是《语音编码》一书的姊妹篇。变速率语音编码是继定速率语音编码之后语音压缩编码技术的新发展。两者的理论基础是相同的,但变速率语音编码技术又有了新的发展和进步。
变速率语音编码的特点是“变”:一是为什么要“变”,二是要有可能“变”,三是怎么“变”,四是“变”的效果如何。广大的科技工作者在回答这四个问题时做了大量的工作,历经近十年的努力,这些问题几乎全面地被解决了。各种标准协议的公布以及变速率语音编码技术在移动通信、互联网、IP电话和语音存储等领域得到实际应用,为回答这些问题给出了最好的答案。
人类在进行语音通信时,大约有70%左右的空闲时间没有讲话,始终用一个速率进行语音编解码对信道资源是一个浪费。因此,能否在无话时编码速率低一点,讲话时编码速率高一点,使平均速率降低下来,这个朴素的想法是有可能实现的。因为无话段的信道噪声和有话段的声信号特征是截然不同的,话音激活技术可以得到有效的应用。大家知道,现代通信技术越来越复杂,影响通信质量的因素很多,综合考虑各种因素可得到三种速率控制方式:源控制、信道控制和网络控制。这些速率控制方式可以使收发双方形成默契,并使速率变化有规律可循,以达到降低速率的目的。传输速率降下来后,接收方要得到满意的合成语音,这是变速率压缩编码的关键。在这里除了利用一般的语音合成技术、参数内插技术和后置滤波技术之外,还利用了速率判决技术、话音激活检测技术、舒适背景噪声技术、差错隐藏技术等。这些技术的应用使变速率之后的语音合成效果几乎没有降低。
20世纪90年代,在无线通信的多址系统中,变速率语音编码得到了广泛的应用,如E-TDMA、PRMA,尤其是CDMA移动通信的飞速发展,把变速率语音编码推上了前台。本书旨在系统研究QCELP、EVRC、AMR和SMV四种算法标准,从原理上给予深刻分析,从实践上给予模拟,比较各种标准的优劣,从编解码算法的各个环节上探讨其算法的改进,为广大读者提供研究资料、思路和方法,以利于变速率语音编码技术得到更好的发展。
变速率语音编码的每一种标准都有多种速率可选,这样不仅仅是从语音压缩编码考虑,更重要的是要配合CDMA系统的需要,既要编码速率低,又要合成语音质量好,同时最大限度地发挥系统的效能,这就要求速率判决算法灵活。简单地说,平均速率的降低是用算法复杂度换来的。
当然,更低速率的语音编码技术已有报导,如800 b/s、600 b/s语音压缩编码算法。
作者现场测听过编解码效果,认为其音质、可懂度都很好。不要很久,相信其中的一些创新技术在未来极有可能融合在变速率语音编码中。
本书的结构安排如下:全书共分八章,第一章简要介绍了定速率语音编码向变速率语音编码的发展历程和变速率语音编码技术的现状与发展方向;第二章简明地讲解了语音编码的基本原理及其性能评价方法;第三章对在变速率语音编码中最常用的码激励线性预测原理进行了单独介绍;第四章比较性地讲解了各种变速率语音编码的相关技术;第五、六、七、八章分别对QCELP、
EVRC、AMR和SMV四种变速率语音编码技术的原理进行了详细的、深入浅出的讲解和研究。书末是“英汉名词对照”,其中收录了语音编码技术涉及的部分专业名词。第一章由王炳锡编写,第二、六章由丁琦编写,第三、五章由李莉编写,第四、七章由王洪编写,第八章由曹建军编写。全书内容由王炳锡统筹指导,由王洪整理修改,最后由王炳锡校订统稿。
本书的特点是讲解了目前最前沿的变速率语音编码技术,反映了语音编码技术的最新水平与发展趋势,具有与本学科学术水平相适应的先进性;由浅入深地安排章节,先理论后应用,内容编排科学,知识结构合理,章节之间紧密配合、前后呼应,具有很强的科学性和系统性;紧密结合作者自己的研究与实验成果,提供了大量的实际参数、图表,与实际工作联系紧密,具有很强的可操作性与适用性,同时,通过我们在书中反映出来的研究过程,读者能够在以后的研究工作中得到很大的启发。通过学习本书,读者可以了解目前最前沿的变速率语音编码技术,掌握语音编码的基本知识和理论,获得语音编码技术的基本技能。另外,通过我们在书中反映出来的启发式研究过程,读者既可以提高自学能力,又可以在创新思维方面得到很大的提高。本书可作为大学高年级本科生、硕士生的选修课本或参考书,也可作为科研人员的参考书。
本书的编著得到了解放军信息工程大学各级领导的关心和支持,得到了国内广大学者的支持和帮助。尤其是课题组同志和研究生们的研究成果充实、完善了本书的内容,增强了本书的可读性和可操作性。西安电子科技大学出版社为本书的出版付出了大量的劳动,在此表示衷心的感谢。书中引用了大量的文献资料,在此也向原作者表示深深的谢意。
因本人的研究水平和阅历有限,书中错漏之处在所难免,恳切希望读者不吝赐教,与作者联系,共同研讨问题。联系地址为河南省郑州市1001信箱837号(邮编450002)。
|
其 它: |
|
|
|