数字音视频处理(第二版) - 普通高等教育电子信息类课改系列教材 - 中国高校教材图书网
|
书名: |
数字音视频处理(第二版)
普通高等教育电子信息类课改系列教材
|
ISBN: | 9787560674520 |
条码: | 9787560674520 |
作者: |
韩冰
相关图书
|
装订: | 0 |
印次: | 2-1 |
开本: | 16开 |
定价: |
¥50.00
折扣价:¥47.50
折扣:0.95
节省了2.5元
|
字数: |
296千字
|
出版社: |
西安电子科技大学出版社 |
页数: |
438页
|
发行编号: | |
每包册数: |
|
出版日期: |
2025-03-07 |
|
内容简介: |
本书从人类听觉、视觉的处理机制出发,系统地介绍了听觉和视觉感知模型、 音视频(图像)压缩编码技术、音视频(图像)处理技术、基于内容的音视频(图像)检索技术、数字音视频技术的交叉应用等内容。同时,本书还给出了相关知识的应用实例,这些实例都具有较高的参考和实用价值。本书覆盖的学科领域十分广泛,包括人工智能、信号处理、图像处理、语音处理、视频处理和模式识别等。通过本书,读者可以学习到很多具有普遍价值的知识和具体的应用方法。 本书可作为高等院校电子信息工程、通信工程和计算科学与技术等专业的本科生、研究生教材,也可作为高职、高专音视频应用相关课程的参考书。
|
作者简介: |
|
章节目录: |
第1章 绪论 1
1.1 数字音视频基础 1
1.2 数字音视频系统的组成 2
1.3 数字音视频技术的发展趋势 5
1.4 本章小结 8
第2章 听视觉处理的脑机制 9
2.1 听觉的生理基础 9
2.1.1 听觉感知模型的国内外研究现状 10
2.1.2 人类听觉系统简介 13
2.1.3 听觉特性 14
2.1.4 听觉掩蔽 15
2.1.5 听觉加工理论 16
2.2 视觉的生理基础 18
2.2.1 研究现状 18
2.2.2 视觉感知 20
2.2.3 人类视觉系统概述 26
2.2.4 视觉注意机制 28
2.3 本章小结 32
第3章 音视频信号获取软件及应用 33
3.1 音视频信号采集软件及应用 33
3.1.1 常见的音频信号采集设备的特点 33
3.1.2 音频信号采集软件——Windows 11录音机 33
3.1.3 音频处理工具——Sony Sound Forge 36
3.1.4 视频处理工具 44
3.2 图像/视频信号采集及应用 54
3.2.1 图像信息采集技术 54
3.2.2 视频信息采集技术 56
3.3 音频/视频格式的转换 64
3.4 本章小结 67
第4章 音频压缩编码 68
4.1 音频压缩概述 68
4.1.1 音频信号 68
4.1.2 音频压缩的必要性和可能性 69
4.2 音频编码技术 70
4.2.1 波形编码 70
4.2.2 参数编码 72
4.2.3 混合编码 73
4.2.4 感知编码 74
4.3 MPEG音频编码标准 78
4.3.1 MPEG1音频压缩编码标准 79
4.3.2 MPEG2音频压缩编码标准 82
4.3.3 MPEG4音频压缩编码标准 86
4.4 音频压缩编码在前沿科技中的应用 91
4.5 本章小结 93
第5章 图像/视频压缩编码 94
5.1 图像/视频压缩概述 94
5.1.1 图像/视频信号的特点 94
5.1.2 图像/视频压缩的必要性和可行性 95
5.2 图像压缩编码技术 96
5.2.1 图像压缩编码系统的基本结构 96
5.2.2 统计编码 97
5.2.3 变换编码 104
5.2.4 矢量量化编码 105
5.2.5 预测编码 106
5.3 视频编码技术 108
5.3.1 视频编码系统的一般结构 108
5.3.2 视频编码方案分类 108
5.3.3 采用时间预测和变换编码的视频编码 110
5.4 静止图像压缩标准 114
5.4.1 JPEG静止图像压缩标准 114
5.4.2 JPEG 2000静止图像压缩标准 115
5.5 MPEG视频编码标准 117
5.6 图像视频压缩编码在前沿科技中的应用 120
5.7 本章小结 122
第6章 数字音频处理技术 123
6.1 数字信号处理基础 123
6.1.1 线性和时不变 123
6.1.2 冲激响应和卷积 123
6.1.3 傅里叶变换、拉普拉斯变换和Z变换 124
6.1.4 离散时间傅里叶变换(DTFT)与离散傅里叶变换(DFT) 125
6.2 语音信号产生模型 126
6.2.1 语音信号产生机理 126
6.2.2 语音信号产生的数字模型 127
6.3 语音信号合成的基本方法 128
6.3.1 概述 128
6.3.2 共振峰合成法 130
6.3.3 线性预测编码合成法 132
6.3.4 基音同步叠加法 133
6.3.5 文语转换系统 135
6.4 语音识别的基本技术和方法 136
6.4.1 概述 136
6.4.2 语音识别原理 139
6.4.3 特征表示与提取 147
6.4.4 动态时间规整 161
6.4.5 有限状态矢量量化技术 162
6.4.6 孤立字(词)语音识别系统 164
6.4.7 连续语音识别系统 167
6.5 本章小结 169
第7章 数字图像/视频处理技术 170
7.1 图像的低层视觉处理 170
7.1.1 概述 170
7.1.2 空域滤波增强 170
7.1.3 频域增强 176
7.2 图像的中层视觉处理 180
7.2.1 概述 180
7.2.2 图像分割的定义和依据 181
7.2.3 边缘点检测 181
7.2.4 边缘线跟踪 188
7.2.5 门限化分割 193
7.2.6 区域分割法 194
7.3 视频处理中的关键技术研究 197
7.3.1 概述 197
7.3.2 镜头边界检测 197
7.3.3 视频关键帧提取 202
7.3.4 视频目标检测 208
7.4 本章小结 218
第8章 基于内容的音频、图像、视频检索技术 219
8.1 多媒体信息检索概述 219
8.1.1 信息检索 219
8.1.2 多媒体信息检索 219
8.2 基于内容的音频检索 221
8.2.1 国内外研究现状 222
8.2.2 基于内容的音频检索的总体框架 227
8.2.3 基于内容的音频检索的难点 228
8.2.4 现有的音频检索系统 229
8.3 基于内容的图像检索技术 233
8.3.1 基于内容的图像检索系统的检索过程和关键技术 233
8.3.2 现有的图像检索系统 238
8.3.3 图像检索系统的发展趋势 241
8.4 基于内容的视频检索技术 243
8.4.1 概述 243
8.4.2 基于内容的视频检索及关键技术 244
8.4.3 现有的基于内容的视频检索系统 251
8.4.4 TRECVID会议 255
8.4.5 存在的问题及发展趋势 255
8.5 本章小结 257
第9章 数字音视频技术的交叉应用 258
9.1 数字图像视频处理技术在空间物理中的应用 258
9.1.1 概述 258
9.1.2 极光图像分类 258
9.1.3 极光视频分类 262
9.2 数字图像视频处理技术在医疗领域的应用 264
9.2.1 概述 264
9.2.2 AI辅助诊断 264
9.2.3 疫情状态分析 267
9.2.4 疫情风险评估 268
9.2.5 病毒变异预测 270
9.3 生成模型概览 270
9.3.1 概述 270
9.3.2 ChatGPT 271
9.3.3 Bing Chat 276
9.4 本章小结 279
参考文献 280
|
精彩片段: |
|
书 评: |
|
其 它: |
|
|
|