编辑推荐
★ 概念清晰、深入浅出、通俗易懂、难易适中、适合教学。在介绍信源编码时,不是简单地复制国际标准,二是着重讲述人咧的听觉特性、压缩编码的原理及方法,各种标准的产生背景、特点及应用领域。
★ 实用性强,适用面宽。能满足大多数院校的教学需求。
内容简介
本书从基础理论到专业知识,从基本原理到实际系统和仿真设计,从简单到复杂,深入浅出、图文并茂、有案有例、系统地介绍了音频信息处理的基础理论、基本方法和简要算法。本书共有十章,包括绪论、音频信息处理与识别系统、音频信息采集与数字化、音频信息变换、音频信息编码、音频信息滤波、音频信息增强、音频信息的信噪分离、音频信息的分割与合成、音频信息的编辑。
本书可以作为从事通信与信息工程、信号与信息处理、信息技术与电子工程、计算机网络与多媒体技术、自动化与智能化、生物医学工程等方面的教学、科研、工程、技术人员学习参考,也可作为大专院校相关专业的本科和研究生教材。
目录
前言1
第1章绪论4
1.1.序言4
1.2.声学基础6
1.3.人类听觉感知基础10
1.3.1.人类听觉感知系统10
1.3.2.人类听觉感知的特性12
1.3.3.人类听觉感知效应13
1.3.4.人类听觉感知力与评价14
1.4.音频信息处理理论与技术14
1.5.本章小结16
第2章音频信息处理与识别系统18
2.1.音频信息处理与识别系统结构18
2.2.音频信息处理与识别硬件系统19
2.3.音频信息处理与识别软件系统21
2.4.音频信息处理软件系统23
2.5.音频信息识别软件系统24
2.6.本章小结26
第3章音频信息采集与数字化28
3.1.概述28
3.2.声音传感器28
3.3.前置放大器31
3.4.A/D模数转换器35
3.5.音频信息采样39
3.5.1.等间隔周期的线性采样40
3.5.2.非等间隔非周期的非线性采样43
3.6.音频信息量化45
3.6.1.等间隔线性量化函数45
3.6.2.非等间隔非线性量化函数46
3.6.3.非等间隔自适应量化函数47
3.7.音频信息的描述48
3.7.1.时间域描述48
3.7.2.频率域描述49
3.7.3.软件域描述49
3.8.音频信息文件格式49
3.9.本章小结51
第4章音频信息变换55
4.1.正交变换55
4.2.傅里叶变换56
4.2.1.一维连续傅立叶变换56
4.2.2.二维连续傅立叶变换57
4.2.3.一维离散傅立叶变换57
4.2.4.二维离散傅立叶变换58
4.2.5.矩阵与快速傅立叶变换59
4.2.6.快速傅里叶变换60
4.2.7.傅立叶变换的性质61
4.3.余弦变换63
4.3.1.一维连续余弦变换63
4.3.2.二维连续余弦变换64
4.3.3.一维离散余弦变换64
4.3.4.二维离散余弦变换65
4.3.5.矩阵与快速余弦变换66
4.4.沃尔什变换68
4.4.1.一维沃尔什变换68
4.4.2.二维沃尔什变换72
4.4.3.快速沃尔什变换。73
4.4.4.沃尔什变换的性质74
4.5.哈尔变换77
4.5.1.一维哈尔变换77
4.5.2.二维哈尔变换80
4.5.3.哈尔函数的性质81
4.5.4.快速哈尔变换81
4.6.Gabor变换83
4.6.1.一维连续Gabor变换83
4.6.2.一维连续Gabor变换的另一种形式85
4.6.3.一维离散Gabor变换86
4.6.4.二维连续Gabor变换86
4.6.5.二维离散Gabor变换87
4.6.6.Gabor变换的性质87
4.7.小波变换88
4.7.1.一维连续小波变换89
4.7.2.一维离散小波变换92
4.7.3.二维连续小波变换94
4.7.4.二维离散小波变换95
4.7.5.快速小波变换95
4.7.6.小波变换的性质96
4.8.KL变换98
4.8.1.KL变换98
4.8.2.KL变换的性质100
4.9.希尔伯特变换100
4.9.1.连续信号的Hilbert变换100
4.9.2.离散信号的Hilbert变换102
4.10.本章小结103
第5章音频信息编码106
5.1.概述106
5.2.霍夫曼编码106
5.3.仙农-范诺编码110
5.4.算数编码113
5.5.行程编码116
5.6.LZW编码117
5.7.余弦变换编码120
5.8.小波变换编码122
5.9.矢量量化编码124
5.10.预测编码127
5.11.PCM编码130
5.12.子带编码131
5.13.国际编码标准132
5.14.本章小结135
第6章音频信息滤波140
6.1.概述140
6.2.低通滤波141
6.2.1.理想低通滤波141
6.2.2.指数低通滤波142
6.2.3.梯形低通滤波143
6.2.4.高斯低通滤波144
6.2.5.巴特沃尔斯低通滤波145
6.3.高通滤波145
6.3.1.理想高通滤波145
6.3.2.指数高通滤波147
6.3.3.梯形高通滤波148
6.3.4.高斯高通滤波149
6.3.5.巴特沃尔斯高通滤波150
6.4.带通滤波150
6.4.1.理想带通滤波150
6.4.2.指数带通滤波152
6.4.3.梯形带通滤波153
6.4.4.高斯带通滤波154
6.4.5.巴特沃尔斯带通滤波155
6.5.带阻滤波156
6.5.1.理想带阻滤波156
6.5.2.指数带阻滤波157
6.5.3.梯形带阻滤波159
6.5.4.高斯带阻滤波159
6.5.5.巴特沃尔斯带阻滤波160
6.6.梳状滤波161
6.6.1.理想梳状滤波161
6.6.2.指数梳状滤波161
6.6.3.梯形梳状滤波162
6.6.4.高斯梳状滤波162
6.6.5.巴特沃尔斯梳状滤波163
6.7.频域滤波器的参数164
6.8.复原滤波166
6.9.时域滤波169
6.9.1.均值滤波169
6.9.2.中值滤波170
6.9.3.微分滤波171
6.9.4.积分滤波172
6.9.5.微分积分滤波172
6.9.6.线性组合滤波173
6.9.7.高斯-拉普拉斯滤波173
6.9.8.Gabor滤波174
6.10.卡尔曼滤波174
6.10.1.卡尔曼滤波175
6.10.2.扩展的卡尔曼滤波176
6.11.本章小结178
第7章音频信息增强181
7.1.概述181
7.2.时间域增强181
7.2.1.加减增强181
7.2.2.乘除增强182
7.2.3.线性增强182
7.2.4.指数增强182
7.2.5.对数增强183
7.2.6.幂函数增强183
7.2.7.高斯增强183
7.2.8.巴特沃尔斯增强183
7.2.9.平滑增强184
7.2.10.锐化增强184
7.3.频率域增强185
7.3.1.加减增强185
7.3.2.乘除增强185
7.3.3.线性增强186
7.3.4.指数增强186
7.3.5.对数增强186
7.3.6.幂函数增强187
7.3.7.高斯增强187
7.3.8.巴特沃尔斯增强187
7.3.9.平滑增强187
7.4.直方图增强189
7.4.1.概率统计直方图189
7.4.2.时域幅度直方图增强190
7.5.模式增强196
7.5.1.加减增强197
7.5.2.乘除增强197
7.5.3.线性增强197
7.5.4.指数增强198
7.5.5.对数增强198
7.5.6.幂函数增强198
7.5.7.高斯增强199
7.5.8.巴特沃尔斯增强199
7.5.9.平滑增强199
7.5.10.锐化增强200
7.5.11.微分锐化增强200
7.5.12.微分积分锐化增强200
7.6.特殊效果增强200
7.6.1.延时增强201
7.6.2.回声增强回声201
7.6.3.混响增强203
7.6.4.调制增强205
7.7.本章小结207
第8章音频信息的信噪分离208
8.1.概述208
8.2.时间域分离208
8.2.1.微分信噪分离208
8.2.2.积分信噪分离209
8.3.频率域分离209
8.3.1.高通滤波谱减信噪分离210
8.3.2.低通滤波谱减信噪分离210
8.3.3.带阻滤波谱减信噪分离210
8.4.变换域信噪分离211
8.4.1.直方图变换信噪分离211
8.4.2.Gabor变换信噪分离212
8.4.3.小波变换信噪分离214
8.5.噪声对消215
8.5.1.噪声模型216
8.5.2.噪声对消220
8.5.3.RLSE算法224
8.6.本章小结225
第9章音频信息的分割与合成228
9.1.概述228
9.2.端点检测的分割228
9.2.1.功率谱单阈值法229
9.2.2.局部最小平均功率法230
9.2.3.功率谱双峰谷点法232
9.2.4.功率谱多峰谷点法234
9.3.包络检测的分割236
9.3.1.检波法包络检测237
9.3.2.低通滤波法包络检测238
9.3.3.极值定理法包络检测240
9.3.4.包络检测目标分割244
9.4.Gabor滤波和变换的分割244
9.4.1.Gabor滤波的目标信息分割245
9.4.2.Gabor变换的目标信息分割246
9.5.小波变换的分割247
9.6.幅度合成249
9.6.1.加性合成249
9.6.2.乘性合成250
9.6.3.综合合成250
9.6.4.调制合成251
9.6.5.卷积合成251
9.7.频率合成252
9.7.1.加性合成252
9.7.2.乘性合成252
9.7.3.综合合成253
9.7.4.卷积合成253
9.8.变换合成254
9.8.1.对数变换合成254
9.8.2.Gabor变换合成255
9.8.3.小波变换合成255
9.9.本章小结255
第10章音频信息的编辑258
10.1.概述258
10.2.线性编辑258
10.3.非线性编辑260
10.4.算术编辑262
10.5.本章小结271
前言/序言
声音,自从宇宙形成以来,就形成于宇宙,就存在于宇宙。不过,那些声音是自然声,例如风声、雨声、雷电声;浪声、水声、爆炸声等。声音,自从动物形成以来,就产生于动物界,就存在于动物界。一些声音是动物声,例如鸣叫、会话、歌唱、运动声等。一些声音是人类声,例如语音、歌声、读书声;笑声、哭声、呼叫声等。还有一些声音是人造声,例如乐音、钟声、机器声等。
声音的感知、传输、处理、识别、存储,自从动物形成以来,就产生于动物界,就存在于动物界。最早的,也是最原始的声音感知,是动物的声音传感细胞、组织或器官。最早的,也是最原始的声音传输,是动物的发声细胞、组织或器官。最早的,也是最原始的声音处理,是动物的神经细胞、组织、器官或大脑。最早的,也是最原始的声音识别,也是动物的神经细胞、组织、器官或大脑。声音感知、传输、处理、识别、存储的能力,随着动物的进化、进步、升级而增强。人类是进化最大、进步最快、级别最高的动物,具有最强的声音感知、传输、处理、识别、存储的能力。
迄今为止,最早的最原始的声音感知、传输、处理、识别、存储,仍然存在于动物界,进行于动物界。但是,随着宇宙的进化,动物界的发展,人类世界和人类社会的快速进步和高速发展,与时俱进的现实化和现代化,最早的最原始的声音感知、传输、处理、识别、存储已经不能适应宇宙的进化,已经不能适应人类世界和人类社会的进步和发展。人类需要高深的理论、先进的方法、高级的手段、崭新的设施进行声音感知、传输、处理、识别、存储,去适应世界的变革,去满足社会的需求,去解决社会的问题,去维系人类的生成。因此,声音感知、传输、处理、识别、存储的研究具有不可缺少的重大的理论意义和社会价值。
音频信息感知、传输、处理、识别、存储,最早的恐怕要算是1876年3月10日美籍英国人亚历山大?格雷厄姆?贝尔(Alexander Graham Bell)发明的贝尔电话(Bell Telephone)。贝尔电话是把声音转换成音频电信号,音频电信号通过金属线从电话发送端传输到电话接收端,在电话接收端,再把音频电信号转换成声音。贝尔电话包含了音频信息的感知和传输功能,但还没有音频信息处理和识别功能。贝尔电话也是最早的有线通信系统(Cable Communication)。后来,贝尔电话经过不断的研究、改进、创新,发展成了当代的电信网络电话和电信网络通信(Telecommunication)。如今的电信网络电话和通信具有高级先进的声电转换和电声转换,强大的智能化的音频信息传输、处理、识别、存储功能。贝尔有线电话也发展成了当代的无线电话(Wireless Phone)和移动电话(Mobile Phone)。如今,移动电话比电信电话功能更强大,智能化程度更高。尽管当代的电信电话和移动电话非常先进,非常高级,非常智能化,但是,它们仍然需要继续研究,不断创新,向前发展,更先进更智能地满足人类更高更多更美好的需求。
音频信息存储,最早的恐怕要算是1877年8月15日美国人托马斯?阿尔瓦?爱迪生(Thomas Alva Edison)发明的留声机(Gramophone)和唱片(Microgroove)。爱迪生留声机是把声音转换成波形轨道存储在介质唱片上,被称为留声,即录音。回放时再从介质唱片上读取轨道波形转换成声音,被称为放声,或放唱。爱迪生留声机只有声音的存/取功能,还没有声音的传输、处理和识别功能。爱迪生留声机当时也被称为说话机。后来,爱迪生留声机经过不断的研究、改进、创新,发展成了当代的有线无线电声音视网络系统。如今的有线无线电声音视网络系统具有高级先进的声电转换和电声转换,强大的智能化的音频信息传输、处理、识别、存储功能。尽管当代的电声音视系统非常先进,非常高级,非常智能化,但是,它们仍然需要继续研究,不断创新,向前发展,更先进更智能地满足人类更高更多更美好的需求。
随着人类的进步和社会的发展,人们对音频信息的感知、传输、处理、识别、存储的需求越来越多,要求越来越高。当前,海量音频信息感知的速度、精度、灵敏度、分辨率、质量、自动化程度、智能化程度等还不够高,海量音频信息的传输、处理、识别的速度、精度、效率、自动化程度、智能化程度等还不够高,海量音频信息的存储空间和存储容量还不够大,存取的速度、自动化程度、智能化程度等还不够高。因此,音频信息感知、传输、处理、识别、存储的新理论、新方法、新技术、新工艺、新设备的探索、研究、创新、开发不能停滞不前,需要继续不断的努力。音频信息的感知、传输、处理、识别、存储中,音频信息的感知和存储是音频信息的源头和尾闾,音频信息的识别是终极目标,音频信息处理是实现终极目标的关键,音频信息传输是连接音频信息感知、处理、识别、存储的桥梁。因此音频信息处理的研究是必不可少,非常重要、非常关键的。
数字音频技术及应用 电子书 下载 mobi epub pdf txt