发表于2024-12-14
BF:基于双耳线索的移动音频编码研究 陈水仙 武汉大学出版社 9787307123182 pdf epub mobi txt 电子书 下载
基本信息
书名:基于双耳线索的移动音频编码研究
定价:26.00元
售价:20.5元
作者:陈水仙
出版社:武汉大学出版社
出版日期:2014-01-01
ISBN:9787307123182
字数:
版次:1
装帧:平装
开本:16开
编辑推荐
内容提要
飞速发展的移动市场对高品质音频业务的需求日 益迫切,移动 环境下音频带宽不足,终端资源有限,传统音频理论 和技术面临新 的挑战。近年来,MPEG、ITU和AVS等国内外标准化组 织积极推 动移动音频理论和技术研究。基于双耳线索的音频编 码因其在低码 率下的音质优势而备受关注,然而,为适应移动环境 苛刻的应用需 求,仍需克服空间参数模型的理论缺陷,突破实变换 域双耳线索表 示的技术瓶颈,解决空间参数码率难以下降、系统复 杂度偏高等问 题。陈水仙编著的这本《基于双耳线索的移动音频编 码研究》开展基于双耳线索的移动音频编码研究,在 双耳线索感知 机理分析、空间感知信息度量、MDCT域双耳线索表示 和空间音频 编码系统结构设计这四个方向上取得了创新性成果。
在双耳线索感知机理分析方向,《基于双耳线索 的移动音频编码研究》针对现有系统只能去除声 道间数据客观冗余的不足,以巴克频带为感知分析单 元,开展了对 双耳线索临界感知JND的分析研究,提出基于感知的 双耳线索参 数表示模型,有效去除了声道问数据的主观冗余信息 ,下降 4.28%~11.78%的空间参数码率,主观测试MUSHRA 得分平均提 高2.6分,客观测试ODG得分平均提高1.1分。
在空间感知信息度量方向,本书针对建立在单耳 听音模型上的 感知熵理论无法度量双耳空间感知信息量的问题,结 合双耳线索的 感知机理,建立了基于双耳线索生理感知的BCPPM模 型来模拟双 耳对空间信息的感知过程,提出基于模型的空间感知 熵SPE的计 算方法,解决了双耳空间感知信息量的度量问题,丰 富和发展了空 间音频编码技术的理论和实践。
在MDCT域双耳线索表示方向,本书针对MDCT实变 换的相 位信息缺失及能量抖动造成双耳线索表示不准确的问 题,采用基函 数“和分离”技术,提出了基于共轭窗函数的MDCT频 谱复数化扩 展方法,并针对新方法引入MDST带来复杂度增加的问 题,提出了 基于转换矩阵稀疏性的MDCT-MDST快速转换算法,同 时利用转换 矩阵的正交性和循环性,将复杂度从O(N*2)下降到O (N),主观测 试MUSHRA得分平均提高2.07分,客观ODG得分平均提 高 0.4281分。
在空间音频编码系统结构设计方向,本书针对空 间信息和下混 信息分离处理模式导致的系统复杂度高和延时长的问 题,采用滤波 复用和并行处理的技术,提出并行滤波共享的分析综 合ABS编码 结构,去除了空间参数编码与下混声道编码中的冗余 操作,缩短了 5%的系统延时,减少了38%~86%的运算复杂度。
本书在基础理论和关键技术方面的研究成果可望 成为国内移动音频标准的支撑技术,增强我国在高速 成长的全球移动音频产业中 的核心竞争力,为全面参与移动音频编解码领域的国 际竞争和标准 化工作奠定坚实的研究基础。
目录
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 冗余信息去除技术
1.2.2 感知信息度量方法
1.3 面临的关键问题
1.3.1 空间参数主观冗余难以去除
1.3.2 MDCT域空间参数分析困难
1.4 主要工作和全文组织结构
1.4.1 主要工作
1.4.2 全文组织结构
第2章 双耳线索的特征分析与表示
2.1 引言
2.2 双耳线索的特征分析实验系统
2.2.1 特征分析实验系统设计
2.2.2 双耳线索临界感知的频率依赖性
2.2.3 双耳线索的统计分布特性
2.3 编码系统中的双耳线索编码实现
2.3.1 基于频率感知的参数集选取
2.3.2 基于频率感知的参数量化和熵编码
2.4 实验与性能分析
2.4.1 参数码率分析与比较
2.4.2 主观性能分析与比较
2.4.3 客观性能分析与比较
2.5 本章小结
第3章 双耳线索感知信息的度量
3.1 引言
3.2 基于双耳听音的生理感知模型构建
3.2.1 空间信息的物理层表示
3.2.2 空间信息的生理感知
3.2.3 双耳线索生理感知模型BCPPM
3.3 基于BCPPM模型的空间感知熵计算
3.3.1 空间感知熵的定义
3.3.2 临界频带滤波单元
3.3.3 双耳线索计算单元
3.3.4 有效感知量计算单元
3.4 实验与性能分析
3.4.1 立体声序列的信息量估算方法对比
3.4.2 不同序列SPE数值的差异分析
3.4.3 同一序列SPE随时间的变化分析
3.5 本章小结
第4章 MDCT域双耳线索的分析与合成
4.1 引言
4.2 基于共轭窗函数的MDcT复数化扩展
4.2.1 双耳线索的形成机理
4.2.2 MDCT频谱对双耳线索的影响:
4.2.3 基于共轭窗函数的MDCT复数化扩展
4.2.4 实验与性能分析
4.3 基于C2S转换的双耳线索分析
4.3.1 MDCT-MDST快速转换
4.3.2 C2S转换矩阵的稀疏化近似
4.3.3 CMCLT域的双耳线索表示
4.4 实验与性能分析
4.4.1 主观性能分析与比较
4.4.2 客观性能分析与比较
4.5 本章小结
第5章 基于合成分析的空间音频编码结构
5.1 引言
5.2 空间音频编码系统的基础操作模块
5.2.1 声源分离模块
5.2.2 下混/上混模块
5.2.3 空间参数分析模块
5.2.4 系统结构的优缺点
5.3 并行滤波共享的ABS编码结构
5.3.1 频带划分对空间信息分析的影响
5.3.2 ABS编码结构设计
5.3.3 并行结构下的滤波共享
5.4 实验与性能分析
5.4.1 系统延时分析
5.4.2 计算复杂度分析
5.4.3 系统性能分析
5.5 本章小结
第6章 总结与展望
6.1 研究工作总结
6.2 研究展望
参考文献
致谢
附录
作者介绍
陈水仙,女,2011年毕业于武汉大学计算机学院计算机应用技术专业,获博士学位。论文获湖北省博士学位论文奖。现在中国科学院信息工程研究所工作。
文摘
序言
BF:基于双耳线索的移动音频编码研究 陈水仙 武汉大学出版社 9787307123182 pdf epub mobi txt 电子书 下载