带噪语音信号处理中的稳健性加权方法

带噪语音信号处理中的稳健性加权方法

论文题目: 带噪语音信号处理中的稳健性加权方法

论文类型: 博士论文

论文专业: 信息与通信工程

作者: 许超

导师: 曹志刚

关键词: 稳健性,噪声,加权,谐波,语音识别

文献来源: 清华大学

发表年度: 2005

论文摘要: 语音信号处理技术发展一个多世纪以来,噪声问题一直是最普遍的威胁。近十年,由于应用前景诱人的语音识别系统受挫于噪声问题而无法在实际应用中推广,更给噪声相关课题带来新的挑战。解决噪声对信号处理系统的影响主要可以通过两条途径,其一是以噪声为中心,围绕噪声的补偿和消除来开展研究,其二是以处理系统本身为对象,通过研究系统本身对噪声的抵抗力和免疫力从而设计稳健性更好的系统。噪声特性可得的情况下,谱减法、并行模型合并法等遵循第一条思路的方法非常有效。而语音识别中Missing Data等采用第二条思路的方法因其不针对具体噪声,从而适用范围更广泛,具有更好的兼容性。本文采用了第二条思路,通过研究求和系统在噪声中的稳健性表现,提出了可广泛应用于含求和表达式的系统的稳健性加权方法。其核心理论在于:当求和系统的各分量受到相对程度不等的噪声影响时,可以通过加权的方式使系统整体的噪声敏感度降低,各分量的权重则可由该分量在噪声中表现出的局部稳健性来确定。据此,我们分别在最坏意义和统计平均意义下分析系统整体的失真,抽象出相应的数学命题,并给出证明。本文分别将该理论用于三个不同的具体应用。引入该方法可使谐波重构系统在白噪声中平均重构距离降低10%,将改进后的重构系统用于语音识别前端则在人群噪声下可获得45.9%的相对误识率下降,若不考虑基音提取错误则这一改善达73.6%。其次,我们将该理论用于抗噪识别的模型补偿,在Aurora 2实验中,以平均误识率为比较参数,新算法比基线改善了39.6%;地铁噪声下的多方法结合实验显示引入稳健性加权可在谱减法基础上获得35.7%的进一步改善,在Missing Data方法基础上获得10.9%的进一步改善。最后,我们搭建了一套便携式设备上使用的普通话短语识别系统,并应用了运算量很小的稳健性加权算法。严重失配的实际应用环境实验中该方法获得了15.2%的相对误识率下降。进一步的多方法结合实验显示该方法可在3-best系统基础上获得26.2%的相对误识率下降。

论文目录:

第1 章 引言

1.1 研究背景

1.1.1 语音信号处理的魅力

1.1.2 噪声对语音信号处理的影响

1.2 研究思路

1.3 论文内容与结构

1.4 相关约定

第2 章 补偿加权与稳健性加权

2.1 补偿加权

2.1.1 补偿加权的概念

2.1.2 从补偿加权的角度看常见的语音消噪算法

2.2 稳健性加权

2.2.1 语音信号处理中的几例噪声问题

2.2.1.1 语音信号的谐波分析问题

2.2.1.2 语音识别中的输出概率函数计算问题

2.2.2 稳健性加权的概念

2.2.3 推广和应用中的进一步讨论

2.2.3.1 允许求和分量小于零时的稳健性加权

2.2.3.2 对于积分表达式的稳健性加权

2.2.3.3 稳健性加权的系数归一化

2.2.3.4 稳健性加权与补偿加权结合使用的讨论

2.2.3.5 稳健性加权最佳权重讨论

2.3 本章小结

第3 章 语音信号谐波分析中的稳健性加权方法

3.1 语音信号的谐波分析和谐波分量重构

3.1.1 谐波信号的数学表达式

3.1.2 谐波信号的参数估计与波形重构

3.1.3 浊音信号谐波分析波形示例

3.2 噪声中的谐波分析与稳健性加权的应用

3.2.1 带稳健性加权的谐波重构

3.2.2 稳健性加权与补偿加权方法的联合应用

3.3 稳健性谐波重构作为抗噪语音识别系统的前端

3.3.1 算法描述与复杂度分析

3.3.2 实验设置与结果分析

3.4 本章小结

第4 章 稳健性加权方法用于识别系统的模型补偿

4.1 模型补偿方法综述

4.1.1 语音识别中抗噪声方法的分类及概况

4.1.2 针对噪声的模型补偿(PMC,Adaptation,VTS)

4.1.3 Missing Data 方法

4.2 模型补偿中的稳健性加权方法

4.2.1 模型补偿方法的通式

4.2.2 稳健性加权方法分析与应用

4.3 实验结果与分析

4.3.1 Aurora 2 语料库

4.3.2 基线配置

4.3.3 稳健性加权方法效果

4.3.4 稳健性加权方法与Missing Data 或谱减法的联合使用

4.4 本章小结

第5 章 便携设备上语音识别系统中的稳健性加权

5.1 系统介绍

5.1.1 便携式设备的限制与目前研究简况

5.1.2 便携设备上的中文短语识别系统构建

5.2 稳健性加权方法的应用

5.2.1 语音识别中的 Viterbi 解码

5.2.2 Viterbi 识别器中稳健性加权方法的应用

5.3 鲁棒性实验

5.3.1 加性噪声实验

5.3.2 实际应用中复杂环境影响的实验

5.4 本章小结

第6 章 语音增强定点化系统的开发

6.1 原有系统

6.2 定点系统的开发

6.3 本章小结

第7 章 结论

7.1 总结

7.2 进一步工作建议

参考文献

致谢与声明

个人简历、在学期间发表的学术论文与研究成果

发布时间: 2006-06-29

相关论文

  • [1].基于特征提取的抗噪声语音识别研究[D]. 徐金甫.华南理工大学2000
  • [2].抗噪声语音识别技术的研究[D]. 张军.华南理工大学2003
  • [3].听觉特性与鲁棒语音识别算法研究[D]. 孙暐.东南大学2006
  • [4].连续语音识别的稳健性技术研究[D]. 徐望.解放军信息工程大学2006
  • [5].盲信号分离及其在心电和语音信号处理中的应用[D]. 丁志中.中国科学技术大学2007

标签:;  ;  ;  ;  ;  

带噪语音信号处理中的稳健性加权方法
下载Doc文档

猜你喜欢