背景噪声下孤立词识别算法的研究

论文摘要

近年来,语音识别一直是学术研究领域的一个热点,而孤立词语音识别以其具备较高的计算效率、较小的存储空间和易于实现等优点在实际应用中占据重要位置。目前,在理论上,语音识别技术尤其是孤立词语音识别技术已相对成熟,也有大量的语音识别系统建成,但是这些系统仅在实验室环境下具有较高的识别率,在实际应用环境中,由于噪声的干扰,使其性能急剧下降,难以达到识别要求。因而如何提高系统的环境适应性,降低噪声对系统的影响,是语音识别系统实用化首要考虑的问题。针对这一问题,本文建立了一个基于隐马尔可夫模型的识别系统,并对背景噪声下孤立词识别算法进行研究,通过各种方法降低噪声对识别系统识别率的影响。重点对语音的前端处理如端点检测算法、特征提取方法和语音增强等方面作了深入研究。本文所做贡献如下：1.在研究基于短时能量、短时过零率和基于谱熵的端点检测算法的基础上,提出一种基于相关系数熵的端点检测算法。为提高算法的鲁棒性,该算法通过小波分解重构法对语音的相关性进行了增强。通过不同噪声不同信噪比下的带噪语音信号的仿真实验表明,本文建议的算法在低信噪比条件下比基于谱熵的端点检测算法有较高的准确度,基本克服了传统的语音端点检测算法在低信噪比下不能准确识别出语音端点的问题。2.研究了谱减法、改进谱减法和维纳滤波法这几种基本的语音增强算法。谱减法去噪后有大量音乐噪声残留,改进谱减法虽然可以去除音乐噪声,但存在过减问题。针对以上算法的弊端,本文在基于先验信噪比维纳滤波法的基础上提出改进算法,该算法在直接判决法估计先验信噪比的公式中引入语音和噪声的互功率谱,并在此基础上加入噪声实时更新、VAD算法及增强语音清晰度的条件限制。仿真实验表明,与谱减法、改进谱减法、维纳滤波法相比,本文所提改进算法在有效滤除噪声的同时,最大限度地减少了语音的畸变,保证了语音的质量,尤其是语音清晰度条件限制的引入,使得增强后的语音,可理解度大大增强。3.研究比较了线性预测倒谱系数（LPCC）和美尔频率倒谱系数（MFCC）的提取算法,选择鲁棒性更强的MFCC参数作为特征。围绕白噪声、粉红噪声、车载噪声和工厂噪声这四种典型噪声不同信噪比下的语音进行仿真实验,通过实验确定了使得MFCC+△MFCC特征鲁棒性最强的最佳阶数,并且通过实验数据研究了在不同噪声影响下MFCC及△MFCC各分量对系统识别率的相对重要性,为保证系统在有较高识别率的情况下,减少系统的计算量,提高实时性提供了依据。本文同时对在不同噪声不同信噪比下MFCC+△MFCC+LPCC+△LPCC和MFCC+△MFCC特征作了仿真实验,从识别率和计算复杂度角度考虑选择了MFCC+△MFCC特征。4.研究了隐马尔可夫模型,建立了一个基于HMM模型的孤立词识别系统,并且设计了一个语音识别界面。通过实验讨论了模型状态数和高斯混元数的确定等问题。

论文目录

摘要

ABSTRACT

第1章绪论

1.1 研究的背景与意义

1.2 语音识别技术的发展与研究现状

1.2.1 语音识别技术研究的发展状况

1.2.2 语音识别技术面临的主要问题

1.2.3 语音识别未来发展的趋势

1.3 语音识别系统描述

1.4 本文的研究内容

第2章低信噪比下语音端点检测及语音增强技术

2.1 端点检测的重要性与难点

2.2 端点检测算法的研究

2.2.1 语音特性和噪声特性

2.2.2 传统时域端点检测算法

2.2.3 基于谱熵的端点检测算法

2.2.4 自相关系数熵的端点检测算法

2.3 端点检测技术

2.3.1 端点检测方法

2.3.2 端点检测算法仿真

2.4 语音增强算法

2.4.1 语音增强算法

2.4.2 语音增强算法仿真

2.5 本章小结

第3章背景噪声环境下语音特征参数的提取和优化

3.1 语音特征提取研究的意义与难点

3.2 语音识别系统常用特征参数简介

3.2.1 线性预测倒谱参数

3.2.2 美尔频率倒谱参数

3.2.3 混合特征参数

3.3 背景噪声下的特征分析

3.3.1 MFCC+△MFCC特征阶数的影响

3.3.2 MFCC+△MFCC分量相对重要性

3.3.3 不同特征组合与单一特征比较

3.4 本章小结

第4章语音识别模型

4.1 动态时间规整技术

4.2 隐马尔可夫模型

4.2.1 HMM的引入

4.2.2 HMM的定义

4.2.3 HMM在语音识别中的三个基本问题

4.2.4 HMM的一些实际问题

4.3 DTW和HMM对比

4.4 基于HMM的孤立词语音识别系统的模型选择

4.5 本章小结

第5章基于HMM模型孤立词语音识别系统的实现

5.1 语音识别系统设计

5.2 语音数据库

5.3 语音数据的预处理

5.4 特征参数的提取

5.5 HMM模型训练

5.6 HMM模型识别

5.7 语音识别图形界面设计

5.8 本章小结

第6章总结与展望

6.1 总结

6.2 展望

致谢

参考文献

附录

背景噪声下孤立词识别算法的研究

论文摘要

论文目录

相关论文文献

猜你喜欢