
论文摘要
半个多世纪以来,语音识别一直是人们研究的重点。语音是人类交流最常用的方式,因此采用语音识别作为人机接口的设备能够给人们的使用带来很大便利。在我国,汽车在最近的十年中越来越多的进入人们的生活,汽车给人们的生活带来的便利是多种多样的,然而现在人们越来越喜欢功能强大的汽车,这就要求车内电子设备的种类越来越多;由此造成的操作也越来越复杂,而人们在开车的时候离开方向盘去操作这些设备是很危险的,因此为车载电子设备配备语音控制人机接口成为一个最佳的选择。由于我国类似的系统还处于空白阶段,因此在这方面进行研究能填补我国在这方面的空白。首先,本文对车内语音识别技术难点之一的端点检测进行了深入了解,并仔细研究了流行的端点检测方法,由于使用环境的噪声导致了流行的端点检测算法在车内环境下检测精度降低。对此本文提出了一种基于自适应坑函数子带熵的端点检测方法,它能够很好的在车内噪声环境下实现语音端点检测。系统在某些情况下会遇到的汽车鸣笛声音对系统识别的干扰问题,本文提出了一种基于频带特征变化解决方法,成功的解决了这个问题。其次,在实际应用环境中会不可避免的遇到车内噪声,本文研究了去除噪声的两种主要方法,也就是谱减法和功率谱减法,以及它们在实际应用中应该注意的问题。本文采用了基于谱减法的噪音去除技术,成功的实现了语音增强。再次,研究了语音识别中常用语音特征参数,主要是线性预测系数和基于美尔频标的倒谱系数。噪声中被语音掩蔽的部分人耳虽然无法听到,但是却会造成语音特征参数的改变,进而造成识别率的下降。如果能够去除这部分就能带来识别率的提升,根据车内噪声的实际情况,本文提出基于听觉心理学的掩蔽效应改进的美尔频标倒谱系数,并且通过试验证明车内噪声的环境下能够对识别率有一定的提高。然后,本文对动态时间规整和隐形马尔可夫等识别方法做了详细的研究,包括动态时间规整的算法及其改进、隐形马尔可夫模型、实现中要解决的问题和基于聚类的隐形马尔可夫模型快速算法。这些工作为最终的试验识别方法、语音特征参数的选择起到了决定性的作用。最后,本文试验部分给出了试验所用的方法、步骤和语音资料库。语音识别分两个试验,一个是基于动态时间规整算法的语音识别试验;另外一个是基于隐形马尔可夫模型的试验,并且提出了一种在满足识别率的要求情况下能够提高计算速度的新方法。通过试验表明隐形马尔可夫较动态时间规整的识别效率要高一些,能够适应词汇量较大的识别系统,并且识别率能够高达98%。因此本文设计的基于隐形马尔可夫模型的车内环境下的语音识别系统能够作为车载电子设备的语音控制人机接口。填补了我国在这方面的空白,为驾驶安全提供了新的途径。
论文目录
摘要Abstract第1章 绪论1.1 引言1.2 选题背景及意义1.3 国内外语音识别研究和车载语音识别的历史与现状1.4 语音的产生1.5 人耳的听觉特性1.6 语音识别的分类1.7 语音识别系统的构成1.8 本文的组织结构第2章 端点检测2.1 引言2.2 语音端点检测的几种算法2.2.1 短时能量2.2.2 过零率2.2.3 基于频带方差的端点检测2.2.4 倒谱特征2.2.5 基于自适应坑函数子带熵的端点检测2.3 各种端点检测方法的试验2.3.1 基于短时能量的试验2.3.2 基于过零率的端点检测试验2.3.3 基于频带方差的端点检测试验2.3.4 倒谱特征2.3.5 基于自适应坑函数子带熵的端点检测试验2.4 本章小结第3章 基于短时谱估计的语音增强方法3.1 引言3.2 车载噪声环境3.2.1 车载环境噪声的分类3.2.2 车载环境的降噪方法3.3 幅度谱相减法语音增强3.3.1 基本幅度谱相减法3.3.2 参数可调的幅度谱减法3.3.3 幅度谱减法部分问题的修正3.4 功率谱相减语音增强3.4.1 基本功率谱相减的谱估计器3.4.2 功率谱减法的修正3.5 维纳滤波增强方法3.5.1 维纳滤波增强基本原理3.5.2 维纳估计器的实现及其变形3.6 改进幅度谱减语音增强算法试验3.7 本章小结第4章 语音特征参数的提取4.1 引言4.2 线性预测倒谱系数4.3 美尔频标倒谱系数4.4 基于听觉心理学改进的MFCC4.4.1 听觉4.4.2 感知4.4.3 频率分辨特性和临界带宽4.4.4 掩蔽效应4.5 语音特征参数的提取试验4.6 本章小结第5章 语音识别的匹配模型5.1 引言5.2 动态时间规整算法5.2.1 动态时间规整识别的基本原理5.2.2 动态时间规整算法的修正5.2.3 动态时间规整算法的模板训练5.3 隐形马尔可夫模型5.3.1 隐形马尔可夫模型的定义5.3.2 隐形马尔可夫模型的三个基本问题和其解决方案5.3.3 隐形马尔可夫模型的类型5.3.4 隐形马尔可夫模型算法实现的问题5.4 隐形马尔可夫模型的几种快速算法5.4.1 模型快速算法的概述5.4.2 基于矢量量化的高斯选择算法5.4.3 基于子空间高斯聚类的快速算法5.5 本章小结第6章 识别系统的构建6.1 引言6.2 语料库6.3 识别系统的性能评价6.4 基于动态时间规整算法的语音识别试验6.5 基于隐形马尔可夫模型算法的语音识别试验6.5.1 汉语普通话发音6.5.2 识别命令表的分解6.5.3 发音声学模型6.5.4 特征参数6.5.5 基于子空间高斯聚类的快速算法试验6.5.6 特征分量屏蔽快速算法6.5.7 识别结果6.6 本章小结结论参考文献攻读博士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:语音识别论文;  端点检测论文;  线性预测系数论文;  美尔频标倒谱系数论文;  隐形马尔可夫模型论文;