车载环境下语音识别方法研究

论文摘要

半个多世纪以来,语音识别一直是人们研究的重点。语音是人类交流最常用的方式,因此采用语音识别作为人机接口的设备能够给人们的使用带来很大便利。在我国,汽车在最近的十年中越来越多的进入人们的生活,汽车给人们的生活带来的便利是多种多样的,然而现在人们越来越喜欢功能强大的汽车,这就要求车内电子设备的种类越来越多;由此造成的操作也越来越复杂,而人们在开车的时候离开方向盘去操作这些设备是很危险的,因此为车载电子设备配备语音控制人机接口成为一个最佳的选择。由于我国类似的系统还处于空白阶段,因此在这方面进行研究能填补我国在这方面的空白。首先,本文对车内语音识别技术难点之一的端点检测进行了深入了解,并仔细研究了流行的端点检测方法,由于使用环境的噪声导致了流行的端点检测算法在车内环境下检测精度降低。对此本文提出了一种基于自适应坑函数子带熵的端点检测方法,它能够很好的在车内噪声环境下实现语音端点检测。系统在某些情况下会遇到的汽车鸣笛声音对系统识别的干扰问题,本文提出了一种基于频带特征变化解决方法,成功的解决了这个问题。其次,在实际应用环境中会不可避免的遇到车内噪声,本文研究了去除噪声的两种主要方法,也就是谱减法和功率谱减法,以及它们在实际应用中应该注意的问题。本文采用了基于谱减法的噪音去除技术,成功的实现了语音增强。再次,研究了语音识别中常用语音特征参数,主要是线性预测系数和基于美尔频标的倒谱系数。噪声中被语音掩蔽的部分人耳虽然无法听到,但是却会造成语音特征参数的改变,进而造成识别率的下降。如果能够去除这部分就能带来识别率的提升,根据车内噪声的实际情况,本文提出基于听觉心理学的掩蔽效应改进的美尔频标倒谱系数,并且通过试验证明车内噪声的环境下能够对识别率有一定的提高。然后,本文对动态时间规整和隐形马尔可夫等识别方法做了详细的研究,包括动态时间规整的算法及其改进、隐形马尔可夫模型、实现中要解决的问题和基于聚类的隐形马尔可夫模型快速算法。这些工作为最终的试验识别方法、语音特征参数的选择起到了决定性的作用。最后,本文试验部分给出了试验所用的方法、步骤和语音资料库。语音识别分两个试验,一个是基于动态时间规整算法的语音识别试验;另外一个是基于隐形马尔可夫模型的试验,并且提出了一种在满足识别率的要求情况下能够提高计算速度的新方法。通过试验表明隐形马尔可夫较动态时间规整的识别效率要高一些,能够适应词汇量较大的识别系统,并且识别率能够高达98%。因此本文设计的基于隐形马尔可夫模型的车内环境下的语音识别系统能够作为车载电子设备的语音控制人机接口。填补了我国在这方面的空白,为驾驶安全提供了新的途径。

论文目录

摘要

Abstract

第1章绪论

1.1 引言

1.2 选题背景及意义

1.3 国内外语音识别研究和车载语音识别的历史与现状

1.4 语音的产生

1.5 人耳的听觉特性

1.6 语音识别的分类

1.7 语音识别系统的构成

1.8 本文的组织结构

第2章端点检测

2.1 引言

2.2 语音端点检测的几种算法

2.2.1 短时能量

2.2.2 过零率

2.2.3 基于频带方差的端点检测

2.2.4 倒谱特征

2.2.5 基于自适应坑函数子带熵的端点检测

2.3 各种端点检测方法的试验

2.3.1 基于短时能量的试验

2.3.2 基于过零率的端点检测试验

2.3.3 基于频带方差的端点检测试验

2.3.4 倒谱特征

2.3.5 基于自适应坑函数子带熵的端点检测试验

2.4 本章小结

第3章基于短时谱估计的语音增强方法

3.1 引言

3.2 车载噪声环境

3.2.1 车载环境噪声的分类

3.2.2 车载环境的降噪方法

3.3 幅度谱相减法语音增强

3.3.1 基本幅度谱相减法

3.3.2 参数可调的幅度谱减法

3.3.3 幅度谱减法部分问题的修正

3.4 功率谱相减语音增强

3.4.1 基本功率谱相减的谱估计器

3.4.2 功率谱减法的修正

3.5 维纳滤波增强方法

3.5.1 维纳滤波增强基本原理

3.5.2 维纳估计器的实现及其变形

3.6 改进幅度谱减语音增强算法试验

3.7 本章小结

第4章语音特征参数的提取

4.1 引言

4.2 线性预测倒谱系数

4.3 美尔频标倒谱系数

4.4 基于听觉心理学改进的MFCC

4.4.1 听觉

4.4.2 感知

4.4.3 频率分辨特性和临界带宽

4.4.4 掩蔽效应

4.5 语音特征参数的提取试验

4.6 本章小结

第5章语音识别的匹配模型

5.1 引言

5.2 动态时间规整算法

5.2.1 动态时间规整识别的基本原理

5.2.2 动态时间规整算法的修正

5.2.3 动态时间规整算法的模板训练

5.3 隐形马尔可夫模型

5.3.1 隐形马尔可夫模型的定义

5.3.2 隐形马尔可夫模型的三个基本问题和其解决方案

5.3.3 隐形马尔可夫模型的类型

5.3.4 隐形马尔可夫模型算法实现的问题

5.4 隐形马尔可夫模型的几种快速算法

5.4.1 模型快速算法的概述

5.4.2 基于矢量量化的高斯选择算法

5.4.3 基于子空间高斯聚类的快速算法

5.5 本章小结

第6章识别系统的构建

6.1 引言

6.2 语料库

6.3 识别系统的性能评价

6.4 基于动态时间规整算法的语音识别试验

6.5 基于隐形马尔可夫模型算法的语音识别试验

6.5.1 汉语普通话发音

6.5.2 识别命令表的分解

6.5.3 发音声学模型

6.5.4 特征参数

6.5.5 基于子空间高斯聚类的快速算法试验

6.5.6 特征分量屏蔽快速算法

6.5.7 识别结果

6.6 本章小结

结论

参考文献

攻读博士学位期间发表的论文和取得的科研成果

致谢

车载环境下语音识别方法研究

论文摘要

论文目录

相关论文文献

猜你喜欢