多重ANN/HMM混合模型在语音识别中的应用

论文摘要

语音是人类最自然、最熟悉的交互方式,现今语音识别、语音合成等的研究方兴未艾。孤立词识别领域已经取得了非常可喜的成绩,但是,在某些情况下,样本间的差异过大使得训练出的模型很难有好的建模精度,要想获得可以接受的识别率就要对模型做进一步的改进。本文在原有人工神经网络与隐马尔可夫模型(ANN/HMM)相结合的模型基础上研究一种多重混合识别模式作为语音的识别方法,以期可以使用多重模型对差异样本互补的进行建模,取得较好的识别率。人工神经网络(ANN)具有抗噪声、抗变异、自适应、学习能力强、识别速度快等特点,因此将其作为状态级的模型,也就是待识别对象基本单元的模型;隐马尔可夫模型(HMM)具有较强的处理时间序列的能力,故作为时序模式的整体模型。在本方法中,ANN与HMM是帧层面的结合,用ANN输出误差来估计HMM某一状态的输出概率。首先,提出了一种自动增减状态来确定模型状态数的方法。这种方法可以根据训练样本的具体情况自动在适当的位置增加或者减少状态,对建模精度不够的状态进行拆分,对包含数据帧数比较少的状态进行删除,最终达到一个合适的数量。在上述模型的基础上,我们提出了一种多重ANN/HMM混合模型,通过竞争学习机制划分样本,通过自适应特征重组方法来降低系统的存储与计算开销。自适应特征重组方法还可以利用ANN的自适应学习能力来保证系统的性能。以语音识别为实验对象,我们将上述方法与传统方法做了比较。结果表明,这种方法的模型精度和识别率的提高,并不是建立在大量消耗系统资源的基础上的。为了将研究成果实用化,利用上述识别模型及方法,我们开发了一个简单的智能人机交互系统,人们可以利用语音输入向计算机发布命令,交互方式简单自然。从对该系统的使用情况来看,它具有响应速度快,识别率高的特点。

论文目录

摘要

Abstract

第1章绪论

1.1 引言

1.2 课题来源及研究的目的和意义

1.3 国内外研究现状

1.4 本文的研究内容

第2章 ANN/HMM混合模型

2.1 ANN模型简介

2.1.1 人工神经网络的特点和基本原理

2.1.2 ANN的学习

2.2 HMM模型简介

2.2.1 基本概念

2.2.2 HMM的结构

2.2.3 HMM训练与识别算法

2.3 ANN/HMM 混合模型

2.3.1 模型结构

2.3.2 基本算法

2.3.3 混合模型的训练方法

2.4 本章小结

第3章 ANN/HMM混合模型状态数目自动优化方法

3.1 模型的调整

3.2 自动增加状态的方法

3.2.1 原理

3.2.2 实例

3.2.3 具体算法

3.3 自动删除状态的方法

3.3.1 原理

3.3.2 具体算法

3.3.3 ANN/HMM 混合模型的总体算法流程

3.4 固定状态数法与自动增减状态数法的实验分析

3.4.1 固定状态数ANN/HMM 的建模效果

3.4.2 自动增减状态数法的建模效果

3.5 本章小结

第4章多重ANN/HMM模型研究

4.1 多重ANN/HMM的结构

4.2 竞争学习机制

4.2.1 原理

4.2.2 竞争学习算法

4.3 自适应特征重组方法

4.3.1 原理

4.3.2 自适应特征重组的算法

4.4 实验分析

4.4.1 语音信号的预处理与特征提取

4.4.2 多重ANN/HMM混合模型的建模效果

4.4.3 自适应特征重组方法的实验结果

4.5 本章小结

第5章应用示例－语音控制车载导航系统

5.1 系统设计

5.1.1 系统结构

5.1.2 交互技术

5.2 系统界面

5.2.1 主界面

5.2.2 语音识别模块界面

5.2.3 语音训练模块界面

5.3 本章小结

结论

参考文献

致谢

多重ANN/HMM混合模型在语音识别中的应用

论文摘要

论文目录

相关论文文献

猜你喜欢