面向互动式游戏引擎的语音识别算法应用研究

面向互动式游戏引擎的语音识别算法应用研究

论文摘要

面向互动式游戏引擎的语音识别系统,主要的功能就是要使计算机能够自动识别人的语音,从而来驱动游戏中的模型做出相应动作。可以将这种功能划分为两大研究部分:语音识别和3D模型的渲染。而这两部分中更为核心的技术就是语音识别技术,这部分采用的算法的性能直接影响到人机交互的结果,所以针对游戏引擎的特点对语音识别技术进行研究是十分必要的。语音识别主要由端点检测、特征提取、模式匹配等几个部分组成。端点检测就是要准确的检测出语音信号的起始点,将语音信号与噪声信号区分开。特征提取即寻找能够有效表示语音特征的参数;模式匹配即计算一段语音与特征模板之间的相似度。本文提出一种基于基音频率的实时性端点检测算法,通过对实验结果的分析显示算法具有很好的鲁棒性和实时性,同时也提出一种基于C0复杂度理论的改进的非线性算法,通过引入短时能量对传统的C0复杂度算法进行改进,改进后的算法更具鲁棒性,在低信噪比下可以表现出较好的效果,这两种端点检测算法完全满足互动式游戏引擎实时性的特点。通过引入加权滤波分析技术,文中还提出了一种新的语音特征参数:二次加权美尔系数,同时也研究了在求取逆美尔倒谱系数时的加权因子以及最优加权因子。实验结果表明,该参数具有更好的鲁棒性。此外,针对模式匹配常用的两种算法,DTW和HMM,深入分析了算法的原理,并对算法进行实验,同时对实验结果的分析得出适合游戏特点的匹配算法并成功应用到识别系统中。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 论文研究背景
  • 1.2 国内外研究现状
  • 1.3 本文的主要工作
  • 1.4 本文的组织
  • 2 语音识别原理
  • 2.1 语音识别概述
  • 2.1.1 语音识别的分类
  • 2.1.2 语音识别系统的构成
  • 2.1.3 语音识别的应用
  • 2.2 语音信号的预处理
  • 2.2.1 语音信号的模型及基本特征
  • 2.2.2 信号采样
  • 2.2.3 预加重处理
  • 2.2.4 加窗与分帧
  • 2.2.5 语音增强技术
  • 2.3 语音信号的特征参数
  • 2.3.1 美尔倒谱系数
  • 2.3.2 线性预测倒谱系数
  • 3 端点检测算法研究与实现
  • 3.1 端点检测算法的分类
  • 3.1.1 基于能量过零率的端点检测算法
  • 3.1.2 基于谱熵的端点检测算法
  • 3.1.3 基于频带方差的端点检测算法
  • 3.2 基于基频能量的检测算法
  • 3.2.1 人的声音特性
  • 3.2.2 基频能量算法原理
  • 3.2.3 实验结果及分析
  • 0复杂度理论的改进算法'>3.3 基于C0复杂度理论的改进算法
  • 3.3.1 测度复杂度理论
  • 0复杂度理论改进算法原理'>3.3.2 C0复杂度理论改进算法原理
  • 3.3.3 实验及结果分析
  • 4 特征参数及提取算法研究与实现
  • 4.1 二次加权Mel倒谱系数的提取算法
  • 4.1.1 Mel频率倒谱系数
  • 4.1.2 逆Mel频率倒谱系数
  • 4.1.3 二次加权Mel倒谱系数
  • 4.2 实验结果及分析
  • 5 模式匹配算法的分析与比较
  • 5.1 动态规正算法
  • 5.1.1 动态规正算法原理
  • 5.1.2 动态规正算法实现
  • 5.2 隐马尔科夫模型
  • 5.2.1 马尔科夫链
  • 5.2.2 HMM基本概念及定义
  • 5.2.3 HMM算法中模型观察序列概率的计算
  • 5.2.4 HMM算法中转移路径的计算
  • 5.3 两种算法实验结果的分析与比较
  • 6 在互动式游戏引擎平台中的应用
  • 6.1 互动式游戏引擎技术平台简介
  • 6.2 基于人体姿态的人机交互
  • 6.3 基于语音识别的人机交互
  • 6.3.1 端点检测
  • 6.3.2 特征参数提取
  • 6.3.3 模式匹配
  • 6.4 系统架构与运行效果
  • 6.4.1 系统的模块构成
  • 6.4.2 系统运行的效果图
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    面向互动式游戏引擎的语音识别算法应用研究
    下载Doc文档

    猜你喜欢