汉语普通话中双音节词水平测试系统的设计与研究

汉语普通话中双音节词水平测试系统的设计与研究

论文摘要

随着计算机和语音识别技术的发展,使《汉语普通话水平测试系统》的实现成为可能。《汉语普通水平测试系统》旨在利用人机交互优势,解决现今普通话人工测试的一些缺点。实验证明,利用计算机进行普通话测试有利于统一测试的不足,推广普通话。主要是在对现有语音识别技术进行研究,尤其是在对汉语语音识别技术研究的基础上完成普通话水平测试系统中双音节词测试的设计与实现,系统涉及到语音信号的采集、预处理、特征提取、模型的训练和匹配以及普通话水平的评价方式等。主要研究工作和取得的成果如下:分析一般语音识别系统的结构及所用到的各种理论技术,讨论语音识别系统中涉及到的基本概念及原理,包括语音识别单元的选取、预处理、特征参数的提取、模式匹配及模型训练等技术。对语音识别中各种特征参数的提取方法进行了系统的研究,特别是对反映语音倒谱特征的LPCC和MFCC的提取方法进行了深入的探讨和分析,并对它们进行了仿真实验。深入地探讨了连续概率密度隐马尔可夫模型(CDHMM)的基本原理和识别算法的理论基础和处理方法,且根据实际需要分析得出本系统所用的数学模型的理论根据和可实现性,并给出了算法的具体实现步骤。分析已有类似系统的评分方式,结合目前普通话测试的评分模式改进得出适合本系统的评价方式。在Microsoft Visual Studio 2008和MATLAB 6.5平台上,利用VC++和Matlab实现了汉语普通话中双音节词水平测试系统,并对其进行了测试。本系统主要解决的是双音节词的测试。通过实验测试证明了此系统能够完成预期功能,并通过比较同一个人的两次测试结果,以及不同人的测试结果来判定系统的效果。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 前言
  • 1.2 语音识别技术的发展和现状
  • 1.3 语音识别的分类及系统概述
  • 1.4 语音识别目前存在的问题
  • 1.5 论文内容安排
  • 2 语音信号预处理与特征参数提取
  • 2.1 语音信号产生的数学模型
  • 2.2 语音信号预处理
  • 2.2.1 语音信号的采样和预加重
  • 2.2.2 加窗与分帧处理
  • 2.2.3 短时能量与短时平均过零率
  • 2.2.4 短时自相关函数
  • 2.2.5 语音信号的端点检测
  • 2.3 几种常用的特征参数提取方法
  • 2.3.1 线性预测系数(LPC)
  • 2.3.2 线性预测倒谱系数(LPCC)及其仿真实验
  • 2.3.3 美尔频率倒谱系数(MFCC)及其仿真实验
  • 2.3.4 MFCC和LPCC性能比较
  • 3 连续概率密度隐马尔可夫模型
  • 3.1 HMM概述
  • 3.1.1 Markov链
  • 3.1.2 HMM模型的基本思想
  • 3.1.3 HMM定义
  • 3.1.4 隐Markov模型的分类
  • 3.2 连续混合密度隐马尔可夫模型
  • 3.2.1 CDHMM的原理
  • 3.2.2 CDHMM的主要算法
  • 3.3 算法中存在的基本问题
  • 3.3.1 问题的提出
  • 3.3.2 修正重估公式
  • 3.3.3 计算中的下溢问题
  • 3.3.4 Markov链的选择
  • 3.4 本系统使用的语音识别算法
  • 3.4.1 CDHMM模型参数训练
  • 3.4.2 模型识别
  • 4 系统总体设计
  • 4.1 系统模型
  • 4.1.1 系统描述
  • 4.1.2 系统基本框架
  • 4.2 语音数据库
  • 4.3 测试者成绩标准
  • 4.4 系统的实现
  • 5 系统应用与结果讨论
  • 5.1 实验测试
  • 5.2 测试结论
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 硕士期间发表的论文
  • 后记
  • 相关论文文献

    标签:;  ;  ;  

    汉语普通话中双音节词水平测试系统的设计与研究
    下载Doc文档

    猜你喜欢