汉语语音合成中自动切分技术的研究

汉语语音合成中自动切分技术的研究

论文摘要

基于大语料库的拼接合成由于其合成的语音清晰自然,而得到了广泛的应用。由于汉语语音合成中自动切分的精度将直接影响到语料库中基元的质量,进而直接影响到合成出的语音的质量,因此自动切分技术已经成为了汉语语音合成中的一个重要课题。在自动切分技术的研究中,作者详细地调查了自动切分的研究现状。根据研究现状,采取了目前较主流的基于隐马尔科夫模型的强制对齐的方法用于自动切分基线系统的构建中。在自动切分基线系统的构建中,作者提出了一种新的模型参数自适应方法,结果证明可以较大程度地提高自动切分的精度。作者还做了大量的实验来验证相关的语音参数在自动切分中的效果,大多数参数的挑选都被同类论文忽视,但在实际系统中却有着重要的影响。在现有的自动切分技术中,大多数研究都是基于单一模型,上下文相关或上下文无关的模型。采用单一模型内在的问题是每个边界单元只有一个模型预测的时间值,而没有考虑不同的模型对于相同声学环境下的边界的不同的作用。作者在论文中提出了以下两种方法来找到处于类似声学环境下的边界与不同模型之间的映射规则,进一步用映射规则来为每个边界找到最合适的模型。第一,利用混合模型进行汉语语音合成库的自动切分技术。所有的边界单元按照其所处的声学环境被分为十一组。在这些边界组中,将利用混合模型训练得到边界组与声韵母单音子模型(IFMM)、半音节单音子模型(SSMM)。声韵母三音子模型(IFTM)之间的映射规则。第二,使用C4.5决策树分类的算法,来训练处于相似声学环境下的边界与IFMM、SSMM和IFTM之间的映射规则,通过映射规则,为每个边界单元选取最合适的模型预测时间值。在决策树的构建过程中,问题集的选取和属性的挑选至关重要。在论文中,作者给出了自动切分中,选取问题集的方法,并给出了遗传算法和C4.5决策树默认的算法来进行属性挑选。实验结果显示,在切分精度和边界的偏移上,利用混合模型和决策树分类两种方法都取得了比单一模型进行汉语语音合成库的自动切分技术更好的结果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 语音合成概述
  • 1.1 研究意义
  • 1.2 语音合成基本原理
  • 1.2.1 基于参数的合成技术
  • 1.2.2 基于波形拼接的合成技术
  • 1.3 语音合成应用现状
  • 第二章 自动切分系统概述及基线系统的建立
  • 2.1 自动切分系统概述
  • 2.1.1 什么是自动切分
  • 2.1.2 汉语文语转换系统中研究自动切分系统的必要性
  • 2.2 自动切分系统的研究现状
  • 2.2.1 研究语言的分布
  • 2.2.2 研究时间的分布
  • 2.2.3 研究机构的分布
  • 2.3 自动切分基本原理
  • 2.4 自动切分的评价方式
  • 第三章 基于HMM的强制对齐
  • 3.1 HMM模型的训练
  • 3.1.1 HMM的模型定义
  • 3.1.2 HMM模型训练算法
  • 3.1.3 HMM训练策略
  • 3.3 模型参数自适应
  • 3.4 强制对齐
  • 第四章 汉语文语转化系统中自动切分基线系统的构建
  • 4.1 语音库的正则化
  • 4.1.1 语音库描述
  • 4.1.2 语音库的正则化过程
  • 4.2 感知线性预测系数(PLP)参数求解过程
  • 4.3 模型训练和自适应
  • 4.3.1 说话人无关的模型训练
  • 4.3.2 模型的自适应
  • 4.3.3 加入人工标注的训练数据进行自适应
  • 4.3.4 停顿模型的训练
  • 4.3.5 模型训练和自适应后性能的提高
  • 4.4 用能量确定语句起始的静音
  • 4.5 调整帧移输出的位置
  • 4.6 语音参数配置
  • 4.6.1 IF和IFB的定义
  • 4.6.2 PLP参数配置
  • 4.6.3 帧移参数配置
  • 4.6.4 MLLR和MAP
  • 4.6.5 参数配置
  • 4.7 基线系统的性能
  • 第五章 利用混合模型训练映射规则
  • 5.1 边界分组
  • 5.2 语音合成库在每组中的分布
  • 5.3 利用混合模型方法训练映射规则
  • 5.4 利用混合模型进行自动切分的实验
  • 第六章 利用决策树训练映射规则
  • 6.1 决策树C4.5算法介绍
  • 6.1.1 决策树算法
  • 6.1.2 C4.5决策树算法
  • 6.2 利用决策树分类进行自动切分的流程
  • 6.3 自动切分中决策树的构建
  • 6.3.1 问题集的选取
  • 6.3.2 映射规则训练流程
  • 6.4 利用遗传算法进行属性挑选
  • 6.4.1. 算法中所用到各种进化和遗传学的概念
  • 6.4.2. 遗传算法的原理
  • 6.4.3 遗传算法的步骤和意义
  • 6.4.4. 用遗传算法进行属性挑选
  • 6.5 利用决策树分类进行自动切分的实验
  • 6.6 性能比较
  • 第七章 总结与展望
  • 参考文献
  • 附录
  • 致谢
  • 作者攻读学位期间发表的学术论文目录
  • 相关论文文献

    标签:;  ;  ;  ;  

    汉语语音合成中自动切分技术的研究
    下载Doc文档

    猜你喜欢