汉语语音合成系统的改进与实现

汉语语音合成系统的改进与实现

论文摘要

语音作为人机交互手段这一趋势已经初见倪端,语音作为人机交互手段包含两个方面:语音合成和语音识别。通常语音合成指的是文本转语音,即把文字按语音处理规则转换为声音并输出。一般来说语音合成系统包含三个模块:文本处理模块、韵律处理模块、声音合成模块。文本处理模块处于语音合成系统的前端,其内容有文本分词、非标准词正则化、字音转换。韵律处理模块的主要工作是从文本中提取韵律结构、重音和语调等与韵律有关的信息。声音合成模块是语音合成系统的后端模块,主要工作是合成声音并对其进行修改与输出。为了提高汉语语音合成系统合成语音的可懂度以及自然度,本文重点研究了文本处理模块和韵律处理模块,所做具体工作如下:(1)分析了语音合成系统的整体框架,理解了系统各个模块的主要作用以及工作原理。鉴于PSOLA在语音合成模块中的重要作用,重点研究了PSOLA的分类以及实现过程,并将它应用到语音合成原型系统中。(2)针对文本处理模块做了研究,并对多音字处理方法做了改进与实现。本文一共实现了两种多音字处理方法:一种是静态的依词判音法,一种是动态的词性规则判音法。依词判音法是基于词库匹配的判音法,词性规则判音法是基于C4.5的决策树判音法。(3)针对韵律处理模块做了研究,并对韵律结构预测方法做了改进。改进后的韵律结构预测方法用HTK对一定规模标注好的韵律词或韵律短语的词性词长序列进行训练,得到对应的隐马尔科夫模型。然后用训练好的隐马尔科夫模型进行韵律结构预测。在模型训练过程中采用Good Turing法对模型进行参数平滑。(4)搭建语音合成原型系统,并对原型系统进行评测。评测数据表明本文工作的确能够帮助提高汉语语音合成系统合成语音的可懂度与自然度。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 语音合成的发展历史和研究现状
  • 1.2 语音合成系统面临的问题以及发展方向
  • 1.3 本文的研究内容
  • 1.4 论文的结构安排
  • 2 语音合成系统的整体框架
  • 2.1 文本处理模块
  • 2.2 韵律处理模块
  • 2.3 声音合成模块
  • 2.3.1 声音合成模块中用到的算法
  • 2.3.2 PSOLA算法
  • 2.4 本章小结
  • 3 文本处理模块的实现
  • 3.1 文本分词
  • 3.1.1 汉语分词的困难
  • 3.1.2 基于字符串匹配的分词方法
  • 3.2 非标准词正则化
  • 3.2.1 歧义非标准词的消歧
  • 3.2.2 标准词的生成
  • 3.3 字音转换中的多音字问题
  • 3.3.1 字音转换模块简介
  • 3.3.2 多音字给汉语语音合成带来的困难
  • 3.4 基于BOYER-MOORE匹配的依词判音法
  • 3.4.1 依词判音的原理
  • 3.4.2 Boyer-Moore算法
  • 3.4.3 依词判音实验
  • 3.5 基于C4.5的词性规则判音法
  • 3.5.1 词性规则判音法原理
  • 3.5.2 C4.5算法
  • 3.5.3 特征的选取
  • 3.5.4 词性规则判音法实验
  • 3.6 本章小结
  • 4 汉语韵律结构预测的实现
  • 4.1 汉语韵律特征与韵律结构
  • 4.1.1 韵律词
  • 4.1.2 韵律短语
  • 4.1.3 语调短语
  • 4.2 中文韵律结构预测方法
  • 4.2.1 中文韵律结构预测
  • 4.2.2 中文韵律结构预测方法
  • 4.3 基于隐马尔科夫模型的韵律层级结构预测
  • 4.3.1 隐马尔科夫模型
  • 4.3.2 特征的选取
  • 4.3.3 模型的选用
  • 4.3.4 实验
  • 4.4 本章小结
  • 5 基于本文工作的语音合成原型系统
  • 5.1 构建系统
  • 5.2 系统测试
  • 5.2.1 测试语料
  • 5.2.2 评测标注
  • 5.2.3 评测步骤
  • 5.2.4 评测结果
  • 5.2.5 结果分析
  • 5.3 本章小结
  • 6 总结与展望
  • 6.1 工作总结
  • 6.2 工作展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].藏语语音合成系统的关键技术研究[J]. 西藏大学学报(自然科学版) 2016(02)
    • [2].中文语音合成系统的设计与实现[J]. 计算机系统应用 2017(02)
    • [3].藏语天气预报语音合成系统的初步研究[J]. 电脑与电信 2009(01)
    • [4].基于VB6.0的多语音合成系统的实现[J]. 武汉理工大学学报(信息与管理工程版) 2008(06)
    • [5].一种SmartFusion FPGA的快速语音合成系统设计[J]. 广东工业大学学报 2014(02)
    • [6].英语语音合成系统超前端文本分析知识库的构建[J]. 电脑与信息技术 2013(05)
    • [7].语音合成系统中高质量的韵律生成[J]. 中文信息学报 2008(02)
    • [8].基于动态基元选取的真实感可视语音合成系统[J]. 系统仿真学报 2008(S1)
    • [9].基于FAQ的语音合成系统的设计与实现[J]. 黑龙江科技信息 2009(08)
    • [10].英国爱丁堡大学项目:Festival语音合成系统[J]. 电脑与电信 2013(05)
    • [11].混合单元选择语音合成系统的目标代价构建[J]. 计算机工程与应用 2018(24)
    • [12].解读“智能交互”的核心技术[J]. 人工智能 2018(01)
    • [13].基于HMM的语音合成系统的模型压缩[J]. 电声技术 2010(07)
    • [14].面向情感语音合成的言语情感描述与预测[J]. 清华大学学报(自然科学版) 2017(02)
    • [15].采用重音调整模型的HMM语音合成系统[J]. 清华大学学报(自然科学版) 2011(09)
    • [16].基于InterPhonic CE语音合成系统的二次开发[J]. 农业网络信息 2011(02)
    • [17].基于HMM的缅甸语语音合成系统设计与实现[J]. 云南大学学报(自然科学版) 2020(01)
    • [18].解码大脑,“说出”你的想法[J]. 老同志之友 2019(15)
    • [19].中文语音合成系统中的一种两层韵律结构生成体系(英文)[J]. 自动化学报 2010(11)
    • [20].语境相关的音素级语音合成系统中拼接平滑算法[J]. 清华大学学报(自然科学版) 2008(S1)
    • [21].预测未来,要有指数型增长思想[J]. 商学院 2014(05)
    • [22].嵌入式中文语音合成系统非周期成分音节层建模方法[J]. 清华大学学报(自然科学版) 2013(06)
    • [23].中文语音合成系统过程分析及实现初探[J]. 现代计算机(专业版) 2010(04)
    • [24].基于XF-S4240的文本语音合成系统实现[J]. 微计算机信息 2009(35)
    • [25].人脸语音动画中基于PSOLA的情感语音合成系统[J]. 计算机应用研究 2012(03)
    • [26].农村远程信息呼叫中心构建和应用探讨[J]. 农业网络信息 2009(10)
    • [27].深度学习语音合成技术研究[J]. 计算机时代 2020(09)
    • [28].基于最小合成单元的维吾尔音库设计[J]. 通信技术 2012(04)
    • [29].基于HMM的藏语拉萨话语音合成技术研究[J]. 西北民族大学学报(自然科学版) 2011(02)
    • [30].汉语神经分析系统研究现状与展望[J]. 中国科学:信息科学 2015(07)

    标签:;  ;  ;  ;  

    汉语语音合成系统的改进与实现
    下载Doc文档

    猜你喜欢