嵌入式语音合成技术的研究

嵌入式语音合成技术的研究

论文摘要

随着社会经济的发展与科技技术水平的不断提高,机器人在人类生产活动和社会活动中的应用日益广泛。在人机交互过程中,语音是一种较为理想的信息交流方式。因此,语音识别与语音合成技术成为人机交互研究领域的热点。目前基于计算的中文语音合成技术比较成熟,合成语音质量也比较高,如语音电子邮件。但是,在嵌入式系统中由于存储容量和处理器运算速度的限制,使得在嵌入式系统中合成语音的自然度、可懂度还不够高。其中一个重要原因就是合成语音速率不可调节。本文针对此问题,深入研究了嵌入式系统中语音速率的控制方法,提出了特殊字符标注的方法,提高了合成语音的自然度、可懂度。本文首先深入研究了语音信号在时域和频率分析方法的基本理论。在时域分析中讨论了短时加窗、端点检测、短时平均能量、短时过零率以及自相关函数等相关问题;在频域分析中讨论了短时傅里叶变换法、语谱图等相关问题。详细论述了如何利用语音信号的时域特征和频率特征进行端点检测、基音周期估计、共振峰估计的方法。在MATLAB环境下对讨论的各种算法进行了仿真、验证。本文研究的最终目的是利用语音合成技术实现无人自动解说系统,即将以文本形式存储的内容转换为语音信号方式输出。为了解决利用中文语音合成芯片构成的文语转换系统语音速率不可调节的缺点。本文提出了特殊字符标注的方法,即先用特殊字符对输入的文本进行标注,把文本分成了不同类型的信息帧,然后将信息帧传输给单片机。系统自动判断信息帧的类型,根据不同的信息帧设置不同的延迟时间从而达到调节播放语音速率的目的。通过实验测试结果表明本文提出的特殊字符标注方法,不仅实现了语音速率的随意调节,同时也提高了播放语音的可懂度和自然度。并且与传统的PCM编码方法相比,采用文语转换方式所需要的存储器容量至少可以节省80%。使得语音合成能够在嵌入式系统中实现。本课题在研究语音合成技术的基础上,设计并研制了嵌入式中文语音合成系统。该系统应用到电子技术实验教学中,经过实际应用测试取得了很好的应用效果。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 课题来源
  • 1.2 课题背景及学术意义
  • 1.3 语音合成发展历史及国内外研究现状
  • 1.3.1 国外研究历史与现状
  • 1.3.2 国内研究历史与现状
  • 1.4 语音合成系统的应用及发展方向
  • 1.5 研究内容及组织结构
  • 2 语音合成的基本原理
  • 2.1 概述
  • 2.2 语音信号的特征分析
  • 2.2.1 短时加窗处理
  • 2.2.2 时域分析方法
  • 2.2.3 频域分析方法
  • 2.3 语音信号特征应用
  • 2.3.1 端点检测
  • 2.3.2 基音周期估计
  • 2.3.3 共振峰估计
  • 2.4 语音合成基本方法
  • 2.4.1 波形拼接合成
  • 2.4.2 参数合成
  • 2.4.3 汉语按规则合成
  • 2.5 小结
  • 3 线性预测语音合成技术的研究
  • 3.1 线性预测的基本原理
  • 3.2 线性预测方程组的解法
  • 3.3 线性预测系数的应用
  • 3.4 小结
  • 4 基于语音合成的自动解说系统
  • 4.1 系统总体框架
  • 4.2 系统的硬件实现平台
  • 4.2.1 处理芯片的选型
  • 4.2.2 语音合成芯片
  • 4.2.3 系统硬件电路设计
  • 4.3 系统的软件设计
  • 4.3.1 主程序设计
  • 4.3.2 语音合成程序设计
  • 4.3.3 程序编译和调试
  • 4.4 总结
  • 5 系统测试与结果分析
  • 5.1 语音合成方法的MATLAB 仿真
  • 5.1.1 三门限端点检测
  • 5.1.2 基音周期估计
  • 5.1.3 LPC 算法的MATLAB 实现
  • 5.1.4 共振峰及带宽估计
  • 5.2 嵌入式系统中语音速率调节测试结果
  • 5.2.1 语音速率调节测试结果
  • 5.2.2 调节误差分析
  • 5.3 自动解说系统的性能评测
  • 5.3.1 系统测试方法
  • 5.3.2 结果分析
  • 5.4 小结
  • 6 总结与展望
  • 致谢
  • 参考文献
  • 附录
  • A. 作者在攻读硕士期间发表的论文目录
  • B. 作者在攻读学位期间参与的科研项目
  • C. 语音合成程序
  • D. 自动解说系统PCB 板图
  • E. 自动解说系统实物图
  • F. 自动解说系统工作图
  • 相关论文文献

    标签:;  ;  ;  ;  

    嵌入式语音合成技术的研究
    下载Doc文档

    猜你喜欢