多语种语音情感识别的研究与实现

多语种语音情感识别的研究与实现

论文摘要

情感和情绪在人类生活中起着很重要的作用,是自身生活和社会交往不可缺少的重要组成部分,而语音信息则是传递情感信息最直接的方式。随着现代科学的发展,人们对人工智能的要求也越来越高,对情感信息的处理已经成为人工智能发展的一个重要研究方向。在传统的语音信号处理过程中,计算机并没有被赋予理解操作者情绪的能力,只局限于理解语音信号的表层符号信息,更不能实现类似人类之间交流的情感互动,而语音情感信息处理这个研究方向的最终目的就是要赋予人工智能类似人一样的观察、理解语音信号中的情感信息,以及表达各种情感的能力,它是综合听觉生理学、心理学、认知科学以及与信息处理等多学科的研究课题。论文首先概述了课题的研究背景以及语音情感处理的发展历史,并简单回顾了情感空间的界定方法和人机通信中情感语音处理技术的研究发展现状。通过对语音信号处理的深入研究,选取了适用于本实验的语音情感参数。论文中采用基频构造参数、能量构造参数、时间构造参数和共振峰构造参数作为分析用的基本韵律特征参数,对德语情感语音样本库和普通话情感库进行参数提取,分析。在模式识别方面,对比使用了三种方法:经典的主元分析法(PCA),基于模糊隶属函数的模糊模式识别法和高斯混合模型法(GMM)。并对模糊模式识别方法做出了改进,将PCA的最大可分性原理运用到参数有效性分析上,获得了不错的效果,平均识别率达到80%以上。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 情感计算
  • 1.2 语音情感识别
  • 1.2.1 语音情感的分类
  • 1.2.2 语音与情感模式的对应关系
  • 1.2.3 语音情感识别的关键技术问题
  • 1.2.4 国内外相关研究
  • 1.2.4.1 国外相关研究
  • 1.2.4.2 国内相关研究
  • 1.3 本文研究内容、结果及创新点
  • 第二章 情感语音数据库
  • 2.1 情感数据库建立的原则
  • 2.2 情感语音数据的分类
  • 2.2.1 自然型情感语音
  • 2.2.2 表演型情感语音
  • 2.2.3 引导型情感语音
  • 2.3 国内外具有代表性的情感语音数据库
  • 2.4 实验选用的数据库
  • 2.5 小结
  • 第三章 语音信号分析
  • 3.1 语音信号的数字化和预处理
  • 3.1.1 采样和量化
  • 3.1.2 预处理
  • 3.2 语音信号的时域分析
  • 3.2.1 短时能量及短时平均幅度分析
  • 3.2.2 短时过零率分析
  • 3.2.3 短时相关分析
  • 3.2.4 短时平均幅度差函数
  • 3.3 语音信号的倒谱分析
  • 3.3.1 同态信号处理的原理
  • 3.3.2 倒谱分析
  • 3.4 语音信号的线性预测分析
  • 3.4.1 线性预测分析的原理
  • 3.4.2 预测系数求解
  • 3.5 小结
  • 第四章 语音情感特征参数的选择和提取
  • 4.1 语音情感特征参数的选择
  • 4.2 各情感特征参数的提取
  • 4.2.1 振幅相关参数
  • 4.2.2 时间相关参数
  • 4.2.2.1 发音持续时间
  • 4.2.2.2 语速
  • 4.2.3 基音相关参数
  • 4.2.3.1 基音检测
  • 4.2.3.2 基音检测的后处理
  • 4.2.4 共振峰参数
  • 4.3 小结
  • 第五章 语音情感的分类识别
  • 5.1 主分量分析法
  • 5.1.1 PCA 方法的数学模型
  • 5.1.2 PCA 方法在语音情感识别中的应用
  • 5.1.3 实验结果及分析
  • 5.2 基于模糊集隶属函数的语音情感识别
  • 5.2.1 模糊模式识别概念
  • 5.2.2 模糊模式识别在情感语音中的应用
  • 5.2.2.1 利用模糊熵进行有效性分析
  • 5.2.2.2 将PCA 方法用于参数有效性的度量
  • 5.2.3 实验结果及分析
  • 5.3 高斯混合模型
  • 5.3.1 单一高斯机率密度函数的参数估测法
  • 5.3.2 高斯混合密度函数的参数估测法
  • 5.3.3 高斯混合模型在语音情感识别中的应用
  • 5.3.4 实验结果与分析
  • 5.4 语音情感识别原型系统
  • 5.5 小结
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 进一步的工作
  • 6.3 语音情感的应用前景
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    多语种语音情感识别的研究与实现
    下载Doc文档

    猜你喜欢