稳健语音识别的前端处理研究

稳健语音识别的前端处理研究

论文摘要

稳健语音识别为从带噪语音信号中提取出语音的本质特征,达到对语音进行识别或确认的目的。本文主要研究稳健语音识别的前端处理部分,该部分的主要目的就是排除噪声干扰,提取“干净”语音信号参数。其主要包括以下三部分:端点检测、语音增强和特征提取。首先是端点检测,其目的为排除无声段的干扰,选取出“有意义”的语音段。该部分研究了几种经典的端点检测方法,如:短时能量、平均过零率、双门限检测、频谱熵、功率谱熵还有频带方差方法,相关实验仿真均反映其各自算法特点。通过分析频带方差算法存在不足的情况下,提出了改进算法即子带频带方差端点检测方法,实验结果证明了其优越性。接着研究了语音增强,其目的为提高语音的信噪比和可懂度,它是实现语音识别系统稳健性的一个关键步骤。该部分研究了小波软、硬阈值的不同去噪方法,重点研究了考虑人耳感知特性的仿生小波变换,并将阈值去噪方法应用其中,提出了一种新的基于仿生小波变换的阈值去噪语音增强方法。实验结果表明:该方法在四种实际噪声环境下均优于一些经典方法如:谱减法、维纳滤波和基于离散小波变换的阈值去噪方法,具有更好的语音增强效果。最后研究了特征提取,其目的为去除语音冗余部分,提取反映语音本质特性的参数用于语音识别。该部分主要研究了几种常见的语音特征参数(LPC、LPCC、MFCC),并将MFCC和LPCC进行了比较研究,通过构建的孤立词语音识别平台,证明了MFCC较LPCC作为特征参数能够更好的表征语音信号。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 稳健语音识别的研究背景及意义
  • 1.2 稳健语音识别研究现状
  • 1.3 稳健语音识别的前端处理概述
  • 1.4 本文工作及结构安排
  • 第二章 语音信号预处理及分析
  • 2.1 预处理
  • 2.2 语音信号分析
  • 第三章 端点检测
  • 3.1 基于短时能量和短时平均过零率的端点检测法
  • 3.1.1 短时能量
  • 3.1.2 短时平均过零率
  • 3.1.3 基于短时能量和过零率双门限检测方法
  • 3.2 基于信息熵的端点检测法
  • 3.2.1 基于谱熵
  • 3.2.2 基于功率谱熵
  • 3.3 基于频带方差及其改进子带频带方差端点检测算法
  • 3.3.1 基于频带方差(SV)
  • 3.3.2 基于子带频带方差(SSV)
  • 3.4 小结
  • 第四章 小波阈值去噪语音增强方法
  • 4.1 小波分析简介
  • 4.1.1 小波分析思想
  • 4.1.2 小波变换
  • 4.2 小波阈值去噪方法
  • 4.3 仿生小波阈值去噪法
  • 4.3.1 仿生小波变换
  • 4.3.2 阈值去噪实现
  • 4.3.3 仿真结果与分析
  • 4.4 小结
  • 第五章 语音特征参数提取
  • 5.1 线性预测系数(LPC)分析
  • 5.2 线性预测倒谱系数(LPCC)
  • 5.3 梅尔倒谱系数(MFCC)
  • 5.3.1 MFCC 的提取
  • 5.3.2 差分MFCC 和特征提升
  • 5.3.3 MFCC 系数与LPCC 系数比较
  • 5.4 孤立数字识别实验
  • 5.5 小结
  • 第六章 总结展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表论文清单
  • 相关论文文献

    • [1].人工智能下深度学习的语音识别方法分析[J]. 计算机产品与流通 2020(06)
    • [2].基于语音识别的演讲教学系统[J]. 计算机应用 2020(S1)
    • [3].人工智能下深度学习的语音识别方法分析[J]. 电子技术与软件工程 2020(11)
    • [4].语音识别声控小车设计[J]. 中国科技信息 2019(Z1)
    • [5].语音识别大揭秘:计算机如何处理声音?[J]. 中国新通信 2019(04)
    • [6].关于深度学习的语音识别应用研究[J]. 科技经济导刊 2019(12)
    • [7].关于语音识别在空调上的应用与改善[J]. 日用电器 2019(07)
    • [8].语音识别专利技术综述[J]. 河南科技 2019(24)
    • [9].数字语音识别与合成[J]. 电子世界 2019(15)
    • [10].浅谈语音识别[J]. 内蒙古科技与经济 2019(18)
    • [11].基于智能声控需求的语音识别研究[J]. 通讯世界 2019(10)
    • [12].语音识别64年大突破[J]. 机器人产业 2016(06)
    • [13].语音识别为何“叫好不叫座”?[J]. 通信世界 2016(16)
    • [14].语音识别的未来之路[J]. 通信世界 2016(16)
    • [15].动动嘴 让文字自动输入[J]. 电脑爱好者(普及版) 2010(11)
    • [16].带着使命感出发[J]. 英语学习 2017(01)
    • [17].荣威eRX5静态体验 “人性化”语音识别是亮点[J]. 新能源汽车新闻 2017(01)
    • [18].语音识别老祖宗[J]. 经营者(汽车商业评论) 2017(03)
    • [19].智能电视,语音识别或成突破口[J]. 消费指南 2017(05)
    • [20].宝马 用科技打造“未来之家”[J]. 中国汽车市场 2016(11)
    • [21].小学生单词语音识别技能培养研究[J]. 教师博览(科研版) 2017(04)
    • [22].语音识别,或是人工智能下一“风口”[J]. 晚霞 2017(06)
    • [23].端到端语音识别的研究进展与挑战[J]. 中国安防 2020(11)
    • [24].一种低成本语音识别解决方案[J]. 通信技术 2019(12)
    • [25].视频会议系统智能语音识别技术应用研究[J]. 数字技术与应用 2020(05)
    • [26].简述语音识别的实现过程[J]. 科技传播 2019(02)
    • [27].基于深度学习的语音识别方法研究[J]. 智能计算机与应用 2019(02)
    • [28].远场语音识别方法研究[J]. 信息技术与标准化 2018(08)
    • [29].基于深度学习的语音识别方法[J]. 电子技术与软件工程 2019(08)
    • [30].石油石化设备巡检小车语音识别与控制系统设计与实现[J]. 电子设计工程 2017(22)

    标签:;  ;  ;  ;  ;  

    稳健语音识别的前端处理研究
    下载Doc文档

    猜你喜欢