基于小波包分析和支持向量机的说话人识别

基于小波包分析和支持向量机的说话人识别

论文摘要

说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出说话人的过程,它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景,得到人们越来越多的研究。本文从语音信号的预处理开始分析,采用短时能频值端点检测算法对语音信号进行了端点检测,滤除语音信号的无声段。重点比较了该算法与双门限语音端点检测方法的性能,实验证实短时能频值端点检测算法能很好的区分语音端点。说话人识别系统中,最重要的是能够从语音片断中提取代表说话人独有特征的稳定参数。针对短时傅立叶分析在提取说话人特征参数时的缺陷,本文从听觉感知特性出发,研究了两种说话人识别特征,首先研究了基于小波包分析代替傅立叶变换的一种新的特征参数;然后给出了衡量各种特征参数识别能力的F比准则,利用F比准则构造出另一种新的混合特征参数。分类器设计部分重点研究了支持向量机,构建了支持向量机分类器。支持向量机算法是基于结构风险最小化原则的,采用一个非线性核函数来表示特征空间的内积,在小样本情况下具有很大的优势,有较好的泛化推广能力。通过特征提取阶段,提取出新的特征参数,将其生成基于SVM的特征向量序列,最后使用支持向量机分类器,基于样本进行训练和测试,实现说话人的分类识别。在自己建立实验语音库的基础上,通过采用不同时间段语音、不同信噪比和不同SVM核函数,用本文所构造的两种新的特征参数与MFCC参数进行了对比实验,结果表明了本文所提出的两种新特征参数有更好的鲁棒性,能够在各种环境下有效地提高说话人识别系统的识别性能。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文研究目的和意义
  • 1.2 国内外研究和发展现状
  • 1.3 说话人识别的基本原理
  • 1.3.1 说话人识别系统
  • 1.3.2 说话人识别的分类
  • 1.4 说话人识别的主要方法
  • 1.5 论文的研究内容及结构安排
  • 第2章 语音信号预处理和常用特征
  • 2.1 语音信号预处理
  • 2.1.1 语音信号的数字化
  • 2.1.2 语音信号的预处理
  • 2.1.3 常用语音信号端点检测
  • 2.1.4 能频值法语音信号端点检测
  • 2.2 语音信号常用特征
  • 2.2.1 线性预测倒谱系数
  • 2.2.2 美尔频率倒谱参数
  • 2.2.3 其他特征参数
  • 2.3 语音信号特征参数的评价方法
  • 2.3.1 特征参数的评价方法
  • 2.3.2 F比和D比
  • 2.4 基于加权F比的MFCC
  • 2.5 本章小结
  • 第3章 小波分析在说话人识别中的应用
  • 3.1 小波分析基础
  • 3.1.1 小波变换的定义
  • 3.1.2 连续小波变换的定义
  • 3.1.3 离散小波变换
  • 3.2 多分辨率分析与Mallat算法
  • 3.2.1 多分辨分析
  • 3.2.2 Matllat算法
  • 3.3 小波包分析
  • 3.4 常用小波函数
  • 3.5 基于小波包的语音特征提取
  • 3.5.1 小波包对语音频带的划分
  • 3.5.2 小波包语音特征提取过程
  • 3.5.3 基于加权F比的WPTC
  • 3.6 本章小结
  • 第4章 基于支持向量机分类器的设计
  • 4.1 统计学习理论
  • 4.1.1 VC维
  • 4.1.2 推广性的界
  • 4.1.3 结构风险最小化
  • 4.2 支持向量机
  • 4.2.1 最优分类超平面
  • 4.2.2 支持向量机的核函数
  • 4.2.3 支持向量机的分类学习算法
  • 4.2.4 支持向量机的多分类划分
  • 4.3 支持向量机的模型选择
  • 4.4 LIBSVM软件包简介
  • 4.5 本章小结
  • 第5章 实验结果与分析
  • 5.1 实验的软硬件环境
  • 5.2 语音数据库的构成
  • 5.3 实验结果与分析
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].不同言语风格对法庭说话人识别的影响[J]. 中国刑警学院学报 2020(03)
    • [2].细菌趋药性算法在说话人识别中的应用[J]. 宿州学院学报 2017(11)
    • [3].基于修正Fukunaga-Koontz变换的说话人识别方法[J]. 电子器件 2018(04)
    • [4].说话人识别中基于深度信念网络的超向量降维的研究[J]. 电脑知识与技术 2017(22)
    • [5].基于Mahalanobis距离的说话人识别模型研究[J]. 中国语音学报 2016(00)
    • [6].基于自适应同源方差控制的法庭自动说话人识别[J]. 应用科学学报 2014(06)
    • [7].一种低信噪比下的说话人识别算法研究[J]. 计算机应用与软件 2014(12)
    • [8].基于元音共振峰特征的法庭说话人识别[J]. 中国刑警学院学报 2014(02)
    • [9].应用似然比框架的法庭说话人识别[J]. 数据采集与处理 2013(02)
    • [10].基于判别邻域嵌入算法的说话人识别[J]. 电子与信息学报 2019(07)
    • [11].深浅层特征及模型融合的说话人识别[J]. 声学学报 2018(02)
    • [12].基于AutoEncoder DBN-VQ的说话人识别系统[J]. 计算机技术与发展 2018(02)
    • [13].基于分层识别的快速说话人识别研究[J]. 计算机工程与科学 2018(07)
    • [14].特征音方法在说话人识别中的应用[J]. 计算机系统应用 2013(08)
    • [15].自组织特征映射神经网络在说话人识别中的应用[J]. 科技信息 2009(01)
    • [16].基于聚类分析的说话人识别研究[J]. 仪器仪表用户 2008(01)
    • [17].弯折滤波器在说话人识别的鲁棒特征提取中的应用[J]. 计算机系统应用 2017(12)
    • [18].说话人识别算法鲁棒性研究[J]. 南京工程学院学报(自然科学版) 2017(03)
    • [19].反蓄意模仿说话人识别系统中特征参数提取的研究[J]. 微型机与应用 2016(12)
    • [20].基于说话人识别的门禁系统的设计[J]. 才智 2012(12)
    • [21].与文本无关说话人识别特征提取的改进[J]. 电声技术 2008(11)
    • [22].面向说话人识别的甘肃临夏少数民族方言语音库的建设[J]. 兰州文理学院学报(自然科学版) 2019(06)
    • [23].基于压缩感知的鲁棒性说话人识别参数研究[J]. 计算机技术与发展 2016(03)
    • [24].基于组合特征参数的说话人识别系统设计[J]. 信息与电脑(理论版) 2014(20)
    • [25].基于小波包分解的抗噪说话人识别特征参数[J]. 通信技术 2010(12)
    • [26].基于具有深度门的多模态长短期记忆网络的说话人识别[J]. 激光与光电子学进展 2019(03)
    • [27].说话人识别中的分数域语速归一化[J]. 清华大学学报(自然科学版) 2018(04)
    • [28].基于因子分析概率统计模型的说话人识别[J]. 安阳师范学院学报 2017(05)
    • [29].说话人识别技术及其在工厂自动控制系统中的应用[J]. 企业技术开发 2015(08)
    • [30].与文本无关说话人识别[J]. 计算机与数字工程 2014(02)

    标签:;  ;  ;  ;  ;  

    基于小波包分析和支持向量机的说话人识别
    下载Doc文档

    猜你喜欢