基于SVM和GMM的说话人辨识方法研究

基于SVM和GMM的说话人辨识方法研究

论文摘要

说话人识别是根据语音波形中反映说话人生理和行为特征的语音参数,自动识别出相应说话人的过程。它是语音信号处理的一个重要研究方向,作为一种生物认证技术,具有广泛的应用前景,促使越来越多的人对其进行研究。目前,基于闭集的说话人识别已经取得了比较好的进展,但是基于开集的说话人识别的识别性能还有待提高。开集和闭集是对测试说话人集的一种划分,当测试的说话人集合仅局限在训练集内时,称其为基于闭集的说话人识别;当测试的说话人集合没有训练集限制,任何话者,不论训练与否,均能作为测试集合中的一员,则称其为基于开集的说话人识别。基于开集的说话人识别,不同于闭集说话人识别的关键是开集说话人识别不仅要对测试话者是否是训练集内的话者进行判断,而且若是训练集内的话者,则还要对其进行识别,识别出其是集内的哪个话者。本文致力于对基于开集说话人识别的研究,提出了一种新的识别方法,即基于SVM和GMM的说话人辨识方法。说话人辨识是指对说话人进行分辨和识别,分辨测试话者是否是训练集内话者,若是训练集内话者则还要识别出其是训练集内的哪位话者。用到的模型是SVM-GMM模型,该模型是结合了支持向量机(SVM)和高斯混合(GMM)两种模型。支持向量机模型是以统计学习理论中VC维理论和结构风险最小原理为基础,根据有限的样本信息在模型的复杂性与学习能力之间寻求最佳折中,获得了较好的推广能力。大量的实验已经证实支持向量机有着优秀的分类能力,基于此,本研究将其选为第一步粗分类模型。而高斯混合模型是用多个高斯分布的线性组合,拟合说话人的特征分布。它能很好的描述说话人语音特征的内部的相似性。前人的研究也表明该模型是在说话人确认系统表现出良好的性能。故本研究选用高斯混合模型作为第二步精细的确认模型。在识别阶段,首先用支持向量机模型对测试的话者进行粗分类,然后再用高斯混合模型对分类结果进行确认,判断测试话者是否就是其在粗分类中所分到的类别。若是,则表明该测试话者就是其所分到类别所对应的话者;若否,则表明该测试话者是训练集外话者。本研究就是通过这种方法来实现对说话人进行分辨的。实验表明,本研究所提出的方法是有效的,能有效的提高对集外话者的分辨率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究的背景与意义
  • 1.2 说话人识别的研究与发展
  • 1.3 本课题研究的主要工作
  • 1.4 论文组织结构
  • 第2章 说话人辨识
  • 2.1 说话人识别概述
  • 2.2 说话人识别的基本原理
  • 2.3 说话人识别的基本方法
  • 2.4 本章小结
  • 第3章 语音信号的预处理和特征提取
  • 3.1 语音信号的预处理
  • 3.1.1 预加重
  • 3.1.2 加窗分帧
  • 3.1.3 端点检测
  • 3.2 特征提取
  • 3.2.1 MFCC特征参数
  • 3.2.2 MFCC特征参数提取
  • 3.3 本章小结
  • 第4章 支持向量机
  • 4.1 统计学习理论与支持向量机
  • 4.2 SVM的基础理论
  • 4.2.1 线性判决边界
  • 4.2.2 非线性判决边界
  • 4.3 SVM的多类分类方法
  • 4.4 SVM在说话人识别中的应用
  • 4.4.1 SVM在说话人辨认中的应用
  • 4.4.2 SVM在说话人确认中的应用
  • 4.5 本章小结
  • 第5章 高斯混合
  • 5.1 模型描述
  • 5.2 高斯混合模型参数估计
  • 5.2.1 EM算法原理
  • 5.2.2 EM算法估计GMM参数
  • 5.3 高斯混合模型在说话人识别中的应用
  • 5.3.1 高斯混合模型应用于说话人辨认
  • 5.3.2 高斯混合模型应用于说话人确认
  • 5.3.3 确认阈值的选取
  • 5.4 本章小结
  • 第6章 基于SVM-GMM的说话人辨识
  • 6.1 本课题所要解决的问题
  • 6.2 SVM-GMM模型
  • 6.3 实验与分析
  • 6.3.1 实验过程
  • 6.3.2 实验结果与分析
  • 6.4 本章小结
  • 第7章 总结与展望
  • 7.1 总结
  • 7.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文和参加科研项目情况
  • 相关论文文献

    • [1].我国税收优惠对集成电路企业发展的效应分析——基于动态面板广义矩(GMM)估计[J]. 税务研究 2020(02)
    • [2].基于GMM托肯配比相似度校正得分的说话人识别[J]. 清华大学学报(自然科学版) 2017(01)
    • [3].金融集聚、人力资本与经济增长——基于省际动态面板数据差分GMM分析[J]. 山东工商学院学报 2017(01)
    • [4].制造业企业特征、融资约束和研发支出——基于系统GMM动态面板的估计[J]. 财会通讯 2017(15)
    • [5].一种基于GMM和多项式拟合的语音编码改进算法[J]. 南京师范大学学报(工程技术版) 2017(02)
    • [6].对外贸易对城市人口规模的影响——基于我国百个地级市的系统GMM研究[J]. 国际商务(对外经济贸易大学学报) 2016(02)
    • [7].人力资本增长对我国工业资本回报率提升的影响——基于地区与行业视角的GMM方法[J]. 软科学 2016(05)
    • [8].价值链低端生产是否限制了中国的资本回报率——基于省级动态面板数据GMM方法[J]. 国际贸易问题 2015(06)
    • [9].我国人口出生率及其影响因素研究——基于动态GMM模型和门限模型的实证分析[J]. 价格理论与实践 2019(11)
    • [10].基于GMM改进的信息系统安全态势实时预测研究[J]. 计算机应用与软件 2017(02)
    • [11].财政政策对产业结构优化的影响——基于我国省级面板数据的系统GMM分析[J]. 公共财政研究 2017(03)
    • [12].信息化影响新型城镇化的经验估计与机制分析——基于GMM动态面板模型[J]. 经济与社会发展 2017(03)
    • [13].基于系统GMM的国防支出与政府债务关系研究[J]. 天津大学学报(社会科学版) 2015(02)
    • [14].加速折旧促进制造业投资研究——基于GMM估算的实证分析[J]. 会计之友 2015(15)
    • [15].政府规模对经济增长影响效应的GMM评价——基于市级面板数据的实证分析[J]. 北京工业大学学报(社会科学版) 2015(05)
    • [16].综合经营、专业化与健康保险业务发展——基于系统GMM估计的动态面板模型分析[J]. 保险研究 2014(03)
    • [17].基于GMM的说话人识别系统设计与实现[J]. 微处理机 2014(03)
    • [18].新经济地理视角下产业集聚对税收竞争的影响——基于GMM估计的省级动态面板数据分析[J]. 生产力研究 2014(06)
    • [19].金融发展、融资约束与环保投资——基于中国省级面板数据的GMM检验[J]. 现代经济信息 2014(20)
    • [20].地方政府腐败会影响私人投资积极性吗?——基于动态面板模型的系统GMM分析[J]. 南方经济 2012(02)
    • [21].基于GMM的黄瓜病害图像建模[J]. 安徽农业科学 2011(34)
    • [22].城市水价预测长期边际成本模型的GMM参数估计[J]. 自然资源学报 2010(09)
    • [23].基于聚类优化GMM提高说话人识别性能的研究[J]. 计算机技术与发展 2009(04)
    • [24].基于GMM的说话人识别研究与实践[J]. 计算机与数字工程 2009(06)
    • [25].利率期限结构模型估计中的GMM方法述评[J]. 统计与决策 2008(09)
    • [26].产业结构变化背景下创业对经济增长的影响——基于2000—2015年省际面板数据的GMM分析[J]. 湖北经济学院学报(人文社会科学版) 2019(10)
    • [27].东道国基础设施水平对我国对外直接投资的影响——基于“一带一路”国家的系统GMM研究[J]. 对外经贸 2017(03)
    • [28].基于多特征融合GMM的阴影检测策略研究[J]. 河北工业科技 2014(05)
    • [29].中国空气污染库兹涅茨曲线的实证研究——基于动态面板系统GMM与门限模型检验[J]. 经济问题 2014(04)
    • [30].基于GMM的说话人识别[J]. 广西物理 2011(01)

    标签:;  ;  ;  ;  ;  ;  

    基于SVM和GMM的说话人辨识方法研究
    下载Doc文档

    猜你喜欢