适用于特定人群的声纹识别系统研究

论文摘要

声纹识别技术是一种基于人类语音信息所表征出来的生理与行为特征实现鉴别或自动识别说话人身份的应用技术,它的应用可以为当今信息社会提供更方便和更可靠的身份识别实现方法。因此,研究开发声纹识别系统具有非常重要的实用意义。声纹识别系统一般由语音信号预处理、特征参数提取以及模式匹配判断等几个主要功能模块组成。本论文在分析声纹识别技术基本原理及其关键技术问题的基础上,设计了一种适用于特定人群的声纹识别系统。论文分别就语音信号预处理、特征参数提取、模式匹配判断三个功能模块进行了具体设计,实验结果分析证明该声纹识别系统具备可行性和实用性。本论文的创新点主要体现在通过整合与改进线性预测倒谱系数和Mel频率倒谱系数的表示方法来提高语音特征参数的提取准确性,结合动态时间规整和矢量量化两种模式匹配判断方法进行识别来反映说话人的个体特征,包括说话人的声道特性、听觉特性及语音的动态变化,从而实现具有高识别率的声纹识别系统。

论文目录

摘要

Abstract

第一章绪论

1.1 声纹识别技术简介

1.2 声纹识别系统实现原理

1.3 声纹识别的关键技术

1.4 本论文的主要工作

第二章语音信号预处理技术

2.1 语音信号的产生及基本分类

2.2 语音信号的数字模型

2.2.1 激励模型

2.2.2 声道模型

2.2.3 辐射模型

2.3 语音信号预处理技术

2.3.1 语音信号的采样与量化

2.3.2 预加重处理

2.3.3 分帧与加窗

2.3.4 语音信号端点检测

2.4 本章小结

第三章语音特征参数提取技术

3.1 语音特征参数及基本类型

3.2 LPCC系数

3.2.1 线性预测分析的基本原理

3.2.2 LPCC系数的提取

3.3 MFCC系数

3.3.1 Mel频率

3.3.2 MFCC系数的提取

3.4 特征参数优化技术

3.4.1 倒谱提升窗口

3.4.2 差分倒谱系数

3.5 本章小结

第四章语音识别模式匹配判断技术

4.1 模式匹配判断基本原理及方法

4.2 DTW技术

4.3 VQ技术

4.3.1 矢量量化的基本原理

4.3.2 失真测度

4.3.3 码书的形成

4.3.4 基于VQ技术的声纹识别

4.4 本章小结

第五章闭集应用的声纹识别系统设计

5.1 系统总体设计

5.2 系统关键模块的具体实现

5.2.1 语音信号预处理

5.2.2 语音特征参数提取

5.2.3 模式匹配判断

5.3 系统兑现实验

5.3.1 实验所用语音

5.3.2 与文本相关实验

5.3.3 与文本无关实验

5.4 实验结果分析

5.5 本章小结

第六章总结与展望

6.1 工作总结

6.2 下一步工作

参考文献

硕士期间的工作成果

致谢

适用于特定人群的声纹识别系统研究

论文摘要

论文目录

相关论文文献

猜你喜欢