基于内容的音频检索技术的研究

基于内容的音频检索技术的研究

论文题目: 基于内容的音频检索技术的研究

论文类型: 硕士论文

论文专业: 计算机应用

作者: 齐俊英

导师: 孙劲光

关键词: 基于内容的音频检索技术,基于内容的音频自动分类,隐马尔可夫模型,支持向量机,音频特征,音频数据模型

文献来源: 辽宁工程技术大学

发表年度: 2005

论文摘要: 20世纪90年代,多媒体信息检索技术的研究引起了人们的极大兴趣,开始阶段人们的注意力主要集中在基于内容的图像检索和视频检索这两个方面。但随着音频数据的大量出现,人们越来越认识到音频检索的重要性。而音频信号数字处理、语音识别、说话者识别和音乐的自动记谱技术的日益成熟,则为基于内容的音频检索的研究提供了必要的技术准备。 基于内容的音频检索技术在相当多的领域中都具有极大的应用价值,例如,远程教学、卫生医疗、数字图书馆、环境监测、新闻节目检索和娱乐节目的编辑和制作等。其研究内容可以概括为音频内容的自动分类和分割、语音检索、音乐检索、内容的描述和索引、用户查询的构造和细化等几个方面。本文在认真总结了前人的研究成果的基础上,从音频内容的自动分析着手,着重解决音频中基于内容的音频自动分类方面的问题。 本文的主要内容包括以下几个方面:(1) 音频的数据模型;(2) 隐马尔可夫模型模型(HMM)基本理论;(3) 基于HMM的音频内容的自动分类算法。

论文目录:

摘要

ABSTRACT

插图索引

1 绪论

1.1 研究背景和意义

1.2 基于内容的音频检索技术的研究现状

1.3 基于内容的音频检索技术研究的重点

1.4 本文的内容组织和研究工作

2 基于内容的音频检索技术

2.1 引言

2.2 音频的数据模型

2.2.1 音频短时处理技术及其音频特征

2.2.2 线性预测技术及其音频特征

2.2.3 同态处理与倒谱分析及其音频特征

2.2.4 音频和谐度估计算法及其音频特征

2.3 隐马尔可夫模型(HMM)基本理论

2.3.1 HMM的基本思想

2.3.2 HMM基本算法

2.3.2.1 条件概率计算——问题(1)

2.3.2.2 Viterbi算法——问题(2)

2.3.2.3 Baum—Welch算法——问题(3

2.3.3 HMM算法实现中的问题

2.3.3.1 初始模型参数的选取

2.3.3.2 比例因子问题(定标处理)

2.3.3.3 多观察序列的训练

2.3.4 HMM的区分能力的改进

2.3.4.1 MMI和MCE准则的训练算法

2.3.4.2 HMM/NN结合的方法

3 基于内容的音频自动分类算法改进

3.1 引言

3.2 音频特征与提取

3.3 典型的音频分类方法

3.3.1 最小距离法

3.3.2 神经网络

3.3.3 支持向量机

3.3.4 决策树方法

3.4 基于HMM的语音/音乐分类算法的改进

3.4.1 特征分析

3.4.2 分类器的设计

3.4.3 算法分析

3.4.4 小结

3.5 基于HMM的一般音频分类算法的改进

3.5.1 特征分析

3.5.2 MCE准则的HMM学习算法

3.5.3 HMM和SVM相结合的分类器

3.5.4 算法分析

3.5.5 小结

3.6 本章小结

4 结论

4.1 本文的主要工作

4.2 基于内容的音频检索技术未来关注的问题

致谢

参考文献

攻读硕士期间发表的论文

发布时间: 2005-08-30

参考文献

  • [1].基于内容的音频检索技术研究与系统实现[D]. 邬显康.西安电子科技大学2007
  • [2].基于内容的音频检索技术研究与实现[D]. 邢伟利.西北大学2004
  • [3].基于内容的快速音频检索[D]. 孙荣坤.哈尔滨工业大学2010
  • [4].基于内容的分布式音频检索技术研究与实现[D]. 张凤羽.北京邮电大学2012
  • [5].基于内容的音频检索的关键技术研究[D]. 潘文娟.西安电子科技大学2008
  • [6].基于音频指纹的分片音频检索算法的研究[D]. 张永.湖南大学2017
  • [7].海量音频检索算法的分布式实现[D]. 辛月.太原理工大学2018
  • [8].基于内容的音频检索技术研究[D]. 唐杰.北京邮电大学2010
  • [9].基于内容的音频检索研究[D]. 邹益.南京理工大学2007
  • [10].哼唱式音乐检索系统[D]. 魏文华.华中科技大学2007

相关论文

  • [1].基于内容的音频检索技术研究[D]. 唐杰.北京邮电大学2010
  • [2].基于内容的音频检索研究[D]. 孙国成.华中科技大学2008
  • [3].音频分类与分割技术研究[D]. 白亮.国防科学技术大学2004
  • [4].基于隐马尔可夫模型的音频检索[D]. 宋文静.南京理工大学2004

标签:;  ;  ;  ;  ;  ;  

基于内容的音频检索技术的研究
下载Doc文档

猜你喜欢