音频数据检索快速算法的研究

音频数据检索快速算法的研究

论文摘要

机器听觉包括三大研究领域:语音信号处理与识别、一般音频信号分析、基于内容的音频检索。其中,语音信号处理与识别是一个传统的研究热点,随着音频数据的海量增长以及语音识别技术的相对稳定和成熟,音频检索逐渐成为了信息检索领域内的一个新的研究热点。音频检索研究如何从大量音频信息中快速准确地检索满足要求的音频数据。与语音识别技术相比,音频检索处理的数据是更一般的波形声音信号(包括语音和音乐),其研究成果可广泛地应用于远程教学、卫生医疗、数字图书馆、环境监测、新闻和娱乐节目的索引与标记等领域。本学位论文研究了利用图像配准方法的音频数据快速检索算法,简称FAR(Fast Audio Retrieval)。首先,采用音频处理中的短时分析技术将音频数据划分成一个个短时帧,并提取其MFCC特征参数;其次,将音频短时帧的特征参数MFCC转换为二值图像;最后,采用图像配准的方法对测试模板和参考模板的MFCC特征参数进行模板匹配,计算两个模板之间的匹配程度,并将该结果作为两个模板间的相似性测度输出。实验表明,利用图像配准方法的音频数据快速检索算法与基于DTW算法的音频检索算法相比,在检索的召回率、准确率以及F-指标等方面都有较大的改善,而且采用了图像配准的方法,算法的执行效率也优越于DTW方法。因此,本学位论文提出的FAR算法可用于基于内容和语义的音频检索技术中。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究目的和意义
  • 1.2 国内外相关领域的研究现状
  • 1.2.1 目前研究中采用的方法
  • 1.2.2 目前研究中存在的问题
  • 1.3 研究内容和主要工作
  • 1.4 内容安排
  • 第2章 特征参数的提取与模板匹配
  • 2.1 引言
  • 2.2 音频帧短时分析和基本特征参数
  • 2.2.1 音频帧短时分析
  • 2.2.2 时域参数
  • 2.2.3 感知线性预测参数
  • 2.2.4 梅尔频标倒谱参数
  • 2.3 模板匹配
  • 2.4 本章小结
  • 第三章 音频数据快速检索算法的分析与实现
  • 3.1 引言
  • 3.2 动态时间规整方法
  • 3.2.1 DTW算法的基本思想
  • 3.2.2 DTW路径搜索算法
  • 3.2.3 DTW算法的优缺点
  • 3.3 图像配准方法
  • 3.3.1 基于灰度信息的图像配准方法
  • 3.3.2 基于变换域的图像配准方法
  • 3.3.3 基于特征的图像配准方法
  • 3.4 音频数据快速检索算法
  • 3.4.1 基于图像配准原理的音频特征参数匹配
  • 3.4.2 检索系统的性能评价
  • 3.4.3 音频数据快速检索算法FAR
  • 3.5 本章小结
  • 第4章 实验与结果分析
  • 4.1 实验方案设计
  • 4.2 实验数据的准备
  • 4.3 实验过程
  • 4.4 实验结果与分析
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].音频数据检索专利技术综述[J]. 科技创新与应用 2016(25)
    • [2].用小波包变换产生音频数据索引的方法[J]. 中国高新技术企业 2008(11)
    • [3].HDCH:MapReduce平台上的音频数据聚类系统[J]. 计算机研究与发展 2011(S3)
    • [4].民间音乐采风中音频数据的采集与处理[J]. 电子技术与软件工程 2014(10)
    • [5].TinyOS环境下音频数据采集原型系统的设计与实现[J]. 计算机应用 2009(06)
    • [6].基于FPGA的I2S转AES/EBU音频转换系统的设计[J]. 电子器件 2019(04)
    • [7].借助音频数据的发音字典新词学习方法[J]. 西安交通大学学报 2016(06)
    • [8].一种基于MFCC的音频数据检索方法[J]. 计算机与数字工程 2008(09)
    • [9].话音处理板中音频数据交换软件设计[J]. 信息与电脑(理论版) 2017(04)
    • [10].IP over DVB中RTP音频数据的提取与恢复[J]. 信息工程大学学报 2009(03)
    • [11].局部搜索的音频数据检索[J]. 智能系统学报 2008(03)
    • [12].一种I~2S音频数据处理电路的FPGA设计[J]. 桂林电子科技大学学报 2016(06)
    • [13].基于最好基的音频数据搜索方法研究[J]. 计算机与数字工程 2008(03)
    • [14].用小波包最好基结构系数和塔型算法检索音频数据[J]. 计算机应用 2008(04)
    • [15].基于I~2S接口的FPGA的音频数据传输[J]. 电气技术 2018(12)
    • [16].关于数字视频加嵌技术中辅助数据的测试与分析[J]. 影视制作 2019(01)
    • [17].嵌入式实时音频比对报警器开发探析[J]. 声屏世界 2018(S1)
    • [18].基于AD7656的多路并行同步音频数据采集系统设计与实现[J]. 现代电子技术 2008(10)
    • [19].HD-SDI嵌入音频数据分析[J]. 广播电视信息 2014(12)
    • [20].一种两线双向高速串行音频数据传输总线控制器的实现方法[J]. 中国集成电路 2019(07)
    • [21].基于迁移学习的暴恐音频判别方法[J]. 计算机系统应用 2019(11)
    • [22].基于嵌入式结构的音频数据采集系统设计及实现[J]. 内蒙古大学学报(自然科学版) 2012(05)
    • [23].智能化广播台网系统中的音频数据传输[J]. 科技传播 2015(10)
    • [24].基于FPGA的MADI接口设计[J]. 电子设计工程 2011(18)
    • [25].小抄速记[J]. 电脑爱好者 2010(03)
    • [26].对音频数据测试分析系统设计的探讨[J]. 电子制作 2013(13)
    • [27].ETVS内话系统音频数据传输浅谈[J]. 硅谷 2011(03)
    • [28].浅谈广播电台内外网音频数据的安全交换[J]. 科技视界 2014(21)
    • [29].广播电台内外网音频数据的安全交换[J]. 广播与电视技术 2010(12)
    • [30].基于FPGA的多路音频采集与接口系统设计与实现[J]. 科学技术与工程 2012(27)

    标签:;  ;  ;  

    音频数据检索快速算法的研究
    下载Doc文档

    猜你喜欢