音乐旋律自动抽取与哼唱检索系统关键技术研究

音乐旋律自动抽取与哼唱检索系统关键技术研究

论文摘要

近年来,随着网络多媒体数据和数据库应用的增加,如何对这些数据进行自动分类和检索已成为一个研究热点。尤其对音频而言,由于出现越来越多在线音乐存储和音乐检索,这就需要一种更加有效的机制去组织检索这些海量数据。基于文本的传统检索方式只能对有标注信息的音乐文件进行检索,基于内容的检索则不依靠标注信息,而是根据音乐中的旋律、节奏、音色等信息进行检索。本文旨在研究基于内容的音乐检索关键技术,主要涉及音乐旋律特征抽取、音乐旋律匹配、音乐数据库以及系统构建等方面。目前在国内外,这些技术在理论研究上已经取得很大进展,并且开发了很多相关的应用系统。然而,现有系统在应用的广泛性、自动化程度、可扩展性等方面仍存在很多问题。本文的研究工作主要以此展开,针对MIDI音乐格式对乐音库的自动构建、多音轨MIDI主旋律自动抽取以及系统实现等方面进行了深入研究。首先,本文通过改进一个网络爬虫程序Larbin,实现了乐音库的自动化构建,增强了整个系统的自动化程度和音乐库的可扩充性。其次,本文深入研究了音乐相似度计算理论,设计了一种新的相对音高旋律表示方式。在此基础上,提出并实现了一种基于旋律相似度计算的多音轨MIDI主旋律抽取算法,实验表明具有良好的召回率和精确度,证明了该算法的可行性和有效性。最后,利用这些相关工作,构建了一个基于哼唱的检索系统,实验结果证明了该系统的有效性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 哼唱音乐检索技术的发展与现状
  • 1.3 哼唱音乐检索系统的整体架构
  • 1.4 本文的主要工作和组织结构
  • 1.4.1 本文主要工作
  • 1.4.2 本文组织结构
  • 第二章 乐音数据库自动构建
  • 2.1 引言
  • 2.2 基本乐理知识及MIDI格式简介
  • 2.2.1 基本乐理知识
  • 2.2.2 MIDI简介
  • 2.3 基于改进网络爬虫程序Larbin的乐音数据库自动构建
  • 2.3.1 Larbin介绍
  • 2.3.2 Larbin改进
  • 2.3.4 本章小结
  • 第三章 旋律相似度计算
  • 3.1 引言
  • 3.2 旋律表示
  • 3.2.1 Parsons码
  • 3.2.2 Melody Chains
  • 3.2.3 加权点集表示法
  • 3.2.4 MIDI音轨特征表示及自动生成算法
  • 3.3 旋律相似度计算
  • 3.3.1 Levenshtein距离
  • 3.3.2 N-grams算法
  • 3.3.3 EMD算法
  • 3.3.4 Geometric Measurements算法
  • 3.3.5 向量计算算法
  • 3.4 哼唱旋律匹配
  • 3.4.1 哼唱旋律提取
  • 3.4.2 匹配算法
  • 3.5 本章小结
  • 第四章 基于旋律相似度的多音轨MIDI主旋律抽取方法
  • 4.1 引言
  • 4.2 多音轨MIDI主旋律提取方法
  • 4.2.1 基于规则的提取方法
  • 4.2.2 人工标注方法
  • 4.3 基于旋律相似度的多音轨MIDI主旋律抽取算法
  • 4.3.1 算法设计
  • 4.3.2 实验与分析
  • 4.4 本章小结
  • 第五章 基于内容的音乐检索系统实现
  • 5.1 系统功能描述
  • 5.2 系统实现
  • 5.3 试验结果分析
  • 5.4 本章小结
  • 第六章 结论与展望
  • 6.1 结论
  • 6.2 不足与展望
  • 参考文献
  • 在校期间参与项目和发表论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    音乐旋律自动抽取与哼唱检索系统关键技术研究
    下载Doc文档

    猜你喜欢