基于内容的音乐检索论文-王楠鑫,张雨佳

基于内容的音乐检索论文-王楠鑫,张雨佳

导读:本文包含了基于内容的音乐检索论文开题报告文献综述及选题提纲参考文献,主要关键词:音乐内容,检索方法,端点检测,语音识别

基于内容的音乐检索论文文献综述

王楠鑫,张雨佳[1](2018)在《基于内容下音乐检索方法的比较研究》一文中研究指出音乐为音频数据的一种,提高音频数据检索效率,是改善用户检索体验的主要途径。本文从音乐内容入手,阐述了基于内容的音乐检索处理框架。基于此,重点对端点检测方法,以及语音识别方法进行了比较研究。并根据研究结果,设计了一种基于内容的音乐检索系统。通过对系统检索效果的观察,证实了系统的应用价值。以期能够为有关人员提供参考。(本文来源于《北方音乐》期刊2018年09期)

秦静[2](2018)在《基于内容和语义的音乐检索技术研究与应用》一文中研究指出随着网络和大规模数字音乐产业的发展,音乐的获取和收听以更加便捷的方式呈现在用户面前,如何从海量的互联网数字音乐数据中,找到用户喜闻乐见的音乐,成为音乐信息检索领域要解决的关键问题和主要目标。常见的音乐检索都是以文本检索为主要手段,需要大量的人工标注,大大阻碍了音乐作品的检索和传播,成为数字音乐产业发展的瓶颈问题。音乐是人类思维的产物,以物理波形为载体,传递着人们对生活的理解和主观感受,不同表达方式的音乐检索算法各异。本文以音乐信号处理和分析为基础,研究音乐内容的特征提取和选择,以减少人工标注、提高检索效率;提取音乐语义描述为检索条件,以贴近人们感知音乐的方式去检索音乐数据库,逐步克服低层的音乐特征与音乐的语义之间的“语义鸿沟”,从而获得符合用户主观体验的音乐文件。针对使用哼唱音乐片段作为查询条件的音乐检索,本文提出了以旋律作为主要特征的模型,为了准确描述哼唱音乐旋律,采用动态阈值分割音符算法得到了每个哼唱音符的基音频率。为待检索音乐数据集和输入音乐样本建立了旋律表示模型,设计遗传算法建立了哼唱音乐的逼近模板,修正了哼唱输入个体差异,从而提高了检索精确度。为了加速检索速度,设计了针对哼唱检索的局部哈希敏感算法,为音乐数据库建立了索引。该算法对MIDI音乐文件的分割方式比人工标注的方式节省了时间,扩大了处理音乐的范围,能够满足日益增长的音乐检索需求。针对整首歌曲内容作为查询条件的音乐检索,提出了基于流形排序的模型,并通过设计相关反馈改进了检索结果。使用高斯混合模型和最大似然估计,对每首音频的频谱数据进行了聚类,每个聚类的中心选为典型频谱特征。每首歌曲的典型频谱特征被当作数据点,通过流形排序算法为每个点计算排序相关分数值,用这个分数值代替传统的欧式距离相似度的度量,可以获得新的排序。同时,采用流形排序算法能够挖掘出音乐数据之间潜在的语义,且易于使用相关反馈算法来改进。实验结果证明,提出的基于流形排序的方法,比现有的距离度量方法,能得到更好的排序结果。针对音乐示例语义描述作为查询条件的音乐检索,提出了基于示例语义的模型。为了克服“语义鸿沟”问题,将音乐映射到一个语义空间。使用卷积神经网络模型获取音乐语义特征,根据语义特征为音乐产生语义标注向量。提出了损失函数调整和SMOTE算法两种方式改进了检索模型。实验表明,该模型在数据集人工标注音乐较少,且标签标注样本分布不均的情况下,仍然可以获得较好的标注结果,能够实现语义向量空间中进行检索的目标,并获得了较高的命中率。(本文来源于《大连理工大学》期刊2018-03-13)

王健健[3](2016)在《基于内容的民族音乐检索模型构建与实现》一文中研究指出针对当前非结构化P2P网络中民族音乐资源搜索的问题,提出一种基于内容的民族音乐检索模型。通过建立局部索引和全局索引结合模型,其中局部索引通过构建特征矩阵的方法,提取民族音乐的ID与特征所属区间,去掉在检索中存在的重复问题;通过构建关联索引表作为全局节点的索引,提高搜索的精准性。最后通过仿真软件对上述的模型进行验证,对500首不同的民族音乐文件进行模拟,得到良好效果。(本文来源于《电子设计工程》期刊2016年19期)

葛欣欣[4](2013)在《基于内容的音乐检索系统研究与实现》一文中研究指出基于内容的音乐检索是通过分析音乐信号的音乐和音频特征,从音乐本身所包含的内容为出发点进行检索的一种方式。哼唱式音乐检索方式对用户的要求低,使用方便,用途广泛,是当前音乐检索领域最主要的方式。哼唱式音乐检索主要包括特征提取和旋律匹配两个模块。本文针对旋律特征提取和旋律匹配算法作了深入的研究和分析,在选择不同算法并且改进算法性能的基础上开发了一个原型系统,来验证算法的有效性和性能。主要工作包括:1)建立音乐数据库并提取音乐相应的主旋律。2)对哼唱音频数据特征提取相关技术的研究,包括音频信号与处理、基因检测、音符切分等工作。提取出的音频特征可以保存为两种形式-----音频帧序列和音符序列。3)选取不同的旋律匹配算法并尝试改进算法,使得匹配算法的检索速度和准确度都有很好的表现。4)设计并实现一个原型系统,用于验证旋律算法的有效性和匹配准确度。(本文来源于《北京邮电大学》期刊2013-12-28)

王镪[5](2013)在《基于内容的海量音乐检索技术研究》一文中研究指出随着数据存储能力的增加和传输技术的发展,数字音乐的数量呈现前所未有的增长。然而,这种爆炸式的增长使得在如此巨大的音乐数据库中查找感兴趣的音乐片段变得越来越困难。最近几年,这种窘境已经促使大量的研究人员把研究重点放在如何快速准确地从海量音乐数据库中检索出需要的音乐歌曲。本文主要研究基于内容的海量音乐检索中的两个技术:基于哼唱的音乐检索和基于样例的音乐检索,并对音乐检索中的一个关键技术,即快速索引查找技术,进行深入的研究,本文的主要工作和创新点包括以下几个方面:1)提出了局部对齐哼唱检索算法在哼唱检索中,哼唱片段通常被看作某首歌曲的一个子片段,因此哼唱检索可以看作一个子序列匹配的问题,即在音乐库中查找与哼唱片段最相似的子片段。但是,由于哼唱错误频繁发生,一般只有部分片段准确匹配,因此,哼唱片段中只有部分子片段与音乐库中的某个子片段能够实现较好的匹配。为了找到最相似的子片段,本文提出了局部对齐的框架,其目标是在哼唱片段和歌曲库片段中找到最相似的公共子片段。采用此算法,哼唱片段中的严重哼唱错误会被丢弃,避免了哼唱错误带来的负面影响,提高了哼唱检索的准确率。2)提出了基于音符和基频的两层局域敏感哈希哼唱检索算法以往的哼唱检索技术使用基于基频的局域敏感哈希(Locality Sensitive Hashing, LSH)算法提高检索速度,本文提出了一种基于音符的LSH检索算法,能够提高候选片段的召回率,再使用更准确的重音移位迭代对齐算法可以提高哼唱检索的准确率。同时考虑到海量数据下哼唱检索的效率问题,本文提出了一种基于置信度的两层LSH滤波检索策略,只有当第一层的基于音符的LSH检索结果不可靠时再使用基于基频的LSH检索给出更准确的结果,使用这种检索策略,显着地降低了哼唱检索系统的平均检索时间。3)提出了基于哼唱速率的多层滤波和渐进式滤波哼唱检索算法在哼唱检索系统中,大部分用户的哼唱速率比较接近原始歌曲的正常速率,因此哼唱速率也是衡量歌曲匹配程度的一个重要因素。基于哼唱速率的不同,本文提出了一种基于哼唱速率的多层滤波检索算法,即先使用原始片段进行搜索,然后对哼唱速率进行不同程度的调整再搜索,此算法有效地提高了哼唱检索的速度。哼唱速率的不同调整程度也体现了歌曲的匹配程度,基于此点的考虑,本文提出了一种哼唱速率融合的渐进式滤波算法:先使用速度快但不精确的算法缩小候选歌曲的搜索范围,再使用速度慢但精确的算法计算候选歌曲的相似度,最后融合哼唱速率得分与其他精确匹配算法得分,并根据融合得分进行排序。哼唱速率提供了歌曲匹配程度的新信息,使用融合策略提高了哼唱检索的准确率。4)提出了基于熵的局域敏感哈希算法和边界扩展局域敏感哈希算法在基于内容的音乐检索研究中,一个关键问题是面向海量数据的快速查找。本文研究了一种当前最流行的快速检索算法:局域敏感哈希算法,在此基础上,提出了两种改进算法:基于熵的LSH算法和边界扩展LSH算法。在原始的LSH算法中,哈希函数的生成并没有考虑实际数据分布,而通常情况下,数据分布是不均匀的,导致某些哈希函数把数据点映射得比较密集,而某些哈希函数把数据点映射得比较稀疏,两者的碰撞概率差异很大。本文基于均匀映射的思想提出了一种基于熵的哈希函数生成方法,使映射之后的数据点大致呈现均匀分布,不同桶中的数据点数目也大致相同。使用LSH算法时,近邻点被映射到相邻桶中的概率通常也很大,因此相邻桶中的点也可能是近邻点,基于此点的考虑,本文提出边界扩展LSH算法扩展每个桶的边界,使得相邻桶之间有共同的区域,每个点有可能被映射到多个桶中,显着地增加了近邻点的碰撞概率。5)提出了基于结构音乐指纹的两层滤波样例检索算法一个好的基于样例的音乐检索系统,不仅需要满足高准确率的要求,还需要满足快速性要求。本文在研究Shazam算法的基础上,提出了一种结构音乐指纹构建方法,使用多个峰值特征点构建音乐指纹,增加指纹的信息量和区分性,显着地提高了检索速度;为了提高检索准确率,使用有选择的两层滤波检索算法筛选更多候选片段,并使用原始峰值特征点计算候选歌曲的相似度。使用本文提出的检索算法,同时提高了基于样例的音乐检索系统的精度和速度。(本文来源于《北京邮电大学》期刊2013-06-12)

尹文慧[6](2013)在《基于哼唱内容的音乐检索技术研究》一文中研究指出哼唱检索是多媒体检索中基于内容检索的一种方式。哼唱检索系统能够让用户寻找到即使他仅仅只知道部分旋律的一首歌。用户只是简单的通过电脑的麦克风哼唱出这段音调,然后系统通过查询包括这段音调的歌曲旋律数据库,返回一个查询结果的相关歌曲列表。这样用户就能从返回的结果中找到目标歌曲。大多数多媒体研究团体的研究用到了轮廓信息这个概念。旋律轮廓是连续音符在音高上的相对差异的序列。我们确实可以在听的时候用这种方法决定两个旋律的相似度。然而,提取哼唱轮廓信息是一个易错的音符切割过程,因此依靠音符切分这类系统的检索精度比较低。还有一些系统为了匹配旋律时获得高精度而大量使用动态时间规划算法造成系统检索非常耗时。本文的研究方法与之前的方法相比,不仅在检索精度上提高,在匹配速度上也有了很大提高。为了避免音符切分,本文引入时间序列的方法。把音乐当作一个时间序列,研究并改进了一些时间序列数据库的成熟技术和快速匹配音乐检索技术。分析了多音轨MIDI格式音乐旋律提取时的音轨选择方法和轮廓算法。阐述了将曲调和哼唱旋律表示为时间序列的方法,并详细说明了两个时间序列进行相似性匹配时用到的局部动态时间规整算法,提出了一个压缩检索空间的有效的检索方法,在现有的DTW算法上引入了一个通用的时间序列检索框架。最后通过实验结果证明本文的方法是高效可扩展的。(本文来源于《天津财经大学》期刊2013-05-01)

刘铬,刘红丽[7](2012)在《基于内容的音乐检索方法比较研究》一文中研究指出根据基于内容的音乐检索的研究现状,分析并总结出基于内容的音乐检索的概念和原理,介绍和比较了基于内容的叁种音乐检索方法,并分析了基于内容的音乐检索工具所面临的挑战,展望了该领域研究发展前景。(本文来源于《山西科技》期刊2012年04期)

杨波[8](2012)在《基于内容的多音音乐检索系统设计》一文中研究指出如何从口益增长的多媒体资源中快速准确地定位已成为多媒体检索领域的研究热点,其相关技术的研究必将推动人机交互技术的发展,但目前基于内容的音频检索相对于基于内容的图像或视频检索来说发展滞后。哼唱检索是基于内容的音频检索的一个重要分支,是一种最自然、最方便的音乐检索方式,用户只需哼唱出一段旋律,就能在音乐数据库中检索出想要的歌曲。当前音乐检索支持的音乐格式主要是MIDI格式,而对MP3、WAV等格式的多音音乐检索的研究成果很不理想。本文在分析研究多音音乐检索的关键技术和难点问题的基础上,完成了哼唱输入的端点检测和目标音乐的音乐分割,改进并完善了基于基频矩阵的基音提取算法,归纳了用于音乐检索的DTW算法,实现了多音音乐的特征提取和特征匹配,最后设计实现了本文的多音音乐检索Music-Retrieval系统。本文主要研究的内容如下:(1)在分析音乐检索的原理和音乐乐理知识的基础上,选取了广泛用于音乐检索的旋律(音高、基音)特征来表征音乐;设计了基于内容的多音音乐检索的总体框架,分析了多音音乐检索的难点及本文研究实现的重点。(2)讨论了音乐信号的预处理,选用了基于频谱能量的端点检测算法实现了哼唱输入的端点检测,完成了对目标音乐的多音音乐分割,减少了后期特征提取和特征匹配的工作量。(3)仿真分析了基本的基于时域、频域的基音提取算法从含有复杂背景伴奏的目标多音音乐中提取基音特征的缺陷,在探讨现有的基于基频矩阵的基音提取算法的基础上,改进并完善了该算法,实现了在不能构造基频矩阵的情况下依然能够从目标音乐中提取到音乐的基音特征,并降低了计算的复杂度;(4)分析讨论了在语音识别领域中广泛使用的DTW算法用于多音音乐特征匹配的优缺点,归纳了适用于音乐检索的DTW算法,较好的克服了哼唱输入的音调误差,减少了匹配时间,实现了哼唱输入与目标音乐的特征匹配。(5)完成了本文Music-Retrieval系统的功能设计,采用VC++编程实现了该系统;采集了哼唱输入片段作为实验数据,完成了音乐检索系统的实验评测,包括算法的有效性实验,系统的检索性能、速度和精度等实验。(本文来源于《武汉理工大学》期刊2012-04-01)

唐静[9](2011)在《基于内容的钢琴音乐检索研究》一文中研究指出随着网络技术和多媒体技术的快速发展,人们已经能够方便地接触到越来越多的音乐,随之而来的问题是如何在这浩瀚的音乐中快速找到自己需要的音乐。因此,对音乐检索的研究就变得尤为重要,它也逐渐受到人们的广泛关注。传统的音乐检索都是针对哼唱那样的单声道音乐,对钢琴这样的复调音乐检索研究则相对较少。但是,随着人们生活水平的提高,越来越多的人特别是儿童对学习钢琴产生了浓厚的兴趣,并且钢琴是音域最为广泛的乐器。所以,研究基于内容的钢琴音乐检索对于人们的生活娱乐和复调音乐检索研究都有很重要的意义。基于内容的钢琴音乐检索研究主要包含乐曲特征库的建立、特征提取、检索匹配及相似度计算等几个方面,就此有以下研究工作:1、乐曲特征库的建立。通过读取MIDI格式音乐文件,建立标准音高曲库,为了提高检索速度,在标准音高曲库的基础上引入N-grams索引算法,建立以高音为关键词的特征索引库。2、分析Onset点检测中关于峰值提取的自适应门限算法,发现基于中值滤波的自适应门限具有不稳定性。通过对基于均值滤波的门限特性分析,研究中值滤波和均值滤波结合的方法,使自适应门限比原来更为平滑,具有更高的稳定性。并且进行了这两种门限情况下Onset点检测结果的对比实验,结果表明改进后的算法能取到更好的效果。3、针对现有音高估计算法无法准确提取钢琴音乐音高的情况,通过对谐波峰值法的分析,给出以提取候选音高序列来代替提取准确音高。每个候选音高序列的中的音高按照其频域幅度大小依次排序,根据音高所在位置的不同给予不同得分,再根据得分得到相应地相似度计算算法。4、根据对钢琴音乐检索算法的研究,设计并实现了一个基于内容的钢琴音乐检索演示系统。实验测试了不同长度音乐检索输入时,该系统的检索时间和检索准确度的情况,从而给用户一些检索输入建议,以便能得到较高的检索准确率。(本文来源于《西南交通大学》期刊2011-05-01)

苏启院[10](2011)在《基于内容的音乐检索关键技术研究》一文中研究指出随着计算机网络技术和多媒体技术的快速发展,音乐信息的数据量急剧增长。如何从浩瀚的音乐数据中快速准确地找到想要的音乐已成为现代信息检索领域的一个热门的研究课题。传统的基于文本的音乐检索只能通过输入歌曲名或演唱者名等信息进行检索,已无法满足人们对音乐检索的需求。基于内容的检索允许用户通过哼唱的形式来检索所需的歌曲,用户即使忘记歌曲名或演唱者名等信息,只要他能哼唱出歌曲的部分片断就能找到所要的歌曲。这种新型的人机接口,对于音乐检索有着巨大的现实意义,也越来越受到学者、开发商和广大用户们的注意。本文以国家自然科学基金项目“叁维戏曲动画合成技术研究(NO.U0935003)”为背景,针对哼唱检索涉及的关键技术进行研究,主要包括:音乐旋律特征的表达、音乐旋律特征的提取、音乐旋律的匹配。在分析音乐的本质特征和音乐旋律表示方法的基础上,提出了一种改进的综合使用音高差和音长比的二元旋律特征表示法。该方法能够较准确地表示音乐信号中旋律特征,并具有较好的检索精度。在音乐旋律特征的提取上,通过对传统基因周期检测技术的分析,发现传统基因周期检测技术存在各种各样的缺陷。针对这些缺陷本文进行基因周期检测时,先对原始语音信号进行多级小波变换,将较高几个层次上的逼近信号进行加权求和处理,然后再结合自相关函数法和平均幅度差函数法对合成后的信号进行基音周期检测。并对男女声信号采用了不同的加权系数,使两种信号都能得到光滑的旋律轮廓曲线。在旋律匹配检索模块中,本文提出了一种数值索引的方式,对旋律特征库中的音高差值信息建立索引,并在此基础上设计了一个旋律匹配算法。最后本文设计了一个简单的基于哼唱的音乐检索系统,通过详细的实验证明了本文提出方法的有效性和可行性。(本文来源于《华南理工大学》期刊2011-05-01)

基于内容的音乐检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着网络和大规模数字音乐产业的发展,音乐的获取和收听以更加便捷的方式呈现在用户面前,如何从海量的互联网数字音乐数据中,找到用户喜闻乐见的音乐,成为音乐信息检索领域要解决的关键问题和主要目标。常见的音乐检索都是以文本检索为主要手段,需要大量的人工标注,大大阻碍了音乐作品的检索和传播,成为数字音乐产业发展的瓶颈问题。音乐是人类思维的产物,以物理波形为载体,传递着人们对生活的理解和主观感受,不同表达方式的音乐检索算法各异。本文以音乐信号处理和分析为基础,研究音乐内容的特征提取和选择,以减少人工标注、提高检索效率;提取音乐语义描述为检索条件,以贴近人们感知音乐的方式去检索音乐数据库,逐步克服低层的音乐特征与音乐的语义之间的“语义鸿沟”,从而获得符合用户主观体验的音乐文件。针对使用哼唱音乐片段作为查询条件的音乐检索,本文提出了以旋律作为主要特征的模型,为了准确描述哼唱音乐旋律,采用动态阈值分割音符算法得到了每个哼唱音符的基音频率。为待检索音乐数据集和输入音乐样本建立了旋律表示模型,设计遗传算法建立了哼唱音乐的逼近模板,修正了哼唱输入个体差异,从而提高了检索精确度。为了加速检索速度,设计了针对哼唱检索的局部哈希敏感算法,为音乐数据库建立了索引。该算法对MIDI音乐文件的分割方式比人工标注的方式节省了时间,扩大了处理音乐的范围,能够满足日益增长的音乐检索需求。针对整首歌曲内容作为查询条件的音乐检索,提出了基于流形排序的模型,并通过设计相关反馈改进了检索结果。使用高斯混合模型和最大似然估计,对每首音频的频谱数据进行了聚类,每个聚类的中心选为典型频谱特征。每首歌曲的典型频谱特征被当作数据点,通过流形排序算法为每个点计算排序相关分数值,用这个分数值代替传统的欧式距离相似度的度量,可以获得新的排序。同时,采用流形排序算法能够挖掘出音乐数据之间潜在的语义,且易于使用相关反馈算法来改进。实验结果证明,提出的基于流形排序的方法,比现有的距离度量方法,能得到更好的排序结果。针对音乐示例语义描述作为查询条件的音乐检索,提出了基于示例语义的模型。为了克服“语义鸿沟”问题,将音乐映射到一个语义空间。使用卷积神经网络模型获取音乐语义特征,根据语义特征为音乐产生语义标注向量。提出了损失函数调整和SMOTE算法两种方式改进了检索模型。实验表明,该模型在数据集人工标注音乐较少,且标签标注样本分布不均的情况下,仍然可以获得较好的标注结果,能够实现语义向量空间中进行检索的目标,并获得了较高的命中率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基于内容的音乐检索论文参考文献

[1].王楠鑫,张雨佳.基于内容下音乐检索方法的比较研究[J].北方音乐.2018

[2].秦静.基于内容和语义的音乐检索技术研究与应用[D].大连理工大学.2018

[3].王健健.基于内容的民族音乐检索模型构建与实现[J].电子设计工程.2016

[4].葛欣欣.基于内容的音乐检索系统研究与实现[D].北京邮电大学.2013

[5].王镪.基于内容的海量音乐检索技术研究[D].北京邮电大学.2013

[6].尹文慧.基于哼唱内容的音乐检索技术研究[D].天津财经大学.2013

[7].刘铬,刘红丽.基于内容的音乐检索方法比较研究[J].山西科技.2012

[8].杨波.基于内容的多音音乐检索系统设计[D].武汉理工大学.2012

[9].唐静.基于内容的钢琴音乐检索研究[D].西南交通大学.2011

[10].苏启院.基于内容的音乐检索关键技术研究[D].华南理工大学.2011

标签:;  ;  ;  ;  

基于内容的音乐检索论文-王楠鑫,张雨佳
下载Doc文档

猜你喜欢