音频内容分析论文开题报告文献综述

音频内容分析论文开题报告文献综述

导读:本文包含了音频内容分析论文开题报告文献综述、选题提纲参考文献,主要关键词:内容,音频,音符,音乐,海信,模糊,广播节目。

音频内容分析论文文献综述写法

李爽,刘盈[1](2017)在《基于内容的音频检索关键技术分析》一文中研究指出在我国社会经济发展的过程中,网络技术及多媒体技术也在不断的发展,网络信息资源不断的增加,信息检索技术也有了相应的创新及改革,人们已经不满足传统基于文本的检索,而是要求能够对音频、图像及视频等媒体进行快速检索,在此背景下就产生了基于内容的音频检索技术。基于内容的音频检索技术主要是在音频中将语义线索直接提取出来,从而能够根据语义线索实现检索,将检索的过程和媒体语义相互连接,有效提高检错工作的有效性及适应性。基于内容的音频检索技术目前被广泛应用到各个领域中,比如数字图书馆、远程教育、新闻节目检错、环境监测及广告娱乐节目的编辑和制作。基于此,本文就以广告检索为背景,研究基于内容的音频检索关键技术。(本文来源于《电子世界》期刊2017年18期)

郭兴华[2](2016)在《“互联网+音频”时代的新老争锋——基于广播节目内容生产思路的分析》一文中研究指出随着移动互联网的浪潮汹涌澎湃,媒体融合不断深入。在广播领域,伴随着接收终端的多元化,以蜻蜓FM、考拉FM、喜马拉雅FM为代表的一批移动网络电台正悄然兴起,多渠道、多平台、拼内容、争用户的竞争态势愈演愈烈。这对于传统广播来说,既是冲击,也是机遇。本文以笔者所做的"网络电台用户构成及使用习惯分析"的调查为基础,分析广播用户内容使用习惯,借助调查数据分析探讨移动互联时代传统广播的内容转型之路。一、基本情况综合国内既往同类研究,笔者发现以往针对传统(本文来源于《传媒评论》期刊2016年03期)

王公友[3](2013)在《基于内容的音频分析与场景识别》一文中研究指出基于内容的音频分析和场景识别是多媒体领域一个新兴的研究方向,在国内外仍出于探索研究阶段。音频信号主要分为有结构信号和无结构信号两类。一直以来,有结构音频信号的处理主要集中在语音识别和音乐检索等方面的研究。基于无结构的环境场景音频信号识别技术的研究还不多。如何提取音频中的摘要信息和语义内容是基于内容的音频分析技术的关键所在,具有重要的理论研究价值和实际应用前景。现有的音频检索算法往往局限于特定的音频类型,并对音频的结构的构成有很大的限制(如基于相似度分析的音乐检索算法)。基于监督学习和无监督学习算法在音频信息检索过程中都有自身的局限性。本文分析了这两种音频检索算法的优缺点,并提出了一种基于内容的音频分析方法和场景识别算法。实验结果表明,该方法对于环境场景声音具有很好的检索效果。对于输入的音频数据,首先本文根据音频环境场景的变化对其进行音频分割,并提取音频分割片段的特征。通过谱聚类将相似的音频分割片段聚类在一起,作为音频事件进行处理。然后对音频事件中的背景声音事件和关键音频事件进行检测,并计算音频事件的主特征向量,通过音频事件主特征向量的相似度对音频事件进行标定。最后,提出了一个上下文模型对音频事件中的错误标定的音频片段进行更正并通过对比基于伪语义特征的场景识别模型,给出了一种更加简单、计算复杂度小的场景识别模型。该模型通过对每个训练场景都建立一个HMM模型,实现测试场景数据的分类。(本文来源于《南京大学》期刊2013-05-01)

江秋侠[4](2012)在《3D电视机渐成消费新宠 关注叁类公司投资机会》一文中研究指出还在看2D电视机吗?这可真是OUT了,既然电影都看起了3D,那么看3D电视也势在必行。    随着技术的进步和价格的降低,3D电视机已经从“高不可攀”到可以“飞入寻常百姓家”,其价格甚至不会比只有2D功能的电视机贵多少。    分析人士,传统的娱(本文来源于《第一财经日报》期刊2012-12-01)

汪竹蓉,李伟,朱碧磊,李晓强[5](2012)在《基于音乐内容分析的音频认证算法》一文中研究指出提出一种新颖的基于音符分割和模糊分类的音乐内容认证方法.该算法打破了传统音频认证所采用的固定长度分割方式,将音乐信号分割成一系列具有完整语义信息的不等长音符片段作为认证的基本单元,结合动态时间规整DTW(dynamic time warping)对齐技术,有效解决了大多数现有算法都存在的对同步失真脆弱的问题.在每个音符片段计算基于半阶音符类Chroma的鲁棒Hash值,根据原始音乐与待认证音乐之间Hash值差异的统计特性和时间分布特性,对3种新定义的度量指标进行模糊分类从而得到最终的认证结果.对于未通过认证的音乐信号系统还可以进行篡改区域的检测.实验结果表明,该算法能够有效区分可容许操作和恶意篡改,同时在篡改定位方面具有较高的精度.(本文来源于《计算机研究与发展》期刊2012年01期)

汪竹蓉[6](2011)在《基于音乐内容分析的音频认证算法研究》一文中研究指出多媒体技术和网络技术的飞速发展使得数字音频的复制、修改和传播变得极其方便,但同时音频的真实性也受到了极大的威胁。为了得到安全的多媒体应用,对音频内容的真实性和完整性进行有效保护和认证已变得越发重要。现有的大多数音频认证算法主要集中在对语音信号的认证或包含音乐数据的一般音频信号认证,而有关音乐内容认证的研究并没有受到足够的重视。本文主要研究基于音乐内容分析的音频认证算法,致力于保护音乐这一特殊类型音频信号内容的真实性与完整性。首先介绍了音频内容认证技术的产生背景及应用场景,与传统认证的区别,音频认证的相关概念以及认证算法的分类等;接着对近年来出现的数字音频认证算法进行全面的综述,并归纳总结了现有算法的主要问题;针对这些问题,提出了两种新颖的基于音乐内容分析的认证算法,详细阐述了算法思想、内容和创新点,并给出了实验结果与结论。第一种认证算法将音乐信号分割成一系列不等长的音符片段,使得每个认证单元都包含了完整的语义信息,同时有效解决了现有算法存在的时间域失同步问题。对每个音符片段提取包含丰富旋律信息的Chroma中层特征,在此基础上计算鲁棒Hash值,根据与原始音乐Hash值差异的统计特性和时间分布特性定义度量指标,为符合音频认证的内在模糊性,利用模糊逻辑方法进行分类,最终作出认证决策。第二种认证算法基于音乐节拍对音乐信号进行非均匀分割以起到抵抗同步的作用,采用现有的动态规划节拍追踪算法定位出音乐中的节拍点。与第一种算法相比,加长了Chroma计算时的窗口长度,使得提取的特征能够更精确地反映出音乐的语义内容。对音乐鲁棒Hash码进行两层置乱加密以减小矢量量化攻击带来的威胁,进一步提高认证系统的安全性。最后,通过观察DTW节拍对齐结果中各节拍点的“弯折”现象对叁种常见的篡改操作(剪切,添加,替换)进行分类。实验结果表明,两种算法对保持内容操作和恶意篡改处理都具有很强的区分能力,并且能够精确地定位篡改区域,第二种算法还能以较高的准确率对叁种常见类型的篡改操作进行分类。(本文来源于《复旦大学》期刊2011-05-05)

黄珺[7](2011)在《基于音频的电视内容提取与分析》一文中研究指出随着当今互联网时代的发展,基于内容的视频检索领域的研究,得到了越来越多研究人员的重视。电视节目点播(TV on Demand)等新的互联网视频应用需求不断增加,面对海量的电视数据,促使我们寻求找到有效的办法来对电视内容进行提取以及语义层面的分析。本文在“基于内容的视频检索”框架下展开,对电视节目的提取与分析,做了相关的研究。在电视内容提取方面,本文在总结分析前人研究方法的基础上,提出了一种基于重复性检测的方法对电视节目进行自动分章,并且在重复性检测的基础上,将得到的参考模板,用于特定电视节目的提取。在研究中,我们创新地引入了音频指纹的技术进行重复性匹配,并且在指纹建模的过程中,跳出了传统音频特征提取的框架,采用了计算机视觉在人脸检测方面的技术。最后实验结果表明,该方法已经达到了该领域研究的国际主流水平。在电视内容分析方面,本文面向新闻视频,进行了基于内容的音频分类方面的研究,具体主要涉及音频特征的选取,音频分割算法,分类器的设计和选取方面的研究等。在基于高斯混合模型分类器的框架下,系统将新闻节目音频进行分割,并分为静音、语音、音乐、环境噪声四个种类,最后经过实验证明了所提出方法的有效性,取得了令人满意的效果。本文基于音频在电视内容提取和分析方面的研究工作,对基于内容的视频检索,具有一定的实用价值,其中的一些技术方法和成果,也可以推广到视频检索领域其他方面的研究工作中。(本文来源于《北京邮电大学》期刊2011-01-11)

张田,李嵩,高畅,邱荣发,李海峰[8](2010)在《基于音频的数字媒体内容分析及其可视化》一文中研究指出为了对音视频内容进行更加有效地分析,将信息可视化方法引入数字媒体信息处理领域。设计并实现了集多媒体信号采集、大词表连续语音识别、文本检索和音频检索为一身的多媒体内容可视化分析平台,取得了较理想的效果,充实了信息可视化理论并对其具体应用进行了有益尝试。(本文来源于《燕山大学学报》期刊2010年02期)

冀中,苏育挺,宋星光,安欣[9](2009)在《面向新闻视频内容分析的音频分层分类算法》一文中研究指出提出了一种规则和隐马尔可夫模型相结合的音频分层分类算法,首先利用规则将新闻节目中的音频分为静音、语音和音乐叁类,然后采用隐马尔可夫模型进一步将语音和音乐细分为男主持人语音、女主持人语音、交替报道、独白语音、现场语音和音乐六类。实验结果表明,男主持人语音、女主持人语音以及音乐的分类效果最好,查准率和查全率均可达90%以上;交替报道的分类性能最差,查准率为57.5%,查全率为79.3%;其他类别的分类性能居中,在70%~90%左右。与同类算法相比,该算法分类性能较高。(本文来源于《计算机应用研究》期刊2009年05期)

张一彬,周杰,边肇祺,郭军[10](2007)在《基于内容的音频与音乐分析综述》一文中研究指出机器听觉包括叁大研究领域:语音信号处理与识别、一般音频信号分析、基于内容的音乐信号分析.其中,语音信号处理与识别早已成为一个传统的研究热点.随着信息科学与技术的迅速发展,基于内容的音频与音乐信号分析也逐渐成为一个新的研究热点,近几年来取得了大量研究成果.文章将对1990年以后该领域上所取得的研究成果进行综述,包括基于内容的音频或音乐信号自动分类、分割、检索以及音乐作品自动分析等内容.(本文来源于《计算机学报》期刊2007年05期)

音频内容分析论文开题报告范文

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着移动互联网的浪潮汹涌澎湃,媒体融合不断深入。在广播领域,伴随着接收终端的多元化,以蜻蜓FM、考拉FM、喜马拉雅FM为代表的一批移动网络电台正悄然兴起,多渠道、多平台、拼内容、争用户的竞争态势愈演愈烈。这对于传统广播来说,既是冲击,也是机遇。本文以笔者所做的"网络电台用户构成及使用习惯分析"的调查为基础,分析广播用户内容使用习惯,借助调查数据分析探讨移动互联时代传统广播的内容转型之路。一、基本情况综合国内既往同类研究,笔者发现以往针对传统

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

音频内容分析论文参考文献

[1].李爽,刘盈.基于内容的音频检索关键技术分析[J].电子世界.2017

[2].郭兴华.“互联网+音频”时代的新老争锋——基于广播节目内容生产思路的分析[J].传媒评论.2016

[3].王公友.基于内容的音频分析与场景识别[D].南京大学.2013

[4].江秋侠.3D电视机渐成消费新宠关注叁类公司投资机会[N].第一财经日报.2012

[5].汪竹蓉,李伟,朱碧磊,李晓强.基于音乐内容分析的音频认证算法[J].计算机研究与发展.2012

[6].汪竹蓉.基于音乐内容分析的音频认证算法研究[D].复旦大学.2011

[7].黄珺.基于音频的电视内容提取与分析[D].北京邮电大学.2011

[8].张田,李嵩,高畅,邱荣发,李海峰.基于音频的数字媒体内容分析及其可视化[J].燕山大学学报.2010

[9].冀中,苏育挺,宋星光,安欣.面向新闻视频内容分析的音频分层分类算法[J].计算机应用研究.2009

[10].张一彬,周杰,边肇祺,郭军.基于内容的音频与音乐分析综述[J].计算机学报.2007

标签:;  ;  ;  ;  ;  ;  ;  

音频内容分析论文开题报告文献综述
下载Doc文档

猜你喜欢