导读:本文包含了视频摘要论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:摘要,视频,关键,特征,在线,卷积,层次。
视频摘要论文文献综述
胡胜红,贾玉福,桂超[1](2019)在《面向足球视频摘要的叙事性拼图算法》一文中研究指出利用叙事性拼图优化足球视频摘要的显示,根据精彩事件分析和不同镜头类型的叙事相关性最大化策略抽取候选关键帧,提取不同感兴趣对象为中心定义和重定向感兴趣区域,根据叙事结构中的时-空逻辑构建拼图排列,比随机拼图或故事板能保持更多精彩事件的叙事内容。实验结果显示,叙事性拼图摘要不仅清晰地对精彩事件中的球员动作和人物表情实现了叙事目的,还能在同等显示区域内比故事板描绘更多的叙事内容,也比直接的视频片段快放节约流量,以及节约浏览时间。(本文来源于《信号处理》期刊2019年11期)
张璐,吕进来[2](2019)在《基于层次聚类和TextRank的视频摘要》一文中研究指出为解决基于聚类算法的视频摘要中存在的需要预先设定聚类中心和聚类数目及选取的关键帧不具有代表性的问题,提出一种基于层次聚类与TextRank算法的静态视频摘要方法。使用层次聚类算法对视频帧进行聚类,利用TextRank算法选取候选关键帧集合,通过求解优化函数选择最终的关键帧生成视频摘要。实验结果表明,该方法生成的视频摘要能够比较全面准确地表达视频内容且冗余度低。(本文来源于《计算机工程与设计》期刊2019年07期)
白倩楠[3](2019)在《基于变点检测的视频摘要生成方法研究》一文中研究指出视频作为信息的一种载体,普通化程度越来越高,在各个领域的应用也越来越广泛,面对海量视频数据,如何快速,准确的查找出需要的视频资源,是当前的研究热点。在这样的背景下,视频摘要技术应运而生,近年来视频摘要技术有了巨大的发展,但是尚未成熟,本文的研究正是针对提高视频摘要的生成质量而展开的,论文主要工作包括以下叁个部分。(1)提出了一种结合变点检测和K均值聚类的视频摘要生成方法,由于变点检测要求数据在时间上具有平滑性,而视频中相邻帧间的差异不大。因此,可以采用变点检测进行镜头切分。其次,考虑到视频的时间特性,在变量镜头相似性进行镜头合并时加入了时间因子,同时去除了因目标快速运动或光阴忽明忽暗而产生的冗余镜头。然后,通过3σ准则确定镜头中视频帧的类数,结合K均值聚类算法,提取每一镜头中的关键帧,并剔除其中的单色帧与相似帧。最后,以提取的关键帧形成视频摘要。在开放视频库中用50个视频对本文方法进行评估。结果表明,生成的视频摘要质量高于对比算法OV、DT、STIMO和VSLMM 2.(2)提出了一种基于特征融合与贝叶斯在线变点检测的视频摘要生成方法,首先,提取视频帧的HSV量化颜色特征并构造一种新的特征MEP,利用欧氏距离计算相邻两帧的综合相似度。然后,对获得的综合相似度采用贝叶斯在线变点检测算法进行检测,检测到的变点的位置即为视频中发生镜头切分的位置,实现了镜头切分的实时性,避免了传统视头边界阈值的确定,再次,采用基于帧率和K均值聚关相结合的方法对镜头中的关键帧进行提取。最后,基于图像秩来对单色帧进行识别并对相拟帧进行剔除,实验结果表明,这方法生成的视频摘要质量高于对比算法。(3)建立了一个视频摘要库,采用分类算法对库中的视频进行分类,并对分类后的视频进行摘要生成。首先,聚焦单视角视频,建立了一个包含410个视频的摘要库,该库中含有动物视频。道路交通、纪录片,家庭录像等14种不同类型的视频,持续时间人1-10分种不等,每个视频都有来自五个不同用户标准结果。其次,采用随机森林逄法对该库中的视频进行分类。根据视频特性将库中的视频分为叁大类:有编辑视频,人为拍摄视频和监控视频,分类的准确性达到了84.15%。最后,对叁种不同类型的视频提取相应的视频特征,提出了叁种不同的视频摘要生成方法。结果表明,新提出的每一类视频摘要方法都表现出了良好的性能。(本文来源于《西安理工大学》期刊2019-06-30)
李喻蒙[4](2019)在《基于关键帧提取的静态视频摘要技术研究》一文中研究指出随着互联网的广泛使用和视频采集技术的逐渐成熟,数字视频数量呈爆炸式增长。为了从海量视频中快速准确搜索到有效信息,通过精简的关键帧概括原始视频的主要内容,视频摘要技术应时而生。现有视频摘要方法,不仅专门用于解决视频关键帧相似性度量问题的理论仍处于形成期,而且大多数的图像相似性计算方法主要依据的是传统图像特征,较少考虑到图像像素空间的拓扑结构。针对以上问题,围绕静态视频摘要技术,本文对关键帧提取和关键帧图像相似性计算中涉及的关键技术进行了研究,主要工作概括如下:(1)以光流运动分析为基础,提出将光流技术与改进的爬山搜索相结合的关键帧提取方法。首先,使用光流法计算视频帧序列的运动曲线。然后,通过改进的爬山法实现对搜索初始点的预设,引导算法向更合理的解空间搜索运动曲线的局部极小值;通过变步长搜索,使算法迅速地收敛于局部最优解。最后,提取运动局部极小值对应的视频帧作为关键帧。该方法根据连续帧之间光流位移的变化剧烈程度提取关键帧,其获得的关键帧不仅较全面地涵盖视频内容,而且能突出视频的重要内容;同时可应用于视频的快速浏览和检索。(2)提出基于超像素分割的关键帧相似性计算方法。该方法使用超像素分割算法对关键帧图像的像素进行局部聚类,可将像素点提升至更具语义空间的图像区域。如此操作,能够有效地利用像素间的区域拓扑关系,以实现对图像块的准确比对。利用该方法对提取出的相邻关键帧进行相似性计算,并以此为依据压缩关键帧间类似的冗余帧,同时不会遗漏人们感兴趣的视频信息,进而得到更有效且性能更优的静态视频摘要结果。(3)将本文提出的静态摘要方法在两个公开基准数据集,即OVP数据集和YouTube数据集上完成实验,并与几种具有代表性的静态视频摘要方法进行对比。通过主观展现及客观性能分析,证明本文获取的视频摘要与人工摘要结果具有更高的一致性,且比以往方法表现出更好的性能,从而验证本文所提方法的有效性和先进性。(本文来源于《西安理工大学》期刊2019-06-30)
[5](2019)在《抓落实 保安全 夺取夏粮丰产丰收——农业农村部副部长张桃林在全国“叁夏”机械化生产暨农机安全工作视频会议上的讲话摘要》一文中研究指出当前,全国"叁夏"农业生产正逐步展开,大规模农机跨区作业即将开始,这是农机化生产的大忙时节,也是农机安全事故易发多发期。我们要深入贯彻落实党中央、国务院有关文件精神和工作部署,做好"叁夏"机械化生产和农机安全工作,确保夏收夏种高效安全顺利进行。1.全力做好"叁夏"机械化生产工作今年全国"两会"期间,习近平总书记在参加河南代表团审(本文来源于《当代农机》期刊2019年06期)
李大湘,朱志宇,刘颖[6](2019)在《基于运动轨迹聚类的监控视频摘要算法》一文中研究指出针对监控视频存在大量冗余而不利于检索与传输等问题,提出一种基于运动目标检测和轨迹聚类组合的动态视频摘要算法。采用视觉背景提取子(VIBE)进行运动目标检测,采用运动区重迭判别的方法提取目标运动轨迹;根据视频中所有运动目标的空间位置信息,提出轨迹聚类方法对运动轨迹进行聚类分组;对每个分组的运动轨迹分别建立能量优化模型,采用量子行为粒子群优化算法(QPSO)求解能量方程最小解,将运动轨迹进行重新组合,生成摘要视频。实验结果表明,该算法可将视频浓缩成指定长度的摘要视频,不易发生目标信息丢失或目标重迭,轨迹优化组合性能较传统模拟退火算法提升10%以上。(本文来源于《计算机工程与设计》期刊2019年06期)
朱树明[7](2019)在《基于HEVC的压缩域视频摘要技术研究》一文中研究指出移动互联网和智能多媒体技术的发展,使得数字视频成为人们记录生活、获取信息的一种重要形式。然而伴随着视频数据量地快速增长,给视频的存储和传输带来了巨大压力。因此,人们急需一种方法来缓解这种压力,视频摘要技术恰好能满足这种需求。当前,视频摘要方法主要以时域算法为主,通常选取视频帧的颜色和纹理等特征用作关键帧的提取;在压缩域方面,有部分学者利用压缩视频流中的相关码流信息来实现视频摘要关键帧的提取,然而,该类方法仍然是沿用时域算法中的相关技术,未能真正实现视频摘要的压缩域特征提取。在视频摘要技术中,视频特征点的选取和关键帧的提取是决定最终生成视频摘要质量好坏的最关键步骤。为此,论文围绕这两个关键问题在基于HEVC(High Efficiency Video Coding)编码视频的压缩域方面进行了深入地研究。提出了基于改进聚类的压缩域视频摘要关键帧提取方法和基于帧内多模式特征的压缩域视频摘要生成算法。首先,通过研究发现HEVC帧内预测模式与图像纹理具有密切的关系,论文提出了一种基于改进聚类的压缩域视频摘要关键帧提取方法。该方法首先在HM(HEVC Model)解码端统计得到帧内亮度模式数并将其构建成模式特征向量作为图像的纹理特征。然后使用ISODATA(Iterative Self-organizing Data Analysis Techniques Algorithm)方法解决K均值算法无法提取设定聚类数目的问题,实现算法自适应地得到K值。最后利用改进后的K均值聚类算法对模式特征向量进行聚类并选取每个类内中间向量对应的帧作为候选帧,运用相似度对候选帧进行再次筛选,剔除冗余帧,进一步提高视频摘要的质量。实验结果表明,所提算法在Open Video Project数据集上提取关键帧的精度为71.5%,召回率达到91.2%,摘要综合指标F-score为80.2%,生成的视频摘要较好地表达了原视频内容,符合用户的观看习惯。其次,为克服视频特征点选取不全面而导致最终生成视频摘要质量不佳的缺点,论文提出了一种融合多个模式特征的压缩域视频摘要生成方法。该算法基于H.265/HEVC已编码I帧视频的亮度和色度预测模式信息,通过多个模式信息的归一化直方图实现视频帧的相似性检测,从而实现视频摘要关键帧的提取和摘要的生成。首先以PU块的4×4大小为基准,对不同尺寸的PU块赋予相应的权值,以消除尺寸大小不同对特征选取带来的影响。然后将统计得到的加权亮度模式和色度模式特征进行归一化处理,且考虑到人类视觉对亮度分量比色度分量敏感的因素,对归一化后的亮度和色度模式直方图分配了相应的系数,用以解决亮度和色度所带来的影响。最后将色度和亮度模式特征进行融合,形成最终的模式特征向量,并构建模式特征直方图模型。在视频摘要生成方面,基于所建立的模式特征直方图模型,提出了两种方法进行视频帧的相似性检测,并生成视频摘要。(1)提出一种基于直方图相交的关键帧提取方法,该方法首先利用相邻两帧模式特征直方图的相交距离进行相似度判定,然后对每个视频帧进行分类,最后选取每类第一帧作为关键帧生成视频摘要。(2)提出一种基于直方图差值的关键帧提取方法,该方法首先以相邻两帧模式特征直方图对应区间的差值占空比来进行对应区间的相似性判定,并对区间相似性小的区间数目进行统计。然后将统计得到的区间数目除以每帧总的区间数得到区间数占比,并以此对两帧进行相似性判定。最后将视频帧进行分类,选取每类第一帧作为关键帧,并按视频帧编号的顺序生成视频摘要。最后,论文经过大量实验确定了算法中相关参数的最优值,并将提出的算法应用于不同主题类型的视频上。实验结果表明,所提方法(1)在Open Video Project数据集上提取关键帧的准确率为79.2%,误差率为0.65;精度为63.4%,召回率达到79.2%,F-score为71.4%。所提方法(2)在相同数据集上提取关键帧的准确率为82.0%,误差率为0.64。其中,精度为65.0%,召回率达到82.0%,F-score为73.3%。与时域算法相比,由于所提压缩域算法不需要参数译码处理,因此算法耗时非常短,且提取关键帧的准确率最高。(本文来源于《安徽工程大学》期刊2019-06-10)
程海鹰[8](2019)在《基于特征融合的视频摘要生成技术研究》一文中研究指出互联网和现代多媒体技术的发展日新月异,数字视频服务已经融入人们的生活,成为日常不可或缺的一部分,视频的上传下载亦成为了当下获取信息的一种重要来源。海量视频产生了巨大的储存压力,合理地存储、浏览和检索这些大容量的视频数据是目前急需解决的矛盾,视频摘要技术恰好能缓解这种压力。因此,视频摘要技术已经成为计算机视觉领域非常热门的研究方向之一,广泛应用于安防工作中的各个场景和智能城市的视频数据分析等。在视频摘要生成技术研究中,关键帧的提取是核心工作之一,传统算法中只考虑了图像的颜色信息,但仅仅依靠颜色特征并不能将一幅图像的主要信息体现出来,也不能很好地降低图像噪声带来的干扰,影响了关键帧的质量,降低了视频摘要效果。为了选取具有代表性的关键帧,生成契合用户观看习惯的视频摘要,论文提出一种基于特征融合的视频摘要生成技术研究,围绕特征融合方式分别对分类和聚类方法生成的视频摘要过程展开研究。首先,论文研究了基于特征融合的分类算法在视频摘要当中的应用,提出了基于HOG-LBP(Histograms of Oriented Gradients,HOG),(Local Binary Pattern,LBP)特征和SVM(Support Vector Machines,SVM)分类器的关键帧提取方法。该方法使用SVM分类器作为分类工具,从分解到的视频序列中提取并融合形状和纹理特征,使用训练完成的SVM分类器对待检测图像进行分类,并将分类正确的帧暂定为候选关键帧,最后运用图像余弦相似度方法剔除其中的冗余帧,进一步提升关键帧的质量。实验结果表明,提出的算法在叁个不同场景视频中提取关键帧的平均准确率达到94.08%,平均误差率仅为23.18%。提取到的关键帧准确率较高且内容具有代表性,效果比较好。其次,鉴于分类算法受限于训练样本的种类及数量且只能粗概分类出场景的缺点,论文分析研究了融合多个特征结合聚类算法进行视频摘要关键帧提取的方法,提出了基于特征聚类的视频摘要关键帧提取算法。首先,选取并融合颜色特征和纹理特征,并利用层次聚类算法获取初始聚类参数;然后,用K-means算法优化初始结果,选取最靠近聚类中心的帧定为关键帧;最后,以客观结合主观的方式对算法的有效性进行了评估。实验结果表明,提出的算法在四个不同视频中提取关键帧的平均精度为0.71,平均召回率为0.76,平均F-score达到0.73,并分别与目前提取关键帧的主流算法进行了分析对比。在主观分析方面,邀请的10个用户对算法生成的关键帧认可度较高,部分摘要视频能达到良好水平。最后,将不同算法提取出来的所有关键帧按照每个原始视频中出现的时间顺序依次组合起来,形成视频摘要,在系统工作界面播放,获取该段摘要的基本信息。视频摘要按照时间顺序更符合原始内容,更具有情节发展性,更契合用户的观看习惯。(本文来源于《安徽工程大学》期刊2019-06-10)
张璐[9](2019)在《基于关键帧的视频摘要方法研究》一文中研究指出近年来,数字技术的进步使视频成为一种宝贵的信息资源。随着具有视频拍摄功能的多媒体设备的迅速普及,视频数据量在教育、娱乐和多媒体应用等多方面呈现指数级增长。但庞大的数据量使得视频检索任务变得尤为艰巨,并且面临着巨大的存储压力。如何快速浏览、查询用户所需的视频已成为人们关注的焦点,研究能够自动、有效并准确地操纵这些视频数据的相关技术逐渐受到人们的关注。基于关键帧的视频摘要能够满足上述需求,其基本思想是从原始视频中提取出一些具有代表性的、反映视频主要内容的视频帧,使人们可以通过浏览视频帧序列从而获取关键信息,能够提高视频管理效率。在基于关键帧的视频摘要技术中,如何提取具有区分性的视频帧特征,是提高视频摘要质量的基础;如何从视频中选择具有代表性的关键帧,是提高视频摘要性能的关键环节。本文的主要工作就是对视频特征提取与关键帧提取的方法进行研究。主要研究内容如下:(1)特征提取:目前,大多数研究者倾向于选择人工预先指定的特征提取规则描述视频帧信息。但因视频内容的多样性,特定的提取规则不能够适用于所有视频,因此需要提取更具鲁棒性的特征。基于此,本文提出一种基于栈式自编码器进行特征提取的方法,该方法利用自编码器可以无监督学习到数据中的特征这一性质,通过构建深度神经网络模型,并采用逐层贪婪训练法训练栈式自编码器,构成特征提取模型,从而对视频帧进行特征提取。该方法可以随着视频内容的变化自主地学习特征空间,进而描述视频帧的信息。实验结果表明,通过该方法提取的特征对于视频内容具备更好的区分性,这使得生成高质量的视频摘要成为可能。(2)关键帧提取:为解决聚类算法在进行关键帧提取时,存在的需要预先设定聚类数目与聚类中心以及选取的关键帧不具有代表性的问题,提出一种基于层次聚类与TextRank算法相结合的关键帧提取方法。使用层次聚类算法对视频帧进行聚类,利用TextRank算法选择候选关键帧集合,通过求解优化函数选择最终的关键帧,并生成视频摘要。在两个具有不同视频类型的基准数据集上进行实验验证,结果表明,该方法提取的关键帧构成的视频摘要能够比较全面和准确地表达视频内容并且冗余度低。(本文来源于《太原理工大学》期刊2019-06-01)
王鈃润[10](2019)在《基于帧得分的视频摘要方法研究》一文中研究指出随着视频采集设施的普及以及互联网技术的发展,人们可以很方便地在互联网上分享视频,这使得互联网上的视频数据呈现爆炸式的增长趋势。视频数据的增加一方面可以丰富人们的社交生活,但同时也不可避免地造成一些问题,例如,用户浏览视频时间变长,视频检索速度变慢,视频网站需要更多视频存储空间等。为解决这些问题,视频摘要技术逐渐兴起并引起广泛关注。摘要是对原始视频内容的概括和浓缩,从原始视频中选出可以概括视频内容的静态视频帧或动态视频片段组成视频摘要。视频摘要的长度远小于原始视频,因而用户能够在较短的时间内了解视频内容。另外,利用视频摘要技术还可以加快检索速度,同时也可以节省视频网站的存储空间。现有的视频摘要方法大多首先根据人对视频摘要属性的主观判断和约束(例如代表性、重要性等),建立相应的数学模型,然后利用构建的数学模型对候选打分,最后通过线性或非线性地融合策略获取候选摘要的属性分数,并利用属性分数作为选取视频摘要的依据。但是,这些构建的数学模型有时候并不一定能够准确地体现视频摘要的属性,而且根据个人经验或偏好定义的属性也很难满足所有用户需求。另一方面,一部分视频摘要方法是对视频帧子集打分,选取得分最高的子集作为摘要,而视频帧子集往往也是数目庞大,计算复杂度也偏高。针对这些问题,本文应用机器学习算法,实现对视频帧的自动打分,提出两种基于帧得分的视频摘要方法——基于排序学习的视频摘要和基于跨模态相似性的视频摘要。(1)在基于排序学习的视频摘要方法中,视频帧的分数代表视频帧与视频内容之间的关系,分数高说明该视频帧可以更好的体现视频内容。基于排序学习的视频摘要方法选取分数高的视频帧组成摘要。在该方法中,为了使得学习得到的排序函数可以更好的符合人对视频摘要的认知规律,该方法首先通过概率分布函数得到排序函数对视频帧排列的概率分布,同时,得到数据库中人工对视频帧排列的概率分布。最后用交叉熵损失衡量两个概率分布的差异,损失最小时对应的参数就是最优参数,此时的打分函数也很好地模拟了人对视频摘要的认知过程。该方法的主要思想是模拟人的视频摘要的认知过程来对视频帧打分,相比于对视频帧子集打分的方法,计算复杂度显着降低。另外,该方法没有预先规定摘要必须具有某些属性。因此,基于排序学习的视频摘要方法在一定程度上克服了现有方法的缺点,在数据库上的良好性能也表明了该方法对视频摘要任务的有效性。(2)基于跨模态相似性的视频摘要方法主要是利用文本信息生成视频摘要。相关研究成果表明,视频文本信息反映了视频描述内容,因此可以挖掘文本信息协助生成视频摘要。基于跨模态相似性的视频摘要方法首先利用深度学习模型计算文本到视频帧空间的相似性和视频帧到文本空间的相似性,然后融合两种相似性作为最终的视频帧与文本的相似性得分,相似性得分较高的帧被选为摘要。该方法在利用两个模态相似性的同时也考虑了模态各自的特有信息,充分利用了视频的文本信息,进而提升了视频摘要选取的精度。基于跨模态相似性的视频摘要方法也是对视频帧计算分数,也没有人为约束摘要,在某种程度上克服了现有方法的缺陷,实验结果验证了该方法的合理性和有效性。(本文来源于《山东大学》期刊2019-05-20)
视频摘要论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为解决基于聚类算法的视频摘要中存在的需要预先设定聚类中心和聚类数目及选取的关键帧不具有代表性的问题,提出一种基于层次聚类与TextRank算法的静态视频摘要方法。使用层次聚类算法对视频帧进行聚类,利用TextRank算法选取候选关键帧集合,通过求解优化函数选择最终的关键帧生成视频摘要。实验结果表明,该方法生成的视频摘要能够比较全面准确地表达视频内容且冗余度低。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视频摘要论文参考文献
[1].胡胜红,贾玉福,桂超.面向足球视频摘要的叙事性拼图算法[J].信号处理.2019
[2].张璐,吕进来.基于层次聚类和TextRank的视频摘要[J].计算机工程与设计.2019
[3].白倩楠.基于变点检测的视频摘要生成方法研究[D].西安理工大学.2019
[4].李喻蒙.基于关键帧提取的静态视频摘要技术研究[D].西安理工大学.2019
[5]..抓落实保安全夺取夏粮丰产丰收——农业农村部副部长张桃林在全国“叁夏”机械化生产暨农机安全工作视频会议上的讲话摘要[J].当代农机.2019
[6].李大湘,朱志宇,刘颖.基于运动轨迹聚类的监控视频摘要算法[J].计算机工程与设计.2019
[7].朱树明.基于HEVC的压缩域视频摘要技术研究[D].安徽工程大学.2019
[8].程海鹰.基于特征融合的视频摘要生成技术研究[D].安徽工程大学.2019
[9].张璐.基于关键帧的视频摘要方法研究[D].太原理工大学.2019
[10].王鈃润.基于帧得分的视频摘要方法研究[D].山东大学.2019