导读:本文包含了视频语义内容论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:语义,视频,内容,对象,概念,事件,交通。
视频语义内容论文文献综述
林霄竹,金琴,陈师哲[1](2019)在《iMakeup:特定领域的大规模长视频数据集——用于细粒度视频语义内容描述》一文中研究指出实际生活中,大多数视频均含有若干动作或物体,简单的单句描述难以展现视频中的全部信息,而各类长视频中,教学视频步骤清晰、逻辑明确,容易从中提取特征并使用深度学习相关算法进行实验验证,从长视频中提取复杂信息成为研究人员日益关注的问题之一.为此,文中收集整理了一个命名为iMakeup的大规模的美妆类教学视频数据集,其包含总时长256 h的热门50类2 000个长视频,以及12 823个短视频片段,每个片段均根据视频的逻辑步骤顺序进行划分,并标注起止时间和自然语句描述.文中主要通过视频网站下载收集原始视频,并请志愿者对视频的详细内容进行人工标注;同时统计分析了此数据集的规模大小和文本内容,并与其他类似研究领域的若干数据集进行对比;最后,展示了在此数据集上进行视频语义内容描述的基线实验效果,验证了此数据集在视频语义内容描述任务中的可行性. iMakeup数据集在收集整理时注重内容多样性和类别完整性,包含丰富的视觉、听觉甚至统计信息.除了基本的视频语义内容描述任务之外,该数据集还可用于视频分割、物体检测、时尚智能化推荐等多个前沿领域.(本文来源于《计算机辅助设计与图形学学报》期刊2019年08期)
刘吉双[2](2018)在《基于语义内容的交通监控视频检索研究》一文中研究指出交通监控系统的广泛使用在一定程度上减少了交通事故数量,也给交通管理部门管理交通带来诸多的便利。然而人们要在海量的监控视频数据中提取所需的信息却异常困难,而且多数情况下需要人工干预,费时费力。例如当前交通管理部门使用较为广泛的通过交通监控系统抓拍交通违法行为,仍然需要人工参与才能准确判定驾驶员是否存在违法行为。本文主要针对以下几个问题提出了自己的解决方案。(1)对于人类而言,我们更加习惯使用基于关键字查询的方式检索所需要的内容,但是目前基于关键字的视频检索系统还存在诸多局限性;而且非专业用户查询视频相关内容时很难输入专业、精准且覆盖全面的检索词,因而得到的查询结果存在局限性,无法满足用户初始查询意图。为了得到更加符合用户查询需求的结果,本文引入了特定应用领域的领域本体,对查询输入语句进行语义扩展,从而得到更加符合用户需求的查询结果。(2)针对目前缺乏比较全面的针对交通监控事件本体的问题,本文中创建了基于交通监控事件的本体,并通过逻辑推理和实际事件验证了该本体的合理性。(3)针对目前已有的视频检索方案无法满足直接定位特定的交通事故场景的情况,本文将基于图像匹配的视频检索应用到检索特定交通事故场景中,针对具有明显特征的交通事故,检测结果较为准确。(本文来源于《重庆大学》期刊2018-04-01)
张德,王子玮,张峰[3](2017)在《基于语义空间统一表征的视频多模态内容分析技术》一文中研究指出视频是数据处理中综合性能最高,包含内容最广的载体。视频题目通过文字表达,内容通过连续图像帧表达,另外部分视频还包含背景音乐或者解说旁白。因此,视频处理即是对文字、图像、声音的多模态处理。着眼于多模态处理技术,提出基于语义空间统一表征的视频多模态内容分析框架,利用多种架构的深度神经网络,对视频的文字、图像、音频进行分别处理,为达到统一的功效,将不同结构的深度神经网络归结到语义空间,通过语义空间进行综合认知。提出的架构清晰、层次分明,对于视频理解的建模具有指导意义。(本文来源于《电视技术》期刊2017年Z2期)
邢玲,马强,胡金军[4](2016)在《基于场景分割的视频内容语义管理机制》一文中研究指出针对视频内容管理在不同层面存在语义鸿沟的问题,提出基于UCL(Uniform Content Locater)的视频语义描述框架,该框架包含了叁个层次的语义:内容语义、控制语义以及物理属性信息.而视频场景的分割则通过视频内容基于时空上的相似性实现.对于每个视频场景,结合局部纹理复杂度、背景亮度和场景复杂度,选择最佳参考帧(I帧)与非最佳参考帧(非I帧)以嵌入不同的语义信息:控制语义、物理属性信息嵌入I帧,内容语义嵌入非I帧.利用数字语义水印技术来实现视频内容的语义管理,完成语义信息和载体信号的一体传输和存储.实验中采用JM参考模型进行数字水印方法的验证,结果表明该方法鲁棒性强,且不会造成视频资源质量显着下降.(本文来源于《电子学报》期刊2016年10期)
杨培[5](2016)在《基于语义概念的特殊视频内容检测》一文中研究指出信息技术的发展、智能终端的普及,海量视频内容在互联网上传播,视频内容鱼龙混杂,大量煽动性的反动、暴恐视频充斥其中,成为危害社会和谐的安全隐患,对有害的视频内容进行有效检索、识别、过滤具有巨大的现实意义、应用价值,同时也极具技术挑战。本文对暴恐视频内容检测的问题及相关的技术方案进行了研究,主要工作内容包括以下几个方面:1.建立暴恐视频内容检测算法评测数据集。对特殊视频内容的研究现状进行了调研,对现有视频内容分类评测数据集进行了整理并作为参考建立了暴恐视频数据集,并从视频来源、种类、规格参数、标注内容等方面进行了统计分析。2.对视觉语义概念检测问题相关特征和分类器进行了研究。对于颜色直方图,本文研究了两种彩色图像直方图构建方法,以及直方图量化时参数选择;对颜色矩、局部二值模式和梯度方向直方图等特征在视觉语义概念检测中性能进行了详尽的实验研究。此外,使用了两大类共七种分类器,通过仿真实验确定分类器的分类能力及在不同语义概念检测中最佳特征的匹配问题。3.研究了基于语义概念的暴恐视频内容检测的关键技术及实现。提出了基于灰度质心的视频关键帧提取方法,确定了各视觉语义概念检测的特征与分类器最佳组合实例,并就基于语义概念的暴恐视频内容检测进行了实现和方案可行性的验证。(本文来源于《中央民族大学》期刊2016-05-10)
王华[6](2014)在《基于语义事件的手术视频内容分析和分割方法的研究》一文中研究指出随着计算机技术和网络技术的不断发展,各种新的媒体信息交换和应用形式已经完全融入了人们的日常工作、生活和娱乐之中,每天都在产生大量的视频数据。在医学领域同样也存在大量的视频用于辅助教育、术前宣教、远程医疗等。为了对蕴含了人物、场景、对象、行为和故事等丰富的语义信息的媒体数据进行高效快捷过滤、浏览和检索、非线性编辑等,人们提出并发展了视频的内容分析和基于内容的视频检索技术,以实现语义级的内容描述与应用。让计算机按照人的主观感觉和理解来表示媒体内容。如何跨越底层特征和高层语义间的语义鸿沟,以语义概念来管理、访问视频数据库,已成为多媒体领域颇具挑战的研究课题。在视频的内容分析过程中,特征的提取与描述是至关重要的一步。手术视频有其独有的特点,比如手术室中医务人员的着装颜色基本为墨绿色,手术室中的病人除了需要手术的部分,基本用手术布遮盖,有无影灯在手术过程为开的状态。根据这些特点,为了给手术事件建模,本文定义了医务人员指示器、手术部位检测器、无影灯开关指示器等视觉特征。隐马尔可夫模型作为一种统计分析模型,尽管它的状态不能直接观测到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有相应概率密度分布的状态序列产生。因此非常适合引入到基于语义的视频内容分析领域。在本文就通过将隐马尔可夫引入到基于语义的手术视频领域内容分析领域。基于隐马尔可夫模型进行基于语义事件的视频分析,不但考虑了事件特征之间的相似性,而且考虑语义事件之间的时序关系,为提高视频内容分析的准确率提供了理论上的可能。本文的实验基于五个完整的手术视频样本,并且已经人工标注过。通过样本重估了各个手术事件在各个特征的概率分布,并且通过Baum-Welch算法重估了状态转移矩阵,重估了一个隐马尔可夫模型。整个实验过程采用交叉留一验证的策略,对每一个待测试样本采用Viterbi算法来识别每个以秒为单位的视频单元,最终产生一个混淆矩阵来呈现分析的结果。目前的实验结果表明,对于选定的语义特征,有些事件的区分度比较高,则识别的正确率就比较高。一般的手术事件识别率能达到70%以上,证明采用隐马尔可夫模型对视频进行内容分析是可行的。(本文来源于《山东大学》期刊2014-05-20)
张良[7](2012)在《基于内容的视频情感语义分析关键技术研究》一文中研究指出随着多媒体技术的不断发展,数字视频近年来逐渐成为信息记录和传播的一种重要方式。传统的人工标注方法不能适应急速增长的视频数据分类和检索需求。在这种情况下,人们开始研究基于内容的视频语义分析技术,希望通过建立视频低层物理特征空间和高层语义空间的映射关系,从视频内容中提取能反映人类主观概念中的语义信息,自动对视频语义内容进行标注。情感语义是视频中最高层的语义信息,如何提取和描述视频所表达的情感语义信息是目前视频语义分析中重要研究方向之一。基于内容的视频情感语义分析有很高的技术综合性,其主要的关键技术包括情感语义模型构建、认知层语义分析技术、情感层语义分析技术以及基于情感内容的视频检索技术等,本文在这几方面做了深入的分析和研究,所做工作及主要创新成果如下:(1)设计了一种新的情感空问模型。根据情感产生的基本原理以及视频情感信息的特点,用“情感直方图”的方式来表达视频情感空间。该模型能够有效地进行情感类型描述和情感强度表达。(2)设计了一种基于本体论的视频情感语义分析框架。根据视频语义内容呈现的基本规律和本体论的研究成果,对视频本体的概念进行了定义,建立了一套函数体系和推理关系,并根据此框架设计了视频情感语义分析的整体流程。(3)提出了一套认知层语义分析的算法,认知层语义分析是情感识别的基础和重要步骤,本文对认知层语义分析中的视频对象分割算法、视频对象识别分类算法以及对象运动轨迹检测算法进行了研究,提出了一套改进的算法并进行了对比分析。(4)提出了视频“情感语义对象”的概念,分析了人类视觉系统(HVS)的注意机制,对视频内能够引起人们注意并产生情感反应的主要对象进行了识别和判定。将人工神经网络技术引入视频情感分析领域,构建了一种从认知层语义到情感层语义的映射模型。(5)设计了一套基于情感内容的视频检索系统,利用面向对象技术和关系型数据库技术,将视频分析获取的情感层语义内容采用结构化的方式进行存储和组织,提供有效的用户接口实现基于情感内容的视频检索。(本文来源于《北京邮电大学》期刊2012-03-20)
张聪,张瑞,杨小康[8](2012)在《基于内容的静态语义概念视频检索方法研究》一文中研究指出本文针对互联网视频检索技术的发展,阐述了目前主流视频搜索引擎的技术现状,分析了互联网视频检索的关键技术,特别是对于视频特征的提取技术。本文的创新点是提出了一种通用的基于内容的静态语义视频检索方法,该方法可以弥补基于文本视频检索的有关不足,并且在TRECVID的视频概念检索数据的静态语义概念中得到验证,运行稳定。(本文来源于《微计算机信息》期刊2012年03期)
张良,周长胜[9](2011)在《基于内容的视频语义分析关键技术》一文中研究指出分析了视频数据与文本数据的差异,以及视频数据在视频分析检索方面存在的问题。从视频内容分析领域的研究热点出发,分别对视频语义库、与视频分析相关的视频低层特征、视频对象划分与识别、视频信息描述与编码等方面的技术进行了分析和对比。并提出了一个视频语义分析的框架和分析流程。(本文来源于《电子科技》期刊2011年10期)
常军[10](2011)在《基于语义的视频内容检索中模糊不确定性问题研究》一文中研究指出近十几年来,随着计算机技术、网络通信技术和多媒体技术的飞速发展,视频信息处理的理论、方法和应用模式都有了巨大的变化,视频内容检索己成为多媒体信息技术研究和应用的活跃方向之一。视频语义中含有大量概念的、主观的成分,语义内容相当丰富,但视频图像的数字化表征,并不直观地体现其内容含义,视频语义信息的提取、理解和检索等重要环节均呈现出多样性和模糊性的特点,受限于当前图像理解技术的发展水平和对人类思维认知原理的揭示水平,基于语义的视频内容检索中不确定性仍是无法回避的关键难题,要在不确定性与确定性之间建立联系,从而使偏重主观定性的视频语义特征与偏重客观定量的视频视觉特征之间实现映射和转换仍需要面临许多挑战。本文对基于语义视频内容检索中关键环节所涉及的典型模糊不确定性问题开展研究:首先针对视频语义特征提取和分类时先验约束条件缺失问题和噪音样本、孤立样本等对语义对象智能分类的干扰问题进行研究;然后对多线索、多特征的复杂语义分类推理规则的冲突和不协调问题,及定性推理到定量推理的转换问题进行研究;以上述研究为基础,针对视频语义匹配中多粒度、多层次语义概念间关系匹配,以及语义相关性对检索的干扰问题进行研究。在基本理论模型和应用技术方法等方面取得了如下的成果和贡献:5.基于粗糙集属性约简的多分类模糊支持向量机视频语义提取过程中需要使用图像低层特征信息和先验约束条件进行智能分类和识别,因视频数据具有复杂性和时空多维性的突出特点,视频图像中诸多干扰因素,会造成分类识别所需的先验约束条件缺失,使目前许多分类方法失准,另一方面分类器训练样本中既存在噪音样本、孤立样本等干扰数据,也同时存在对分类边界无重要贡献的冗余数据。针对这些问题,本文将粗糙集属性约简原理与模糊支持向量分类器相结合,在分析和研究了模糊线性可分、近似模糊线性可分和模糊非线性模糊支持向量分类机的数学特性基础上,建立相应的分类函数模型并构造隶属函数,训练集经过属性约简处理后,减弱了噪音和孤点对分类的干扰,缩短了分类器训练时间,提高了多类别分类的精度。通过仿真实验验证,对UCI数据集中8组典型测试数据集分别采用此方法与1-r-1SVM、K-SVM. CS-SVM、FSVM方法对照,训练时间平均缩短了4.4%-34%,分类精度提高0.5%~7.65%。6.基于可能性测度和必然性测度的定量化模糊推理方法在理解和建立视频语义概念的过程中,需要以计算机能够实现的定量形式进行领域知识匹配和不确定推理,还需要面对多线索、多特征的复杂语义分类推理规则之间的冲突和不协调问题。针对这些问题,本文从可能性测度和必然性测度来出发,对定量化不确定性推理进行数学定义和描述,并从理论上证明和推导了有关性质,使其能够对给定命题进行数值转换和推理计算。还以包含度和相似度为基础,建立推理规则间协调度的量化评价关系,为识别复杂知识规则之间的冲突,进而消除推理时的矛盾提供了一种理论方法。7.基于WordNet的图像语义相似性度量方法;视频图像的语义在不同粒度、不同层次的抽象,可以蕴含多种语义概念关系,这些关系主要包括:局部与整体关系、上位与下位关系、同义关系等,当使用基于关键字进行语义匹配时,关键字本身难以直接体现概念间的多种关系。针对此问题,本文的研究借助WordNet的树形概念层次结构,提出依据词汇语义概念间的关系来组织标注关键词和检索关键词的思想,因概念树中两个结点之间有且仅有一条路径,路径的长度可以作为这两个概念的语义相似性的一种度量,从而将两幅图像间的语义相似度量转换成WordNet中词汇概念之间的路径距离,使图像语义概念之间关系得以体现,进而可实现其语义关系匹配。8.视频文档隐含语义相关性分析方法在视频片段的各帧之间,在语义结构的各层次之间均广泛存在着各种相关性,当使用向量空间形式表示和处理语义概念时,会产生同义与多义现象干扰检索结果的不利影响,其原因是表达语义概念的词汇数据之间存在着向量相关性,需要消除冗余的相关性,并要保留核心的语义内容。针对此问题,本文对隐含语义分析方法加以改进和扩展,提出视频特征词典空间的构建方法,以视频特征词典为基础,建立反映视频内容结构特征的视频文档集合矩阵,通过消减视频文档集合矩阵中的隐含相关向量,保留视频内容核心结构特征值,以达到消除相关性干扰的目的。经过TERCVID数据集进行仿真实验验证,对典型的17个语义项用本方法与对照的K-NN算法进行比较,本方法对其中70.59%的语义项检索效果优于对照算法,对17.65%的语义项检索效果与对照算法基本持平,取得了较好的效果。综上所述,本文以基于语义的视频内容检索为研究背景,对视频语义提取、领域知识推理、语义概念匹配等关键环节中所面临的几个典型模糊不确定性问题展开研究,在基本理论和应用技术方面为视频语义检索拓展了值得进一步深入探索和发展的途径,具有重要的理论意义和应用价值。(本文来源于《武汉大学》期刊2011-05-20)
视频语义内容论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
交通监控系统的广泛使用在一定程度上减少了交通事故数量,也给交通管理部门管理交通带来诸多的便利。然而人们要在海量的监控视频数据中提取所需的信息却异常困难,而且多数情况下需要人工干预,费时费力。例如当前交通管理部门使用较为广泛的通过交通监控系统抓拍交通违法行为,仍然需要人工参与才能准确判定驾驶员是否存在违法行为。本文主要针对以下几个问题提出了自己的解决方案。(1)对于人类而言,我们更加习惯使用基于关键字查询的方式检索所需要的内容,但是目前基于关键字的视频检索系统还存在诸多局限性;而且非专业用户查询视频相关内容时很难输入专业、精准且覆盖全面的检索词,因而得到的查询结果存在局限性,无法满足用户初始查询意图。为了得到更加符合用户查询需求的结果,本文引入了特定应用领域的领域本体,对查询输入语句进行语义扩展,从而得到更加符合用户需求的查询结果。(2)针对目前缺乏比较全面的针对交通监控事件本体的问题,本文中创建了基于交通监控事件的本体,并通过逻辑推理和实际事件验证了该本体的合理性。(3)针对目前已有的视频检索方案无法满足直接定位特定的交通事故场景的情况,本文将基于图像匹配的视频检索应用到检索特定交通事故场景中,针对具有明显特征的交通事故,检测结果较为准确。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视频语义内容论文参考文献
[1].林霄竹,金琴,陈师哲.iMakeup:特定领域的大规模长视频数据集——用于细粒度视频语义内容描述[J].计算机辅助设计与图形学学报.2019
[2].刘吉双.基于语义内容的交通监控视频检索研究[D].重庆大学.2018
[3].张德,王子玮,张峰.基于语义空间统一表征的视频多模态内容分析技术[J].电视技术.2017
[4].邢玲,马强,胡金军.基于场景分割的视频内容语义管理机制[J].电子学报.2016
[5].杨培.基于语义概念的特殊视频内容检测[D].中央民族大学.2016
[6].王华.基于语义事件的手术视频内容分析和分割方法的研究[D].山东大学.2014
[7].张良.基于内容的视频情感语义分析关键技术研究[D].北京邮电大学.2012
[8].张聪,张瑞,杨小康.基于内容的静态语义概念视频检索方法研究[J].微计算机信息.2012
[9].张良,周长胜.基于内容的视频语义分析关键技术[J].电子科技.2011
[10].常军.基于语义的视频内容检索中模糊不确定性问题研究[D].武汉大学.2011