导读:本文包含了分割和标注论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:图像,向量,语义,模型,音频,单层,分水岭。
分割和标注论文文献综述
安郝敏[1](2019)在《基于图像分割算法的标注系统的设计与实现》一文中研究指出伴随着AI兴起的最为关键的技术莫过于深度学习,作为深度学习的基础,神经网络是一种以输入为导向的算法,其结果的准确性取决于接近“无穷”量级的数据。所以摒除那些复杂的中间环节,深度学习最为关键的就是需要大量的数据训练,这也是为什么在互联网大数据的时代,AI可以崛起。而在数据训练之前,又必须先对大量的数据进行标注,作为机器学习的先导经验。因此,催生了数据标注系统的产生。本文介绍了针对图像数据的标注系统的设计与实现。首先介绍了对现如今同类产品状况的调研与分析,论述了数据标注公司的优势与不足,强调了公司部门需求的特殊性和保密性。接着,通过进一步的需求分析对系统划分了功能模块及其子模块,明确了业务逻辑和流程,搭建了系统总体架构。在系统总体架构基础之上,对系统各模块功能的实现进行了详细设计,包括数据标注、数据审核等,同时涉及到人体姿态标注、物体标注、抠图标注等操作的流程分析,对所使用图像分割算法的讲解。本系统为基于SpringMVC框架的Web系统,数据库使用了关系型数据库MySQL,图像或短视频存储于Blobstore存储服务中,数据加载与标注信息绘制借助于JavaScript脚本函数与Canvas画布元素,除此之外还增设了多级审核机制,通过多重审核保障了标注数据的质量和效果。审核模块还用于审核机器标注的数据,目的在于统计其识别效率和正确率。目前,标注系统的种类已经越来越多,若想能够因地制宜的服务于企业的研究,就得设计和开发出适合本公司、本部门具体需求的标注系统,在保障数据安全、优质的前提下,来提高公司AI技术水平。(本文来源于《北京交通大学》期刊2019-06-01)
储相瑞[2](2019)在《视频资源的分割标注及组织管理策略的研究与实现》一文中研究指出随着互联网技术的发展,数字化学习资源呈“爆炸式”增长,逐渐改变着人们的生活方式和学习方式,驱动越来越多的人愿意借助数字化学习资源进行学习。在众多学习资源类型中视频资源具有生动形象的优势,可以较好的吸引学习者的注意力。因此在k12教育阶段,不管是学生用于学习还是教师用于教学,视频资源都是他们的青睐对象。一方面,由于专业教学资源库中的视频资源和K12知识体系的关联关系不够密切,面对内容良莠不齐、组织管理方式不够完善的海量级别网络视频资源,教育者和学生越来越难快速地找到可以满足需求的视频资源。另一方面,我们身边出现越来越多并非传统“教育视频资源”的资源却包含大量知识点和学习内容,这些趣味性视频资源正在不断积累,如央视综艺节目《是真的吗》等,以及各种UGC视频资源的某些视频片段均可应用到k12教育阶段不同课堂中的知识教授过程。针对以上问题,本文提出一种视频资源的分割标注及组织管理策略,从各类趣味性视频资源中挖掘出可用于k12知识点学习的视频片段,进而构建基于k12教育知识信息标注并使用优良策略组织管理的视频资源库,提供给各大学习平台,帮助教育者和学习者基于知识点的检索可以快速定位到视频资源。本文的主要工作包括:首先,基于相关理论和技术的调研,研究了视频资源的分割与存储、视频资源的规整、视频资源冗余备份及负载均衡的机制。其中通过基于众智的多知识主题词关联的分割标注策略、分割视频资源的虚拟存储策略、分割视频的加载播放策略实现了视频资源的分割与存储;从视频片段的规整和视频主题的自动生成两个角度实现对分割后视频资源的规整;除此之外,提出了基于安全性和负载均衡的备份策略以及基于负载均衡的视频资源调度机制保证了分割后视频资源的安全性和可靠性。然后,基于上述机制,设计实现了视频资源分割标注及组织管理模块。首先从功能、架构服务、数据库设计角度阐述了模块总体框架设计;然后详细介绍了模块中相关机制涉及到的核心接口的实现工作;最后描述了模块的功能实现工作,主要包含:视频资源呈现模块、视频播放模块、视频的分割标注模块。最后,笔者对视频资源分割标注及组织管理模块开展了实验分析、功能及性能测试工作,实验分析主要验证相关机制的有效性,功能测试主要包含页面呈现、操作响应、接口逻辑、机制融合结果以及结果是否符合设计预期,性能测试主要测试接口压力。结果表明系统模块具有一定的稳定性,相关机制具有有效性。(本文来源于《华中师范大学》期刊2019-05-01)
胡江策,卢朝阳,李静,邓燕子,刘阳[3](2018)在《采用超像素标注匹配的交通场景几何分割方法》一文中研究指出针对交通场景逐像素标注方法计算复杂、模型训练耗时长的问题,提出了一种基于超像素标注匹配的交通场景几何分割方法。该方法无需进行模型训练,根据全局特征搜索一组待分割交通场景图像的相似图像集。对待分割图像进行超像素分割和超像素块特征提取,并利用朴素贝叶斯原理进行似然比计算,根据似然比在相似图像集中进行超像素块标注匹配以实现初次分割。利用初次分割结果计算出一元势,应用全连接条件随机场模型对初次分割结果进行优化。实验结果表明,与传统的逐像素标注方法相比,本文方法的分割正确率和平均召回率分别提高了4%和3%,能够有效地实现交通场景几何分割。(本文来源于《西安交通大学学报》期刊2018年08期)
吴紫依[4](2018)在《基于人体运动捕捉数据的行为分割与语义标注技术研究》一文中研究指出人体运动捕捉数据能够精准地驱动虚拟人的运动,从而使虚拟角色达到真实流畅的运动效果,它已经广泛应用在了电视电影,叁维游戏,虚拟现实等领域。随着当今人体运动捕捉数据的海量增长,如何管理与重用这些数据已经成为亟待解决的问题。对已有的运动数据进行分析与处理是当前的研究热点,它在运动数据的管理与重用方面具有非常重要的作用。本文针对人体运动捕捉数据进行运动分析,主要包括运动数据的行为分割,运动数据单层语义标注和运动数据层次化语义标注叁方面。本论文的主要研究内容包括:在人体运动捕捉数据行为分割方面,提出NCWKK(Normalized Cut combined with Weighted Kernel K-means)行为分割方法。该方法利用归一化割模型(Normalized Cut Model)与加权核K均值(Weighted Kernel K-means)在矩阵的迹方面的等价关系,对运动序列进行聚类处理。将时序恢复之后的聚类结果表示为人体运动序列类别串,定义类别串中叁种不同状态的字符:有效子串,长字符与无效子串求取最终的分割点。NCWKK行为分割方法既实现了对人体运动序列的有效分割,也能找出同一条运动序列中具有相同语义类型的运动片段。在人体运动捕捉数据单层语义标注方面,提出导数分段聚合近似(Derivative Piecewise Aggregate Approximation,简称DPAA)语义标注方法。首先利用人体骨骼关节与平面几何的位置关系构造关系特征函数,计算得到单层语义运动模板。然后利用分段聚合近似(Piecewise Aggregate Approximation,简称PAA)对运动序列进行时序约减,将动态时间规整与导数动态时间弯曲(Derivative Dynamic Time Warping,简称DDTW)相结合,对待标注的运动序列与单层语义运动模板进行匹配计算,从而实现运动序列的单层语义标注。在人体运动捕捉数据层次化语义标注方面,提出层次化模板语义标注方法。该方法对运动数据构造隐马尔科夫模型,利用最大期望(Expectation Maximization,简称EM)算法对模型的参数与隐变量进行计算,通过迭代得到父层次运动类别模板与相应的子层次运动风格化模板。然后利用核典型时间规整(Kernel Canonical Time Warping,简称KCTW)方法,对父与子运动模板与未知语义的运动序列进行特征空间上的规整对齐,以此获得相应的规整距离,从而对父层次运动类别与子层次运动风格进行标注。(本文来源于《北京交通大学》期刊2018-03-01)
常子敏[5](2017)在《基于运动捕捉数据的人体运动分割和标注技术》一文中研究指出随着科技的不断发展,运动捕捉技术越来越成熟,相关的设备也越来的越先进。但是,运动捕捉的数据库规模也越来越大,因此,就需要对运动捕捉数据进行分割与标注从而更加合理的管理数据。本文将对基于运动捕捉数据的人体运动分割和标注技术进行分析与讨论。(本文来源于《明日风尚》期刊2017年13期)
李红岩[6](2017)在《叁维形状分割和标注的快速学习方法》一文中研究指出数据驱动的有监督联合分割可以通过先验知识的学习,达到更精确的分割与标注要求。然而,目前的有监督分割方法大多需要耗费大量的训练时间,不利于大规模数据集的扩展。为了提高学习效率,提出一种基于极限学习机同时对面片和网格边进行训练的快速的叁维形状分割和标注方法。进而通过图割优化进行分割边缘的平滑和优化,得到最终的标注结果。实验结果表明,在叁维形状的分割和标注过程中,该方法学习快速,且可以达到较高的分割精度和视觉效果。(本文来源于《计算机工程与应用》期刊2017年11期)
张荣,张烁[7](2017)在《基于分水岭的图像分割训练样本的自动选择和标注》一文中研究指出图像分割是图像理解、模式识别、计算机视觉等研究方向的一个重要研究内容。图像分割的方法有很多,将支持向量机(Support Vector Machine,SVM)应用于图像分割已是一种较为广泛的分割方法,但该方法大多采用人工方式来选取训练样本,降低了图像分割的自适应性,且有可能影响图像分割的质量,因此基于支持向量机的图像分割方法的研究内容是如何自动选择足够多且分布良好的训练样本,并自动进行类别标注。文章提出一种基于分水岭的图像分割训练样本的自动选择和标注方法,分水岭分割区域的中心点可以看作支持向量机的训练样本,将选取的训练样本对照分割参考图中的像素点进行类别标记。然后对训练样本进行训练,其中选择图像的颜色特征和纹理特征作为训练样本的特征属性。文章采用的彩色图像来自Berkeley图像数据库以及互联网,从实验结果可以看出文中提出的方法可取得很好的分割结果。(本文来源于《山西大学学报(自然科学版)》期刊2017年04期)
安佳佳[8](2017)在《基于图像分割的图像自动标注研究与实现》一文中研究指出随着互联网的不断发展及移动终端的兴起,网络中的图像数量呈指数级增长,图像数据大规模的增长对图像理解处理技术提出了更高的要求。如何准确地对这些图像数据进行归类和检索,一直是学术界关注的焦点。目前比较成熟的检索方法主要是基于文本的图像检索,用户通过输入语义关键词查询,搜索到自己想要的图片。但是由于“语义鸿沟”的存在,图像底层特征一般难以直接地表征图像的内容,及其包含的高层语义信息。为了更好的缩小“语义鸿沟”,图像标注技术应运而生。图像自动标注技术能够很好地从图像内容中理解得出高层语义信息,获取图像信息关键词,对图像进行自动标注,因而图像标注技术成为图像检索的关键。为了提高图像标注的准确率,本文的主要工作如下:(1)提出了一种纹理增强的图像分割算法,并将本算法应用到图像自动标注模型中。该方法采用JSEG图像分割方法的思想,但是JSEG图像分割方法只考虑了图像的颜色特征,而单一的颜色特征不能完整地表达图像的特征信息。基于这种不完备性,本文提出了一种基于纹理增强的图像分割方法,将小波纹理、LBP纹理特征与颜色特征地结合,通过实验验证该方法提高了图像分割的效果,同时将该方法用于图像标注模型中,实验数据表明,该方法也提高了图像的标注准确率。(2)本文设计并实现了一个图像自动标注系统。系统首先对图像进行分割,获得每个特征区域的底层特征信息(每个区域用一个特征向量表示),然后建立底层特征信息与高级语义之间的映射关系。本文采用分类效果好的支持向量机(SVM)作为分类器,对样本特征数据集建立训练模型。标注过程首先对待标注图像进行分割,然后利用训练好的分类模型对各区域的底层特征进行分类,通过查询底层信息与高级语义之间的映射关系,获得每个区域的高层语义信息,从而实现整幅图像的自动标注。(本文来源于《湖南大学》期刊2017-05-17)
邹响林[9](2017)在《基于图像分割和区域语义相关性的图像标注算法研究》一文中研究指出随着计算机技术、网络技术和智能通讯技术的飞速发展,大量的图像数据在网络上广泛传播,并且呈现爆炸式增长,如何有效地管理和利用这些图像资源已经成为当前面临的一项难题。虽然人们在图像检索领域已经取得了不少成果,但是仍然存在很多问题。基于文本的图像检索由于效率低和人为主观性早已无法满足当前大数据时代的需求;基于内容的图像检索由于无法解决“语义鸿沟”问题而阻碍了其发展;基于语义的自动图像标注是当前图像检索领域的主要发展方向,研究者在该领域做了很多研究和探索,但是仍然面临着很多技术难题。针对图像检索领域的研究现状和发展趋势以及当前所面临的诸多难题,本文提出了一系列有效的改进方法,主要有以下几点:(1)基于语义的自动图像标注需要利用图像分割算法对图像进行预处理,并且准确而有效的进行图像分割,对后面图像特征提取以及标注模型的构建非常重要。本文提出了一种改进的图像分割算法,该算法的基本思想是:首先使用Mean Shift算法对图像进行预分割,由于Mean Shift算法对图像边缘比较敏感,因而可以很好的提取出图像的边缘信息,但是该算法也很容易产生很多小的区域,针对这一缺点,本文利用Ncut算法对上一步得到的图像区域进行进一步处理,由于Ncut算法总是倾向于得到较大的图像区域,因而可以解决Mean Shift的过分割问题,并且由于Ncut处理的是已经分割好的图像区域,而不是像素点,所以大大减少了计算量,提高了算法性能,然而Ncut算法也存在一定的不足,该算法是一个NP难题,进行分割之前需要首先指定分割区域个数,如果该参数设置不当,也很容易产生过分割和欠分割现象,因而本文利用区域合并与分裂算法对Ncut处理后得到的分割结果进行进一步校正,对过分割区域进行合并,对欠分割区域进行分裂,尽可能提高图像分割结果的准确度。(2)本文提出了一种结合区域语义相关性和高斯混合模型的改进图像语义标注方法。传统的高斯混合模型都是直接根据语义后验概率的大小来得到图像标注结果:一种是直接选择语义后验概率较大的N个语义词作为图像的标注结果,另一种是直接选择语义后验概率大于某个阈值的语义词作为图像标注结果。而这种方法得到的标注结果并不准确,很容易产生一些多余的或者错误的标注词,影响标注结果的准确度。而且考虑到模型中的“语义鸿沟”问题,后验概率的大小并不能完全决定其权重,仅依据后验概率进行分类决策可能存在较大误差。针对以上问题,本文提出了一种基于区域语义相关性的GMM图像标注方法,将各区域之间的语义相关性融合到GMM模型中进行综合决策,对该模型的标注结果进行有效的校准和优化,从而提高标注结果的准确度。(本文来源于《华中师范大学》期刊2017-05-01)
孙卫国,夏秀渝,乔立能,叶于林[10](2017)在《面向音频检索的音频分割和标注研究》一文中研究指出解决大规模音频数据库快速检索的有效手段之一是建立合适的音频索引,其中音频分割和标注是建立音频索引的基础。文中采用了一种基于短时能量和改进度量距离的两步音频分割算法,使得分割后的音频片段具有段间特征差异大、段内特征方差小的特点。在音频分割的基础上进行了音频数据库中音频流的标注;分别基于BP神经网络算法和Philips音频指纹算法对音频进行了音频类别和音频内容的标注,为后续建立音频索引表做准备。实验结果表明,两步分割算法能较好地分割任意音频流,音频标注算法能有效进行基于音频类别和音频内容的标注,算法同时具有良好的鲁棒性。(本文来源于《微型机与应用》期刊2017年05期)
分割和标注论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着互联网技术的发展,数字化学习资源呈“爆炸式”增长,逐渐改变着人们的生活方式和学习方式,驱动越来越多的人愿意借助数字化学习资源进行学习。在众多学习资源类型中视频资源具有生动形象的优势,可以较好的吸引学习者的注意力。因此在k12教育阶段,不管是学生用于学习还是教师用于教学,视频资源都是他们的青睐对象。一方面,由于专业教学资源库中的视频资源和K12知识体系的关联关系不够密切,面对内容良莠不齐、组织管理方式不够完善的海量级别网络视频资源,教育者和学生越来越难快速地找到可以满足需求的视频资源。另一方面,我们身边出现越来越多并非传统“教育视频资源”的资源却包含大量知识点和学习内容,这些趣味性视频资源正在不断积累,如央视综艺节目《是真的吗》等,以及各种UGC视频资源的某些视频片段均可应用到k12教育阶段不同课堂中的知识教授过程。针对以上问题,本文提出一种视频资源的分割标注及组织管理策略,从各类趣味性视频资源中挖掘出可用于k12知识点学习的视频片段,进而构建基于k12教育知识信息标注并使用优良策略组织管理的视频资源库,提供给各大学习平台,帮助教育者和学习者基于知识点的检索可以快速定位到视频资源。本文的主要工作包括:首先,基于相关理论和技术的调研,研究了视频资源的分割与存储、视频资源的规整、视频资源冗余备份及负载均衡的机制。其中通过基于众智的多知识主题词关联的分割标注策略、分割视频资源的虚拟存储策略、分割视频的加载播放策略实现了视频资源的分割与存储;从视频片段的规整和视频主题的自动生成两个角度实现对分割后视频资源的规整;除此之外,提出了基于安全性和负载均衡的备份策略以及基于负载均衡的视频资源调度机制保证了分割后视频资源的安全性和可靠性。然后,基于上述机制,设计实现了视频资源分割标注及组织管理模块。首先从功能、架构服务、数据库设计角度阐述了模块总体框架设计;然后详细介绍了模块中相关机制涉及到的核心接口的实现工作;最后描述了模块的功能实现工作,主要包含:视频资源呈现模块、视频播放模块、视频的分割标注模块。最后,笔者对视频资源分割标注及组织管理模块开展了实验分析、功能及性能测试工作,实验分析主要验证相关机制的有效性,功能测试主要包含页面呈现、操作响应、接口逻辑、机制融合结果以及结果是否符合设计预期,性能测试主要测试接口压力。结果表明系统模块具有一定的稳定性,相关机制具有有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分割和标注论文参考文献
[1].安郝敏.基于图像分割算法的标注系统的设计与实现[D].北京交通大学.2019
[2].储相瑞.视频资源的分割标注及组织管理策略的研究与实现[D].华中师范大学.2019
[3].胡江策,卢朝阳,李静,邓燕子,刘阳.采用超像素标注匹配的交通场景几何分割方法[J].西安交通大学学报.2018
[4].吴紫依.基于人体运动捕捉数据的行为分割与语义标注技术研究[D].北京交通大学.2018
[5].常子敏.基于运动捕捉数据的人体运动分割和标注技术[J].明日风尚.2017
[6].李红岩.叁维形状分割和标注的快速学习方法[J].计算机工程与应用.2017
[7].张荣,张烁.基于分水岭的图像分割训练样本的自动选择和标注[J].山西大学学报(自然科学版).2017
[8].安佳佳.基于图像分割的图像自动标注研究与实现[D].湖南大学.2017
[9].邹响林.基于图像分割和区域语义相关性的图像标注算法研究[D].华中师范大学.2017
[10].孙卫国,夏秀渝,乔立能,叶于林.面向音频检索的音频分割和标注研究[J].微型机与应用.2017