导读:本文包含了目标检测及分割论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:目标,图像,深度,卷积,神经网络,语义,实例。
目标检测及分割论文文献综述
王旭,张幸,赵文仓[1](2019)在《基于改进群组归一化的目标检测与实例分割》一文中研究指出训练卷积神经网络,尤其是在使用ImageNet这种大规模数据集进行深层卷积神经网络训练时,往往需要投入几天甚至几个月的时间。为了加快神经网络的迭代收敛速度,通常需要使用批量归一化算法对训练网络的输入输出分布进行统一调整。本工作结合实例归一化方法对群组归一化进行了改进,并将改进后的该方法结合Faster R-CNN和Mask R-CNN进行了目标检测与实例分割实践。(本文来源于《青岛科技大学学报(自然科学版)》期刊2019年06期)
夏冬梅,李静,周亮[2](2019)在《基于视觉显着模型和图像分割的文化图像目标检测(英文)》一文中研究指出针对图像目标识别中的高效率视觉注意机制问题,提出了一种基于视觉显着模型和图像分割的文化图像目标检测算法。首先采用基于颜色分量对比度视觉显着模型对现有的视觉显着计算方法进行了改进,提高了显着区域检测的效率。然后在传统Grab Cut图像分割算法的原理上,结合改进的视觉显着模型来实现显着区域初始化,无需人工交互步骤,从而实现全自动的图像目标检测。测试数据结果表明:相比于现有的几种典型方法,提出算法具有较好的目标检测性能和较快的检测速度。(本文来源于《机床与液压》期刊2019年18期)
韩涛,辛欣[3](2019)在《基于最大熵的目标分割和检测》一文中研究指出论文研究图像分割包含两个简单子图象的合成图象,这两个简单子图象的先验知识是它们拥有全局最大熵。图象概率密度函数表明是准高斯型形式。估计概率密度函数的参数,然后将最大似然比检验法用于分割。采用迭代算法提高分割的准确性,扩展该方法用于任意概率密度函数的图象分割。(本文来源于《计算机与数字工程》期刊2019年04期)
林椿眄[4](2019)在《基于Mask R-CNN(FFM)的城市交通场景多目标检测与分割技术》一文中研究指出近年来,随着城市化和机动化水平的提高,城市交通问题日趋严重,社会各界对于智能交通、无人驾驶技术的需求也日益强烈。对于无人驾驶技术而言,感知周围环境并理解城市交通场景信息是实现无人驾驶的关键所在,即可归结为自然场景的多目标检测和分割问题。然而,当前在目标检测和分割方面的研究主要存在包括数据量单一、特征表征能力不足、模型性能不佳(特别是对小目标物体的检测和分割)等问题。本文的研究工作主要是基于深度学习模型,开展无人驾驶的环境感知研究,即对城市交通场景多目标进行识别、检测及分割等。首先,对于无人驾驶数据集问题,本文基于生成对抗网络GANs(Generative Adversarial Networks)的核心思想及其在图像生成领域的应用,提出一种W-DCGANs(Wasserstein-Deep Convolutional Generative Adversarial Networks)模型用于生成高质量的城市交通场景图像,在丰富数据的同时,也为后续环境感知模型训练和评估研究提供数据基础。其次,为了能够强化卷积特征提取过程并同时实现交通场景多目标检测和分割任务,本文提出一种新颖的Mask R-CNN(FFM)环境感知模型,在特征提取阶段引入一个特征融合模块FFM(Feature Fusion Module),联合Convolutional bone结构,融合多层级的特征并进行多尺度的特征金字塔变换。这不仅能够丰富特征表达,避免在特征映射过程信息丢失问题,还有助于提升模型的检测和分割表现。随后,基于所扩充的无人驾驶数据及环境感知模型Mask R-CNN(FFM),开展城市交通场景多目标检测与分割实验,以评估模型的整体性能及其鲁棒性表现。实验结果表明:Mask R-CNN(FFM)模型在多目标检测和分割任务上能够取得相当有竞争力的表现,特别是Convolutional bone结构和特征融合模块FFM的引入有助于提升小目标的检测和分割性能。此外,数据集的扩充不仅能够帮助感知模型的训练和评估过程,还能有效地改善了模型的鲁棒性表现。总的来说,本文的研究是非常有效且有现实意义:通过W-DCGANs模型扩充后的数据集不仅为模型的训练和评估提供数据基础,还能有效地提升模型的鲁棒性和泛化能力;而环境感知模型Mask R-CNN(FFM)能够实现非常有竞争力的多目标检测和分割表现。希望本文的研究成果能够促进无人驾驶技术及其相关领域未来的发展。(本文来源于《福建农林大学》期刊2019-04-01)
胡太,杨明[5](2019)在《结合目标检测的小目标语义分割算法》一文中研究指出卷积神经网络(Convolutional Neural Networks,CNN)可以提供比传统分类算法更强大的分类器并且能够自学习得到深层特征,有效地提高了图像语义分割的准确性.然而,基于CNN的语义分割算法依然存在一些挑战,例如在复杂场景中现有较优的方法较难分割小目标.为了解决复杂场景下小目标分割的难题,提出一种结合目标检测的小目标语义分割算法.与现有较优方法不同的是,该方法没有直接利用单个神经网络模型同时分割单幅图像中的小尺寸和较大尺寸目标,而是将小目标分割任务从完整图像的分割任务中分离.算法首先训练一个目标检测模型以获取小目标图像块,然后设计一个小目标分割网络得到图像块的分割结果,最终根据该结果修正整体图像的分割图.该算法提升了语义分割数据集的总体性能,同时能够有效地解决小目标分割的难题.(本文来源于《南京大学学报(自然科学)》期刊2019年01期)
陈旭林[6](2018)在《基于多方向模板及深度学习的线状目标检测与分割》一文中研究指出线状目标的检测与分割是图像处理中的重要内容,常见的线状目标如医学领域的毛细血管、遥感影像中的机场跑道和公路隧道中的裂缝病害等。近年来我国公路建设取得了长足的发展,极大地促进了相关地区的经济增长,但随之而来的一个问题便是公路的维修与养护。路面病害时刻威胁着人们的出行安全,传统人工检测伴随着主观性、不安全性和低效性,实现路面病害的自动化检测一直是广大科研人员的目标。裂缝是大多数病害的早期特征,在宏观上呈现出一定的长度、宽度与方向,是一类典型的线状目标。本文以裂缝检测作为主要研究内容,利用图像处理技术,提出了两种方法实现裂缝检测与分割。一个是传统方法,即利用多方向模板卷积实现裂缝分割;另一个是结合深度学习实现裂缝的检测及语义分割。具体工作如下:(1)设计多方向大尺度模板实现裂缝分割。在图像预处理部分提出了新的自适应阈值化算法,然后设计16个方向的大尺寸模板,用模板与经过二值化的路面图像进行卷积计算,最后对卷积结果进行阈值化,便能得到路面裂缝的分割结果图。算法对线状裂缝和网状裂缝都有较好的分割效果。(2)利用卷积神经网络实现裂缝检测。首先手动进行数据的切割与标注,把图像划分成96?96的小块作为网络输入。针对类别不均衡以及样本不充足的问题,提出了一种新的算法生成伪裂缝来扩充数据。公路图片训练集为167,328张,隧道图片训练集为179,718张。基于TensorFlow深度学习框架设计了一个卷积神经网络,在公路样本上获得96.01%的正确率,隧道样本的正确率为74.25%;然后基于多层感知卷积层思想以及多尺度卷积核思想对网络模型进行改进,公路样本的分类正确率提升到97.02%,结合生成的伪裂缝数据,隧道样本的正确率提升到89.72%。通过可视化技术解释了网络为何能实现裂缝分类检测,并设计单层卷积神经网络分析传统方法中多方向模板与卷积神经网络中卷积核的区别与联系。(3)利用全卷积神经网络进行裂缝语义分割。基于PyTorch深度学习框架设计了两个网络模型。第一个网络参考FCN,由前面裂缝分类的CNN网络改造而成,网络输入图片大小为96?96。用FCN网络对路面裂缝的分割结果较为粗糙,均交并比为0.5480;第二个网络参考U-Net,网络输入图片大小为256?256,U-Net网络对路面裂缝的分割质量较为理想,均交并比为0.6514。(本文来源于《西安电子科技大学》期刊2018-09-01)
戴军[7](2018)在《基于纹理特征和双门限分割技术的SAR图像目标快速检测方法》一文中研究指出针对已有的SAR图像目标检测算法多关注于如何提高检测概率而忽视检测效率,提出了一种同时具有较高检测概率和效率的检测新算法。首先,对原始SAR图像进行网格化,得到一系列网格;然后,根据每一个网格内的纹理特征和相应的鉴别准则将各个网格分为杂波区域和目标区域;最后,利用双门限分割技术提取出目标区域内完整的感兴趣区域。文中研究了用于分类的纹理特征包括:偏斜度、峰度、对比度、变差、差平均。实验结果表明,该方法产生的虚警极少,而且与单元平均恒虚警率检测器相比,检测时间至少可以降低60%(取决于算法选择的纹理特征)。(本文来源于《仪器仪表用户》期刊2018年08期)
刘培[8](2018)在《基于深度学习的图像目标检测与分割算法的研究与应用》一文中研究指出图像目标检测与分割技术在图像处理以及机器视觉领域起到了关键作用,由于图像信息的复杂多样性,对于图像目标特征不明显且有遮挡时,传统方法很难达到理想效果。近几年发展迅速的深度学习通过在大数据下自主学习得到的特征,在数量和性能上超出了人工设计的特征,在目标检测及分割领域超越了传统视觉算法。本文针对基于深度学习的图像目标检测与分割方法进行了深入研究。首先,Grabcut算法是一种应用广泛的交互式分割方法,本文针对该算法存在需要人工标注目标矩形框且运行时间长两大缺点,借鉴基于深度学习的目标检测方法并结合超像素分割算法,提出了一种基于深度学习的改进Grabcut分割算法,将自动提取目标框取代人工标注目标框。同时,采用超像素优化算法,减少迭代次数,提高了算法的运行效率,实现了基于目标检测模型的自动高精度分割算法,使轮廓尽可能的接近目标。其次,针对工业生产中智能监测和小型电子设备智能读数问题,本文采用迁移学习将基于深度学习的目标检测技术应用到工业图像中。从大量的图像信息中采样创建数据集,通过上万次迭代训练优化参数生成目标模型,分割出图像中目标位置和类别信息,实现对流水线作业智能监测,并根据电子设备读数实际问题设计了CNN深度卷积神经网络模型对分割出的目标区域中的数字信息进行精确识别。最后,本文对上述研究内容进行大量分析与测试实验,测试图片一部分选自公共数据集PASCAL VOC2007,另一部分是手持摄像头拍摄的工业图像。通过将本文算法分割结果与现有的分割方法进行了验证和对比,在确保方法正确、高效的前提下,将其应用到流水线作业智能监测系统中,为实现智能生产奠定基础。(本文来源于《燕山大学》期刊2018-05-01)
李澜[9](2018)在《基于Mask R-CNN的高分辨率光学遥感影像的目标检测与实例分割》一文中研究指出从高分辨率影像自动或半自动检测物体是遥感领域的一个重要研究课题。具有较高空间分辨率的光学航空和卫星影像与自然图像之间具有较小的特征间隙。因此,可以将深度学习算法应用于遥感影像的识别中。MaskR-CNN是目前最先进的深度学习模型,它具有强大的并行目标检测和实例分割的能力并在自然图像识别方面取得了很大的进展。本篇硕士论文将最先进的计算机视觉和深度学习领域的技术应用到遥感领域。其目的是探究Mask R-CNN在遥感领域的普适性。此外,由于遥感数据也是矢量地图的重要来源,因此该模型可应用在地图上找到遗漏的地理实体并提高矢量地图的质量。在实践中,由于遥感影像数据量大且有实时分析的需求,因此,提高模型训练速度也是非常重要的。首先我们做了一个多类别实验,检测并同时分割运动场地(棒球场,篮球场,田径场,体育馆,网球场)。此外,我们还通过将较深的骨干网络替换为较浅的骨干网络来评估模型的实际适用性。这个实验的目的是针对相对较小的遥感数据集来权衡结果精度和训练速度。此外,我们还在建筑物数据集上训练了一个单类别Mask R-CNN模型。此外,还使用3种不同的建筑密度(密集,中等和稀疏)数据集进行测试。在运动场地任务中,该模型实现了优异的目标检测性能0.956(ResNet101)/0.957(ResNet50)mAP 和 0.887(ResNet101)/0.865(ResNet50)mIU 的实例分割结果。对于相对较小的遥感数据集,浅层网络也可以获得和较深层的网络相似的结果,但节省了更多的时间。该模型从自然图像领域延伸到高分辨率光学遥感影像领域,表现出了相当好的通用性。而且,目标检测与较难的实例分割结果之间只有很小的差距。额外测试的影像和深圳高分辨率影像的进一步可视化显示出极佳的结果。该模型显示出对不同路面,不同尺度,不同形状,多个方向和影像形变的鲁棒性。在建筑物检测和分割任务中,该模型达到了 0.797(ResNet101)mAP目标检测结果和0.695(ResNet101)mIU实例分割结果,实现了相当好的性能。此外,在不同密度的住宅数据集中测试的结果显示,在稀疏和中等密度住宅影像上表现出相对良好的结果,但在密集住宅影像上表现不佳。(本文来源于《武汉大学》期刊2018-05-01)
郭继舜[10](2018)在《面向自动驾驶的语义分割和目标检测技术》一文中研究指出当今时代,人工智能开始引领各行各业的发展,计算机视觉作为人工智能最直接的应用领域,已成为当前的研究热点。与此同时,卷积神经网络的出现极大地推动了计算机视觉领域的发展。计算机视觉与神经网络相结合,其最为主要,也是最为热门的落地点便是在自动驾驶系统的车外环境感知。车外环境感知包括了各类不同的任务,主要包括了目标检测识别、行人骨架线识别、图像语义分割等。对于自动驾驶车外环境感知系统而言,理想状态是同时运行这些任务,得到多种类型的结构化数据。本文的研究工作围绕基于深度学习神经网络的车外环境感知技术展开,具体包括目标检测识别、行人骨架线识别、图像语义分割等,并对多网络的融合以及网络压缩进行了研究。针对目标检测识别中网络泛化性较差的问题,论文通过在原有网络的基础上引入动态残差网络结构,使得模型可以适应不同交通场景,从而优化最终的结果。在这一过程中,本文通过自行采集并标注数据,得到了相应的目标识别训练及测试样本。针对人体骨架线识别这一课题,论文采用基于RGB图像的人体骨架线估计方法,自下而上,首先检测图像中所有人关键点的位置;在得到检测结果之后,通过构建人体关键点亲和场对关键点检测结果进行连接,最终得到人体的全部骨架信息。在自动驾驶场景中,人体骨架线识别是行人行为预测以及交警手势识别的基础。针对在测试像素级语义分割过程中遇到的部分像素点分类错误的问题,通过观察具体测试案例,发现其分类错误的原因主要是由于模型未能有效获取区域性信息。针对这一原因,提出了多尺度池化拼接方法进行改善。该方法可以有效地提取不同像素面积的区域性信息,并将这些区域性信息与局部信息进行整合。同时,理论分析了不同池化算法的优劣及原因,并通过实际测试直观地体现了多尺度池化拼接方法在改善像素点分类错误问题方面的有效性。针对同时运行叁个模型所可能导致的总模型体积大、运行算力要求高、多个模型单独运作难以保证数据输出的同步性等一系列问题,研究了Root-Branch结构的混合增强网络MixNet。其中,Root部分实现了共用前端网络提取低层语义信息,有效减小了总模型体积以及运行时的算力要求;Branch部分实现了针对不同任务提取对应的高层语义信息,保证了模型的效果。这可以较大程度的提升算法在实时运行时的帧率,这点对于自动驾驶汽车车外感知极为重要,同时也利于算法的工程化应用。(本文来源于《电子科技大学》期刊2018-05-01)
目标检测及分割论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对图像目标识别中的高效率视觉注意机制问题,提出了一种基于视觉显着模型和图像分割的文化图像目标检测算法。首先采用基于颜色分量对比度视觉显着模型对现有的视觉显着计算方法进行了改进,提高了显着区域检测的效率。然后在传统Grab Cut图像分割算法的原理上,结合改进的视觉显着模型来实现显着区域初始化,无需人工交互步骤,从而实现全自动的图像目标检测。测试数据结果表明:相比于现有的几种典型方法,提出算法具有较好的目标检测性能和较快的检测速度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
目标检测及分割论文参考文献
[1].王旭,张幸,赵文仓.基于改进群组归一化的目标检测与实例分割[J].青岛科技大学学报(自然科学版).2019
[2].夏冬梅,李静,周亮.基于视觉显着模型和图像分割的文化图像目标检测(英文)[J].机床与液压.2019
[3].韩涛,辛欣.基于最大熵的目标分割和检测[J].计算机与数字工程.2019
[4].林椿眄.基于MaskR-CNN(FFM)的城市交通场景多目标检测与分割技术[D].福建农林大学.2019
[5].胡太,杨明.结合目标检测的小目标语义分割算法[J].南京大学学报(自然科学).2019
[6].陈旭林.基于多方向模板及深度学习的线状目标检测与分割[D].西安电子科技大学.2018
[7].戴军.基于纹理特征和双门限分割技术的SAR图像目标快速检测方法[J].仪器仪表用户.2018
[8].刘培.基于深度学习的图像目标检测与分割算法的研究与应用[D].燕山大学.2018
[9].李澜.基于MaskR-CNN的高分辨率光学遥感影像的目标检测与实例分割[D].武汉大学.2018
[10].郭继舜.面向自动驾驶的语义分割和目标检测技术[D].电子科技大学.2018