导读:本文包含了图像编码器论文开题报告文献综述及选题提纲参考文献,主要关键词:图像语义分割,编码器-解码器,深度学习,生成对抗网络
图像编码器论文文献综述
刘贝贝,华蓓[1](2019)在《基于编码器-解码器的半监督图像语义分割》一文中研究指出基于深度卷积神经网络的图像语义分割方法需要大量像素级标注的训练数据,但标注的过程费时又费力.本文基于生成对抗网络提出一种编码-解码结构的半监督图像语义分割方法,其中编码器-解码器模块作为生成器,整个网络通过耦合标准多分类交叉熵损失和对抗损失进行训练.为充分利用浅层网络包含的丰富的语义信息,本文将编码器中不同尺度的特征输入到分类器,并将得到的不同粒度的分类结果融合,进而优化目标边界.此外,鉴别器通过发现无标签数据分割结果中的可信区域,以此提供额外的监督信号,来实现半监督学习.在PASCAL VOC2012和Cityscapes上的实验表明,本文提出的方法优于现有的半监督图像语义分割方法.(本文来源于《计算机系统应用》期刊2019年11期)
王万良,杨小涵,赵燕伟,高楠,吕闯[2](2019)在《采用卷积自编码器网络的图像增强算法》一文中研究指出将图像增强方法低光网络(LLNet)应用于实际场景下的彩色图像时会产生大量冗余参数,为此基于LLNet提出卷积自编码器网络(CAENet)的图像增强方法.将LLNet方法中的低光处理模块与网络训练衔接在一起;采用卷积网络代替传统自编码器的编码和解码方式.实验结果表明:CAENet能够有效节约时间成本,减少网络参数,使网络训练更加高效,得到更好的图像低维表示.在Corel5k数据集上的实验效果表明,CAENet在减少网络参数的同时,能有效提高图像光感和色感;在高分辨率数据集上的实验结果表明,针对图像细节方面,CAENet能够保留细节不失真;针对含噪低光图像,CAENet能在增强图像的同时达到去噪的效果,证明CAENet具有较强的鲁棒性.(本文来源于《浙江大学学报(工学版)》期刊2019年09期)
江泽涛,何玉婷[3](2019)在《基于卷积自编码器和残差块的红外与可见光图像融合方法》一文中研究指出为了在红外与可见光图像融合中充分利用中间层提取的信息,防止信息过度丢失,提出一种新的基于卷积自编码器和残差块的图像融合方法。该方法采用由编码器、融合层和解码器叁部分组成的网络结构。将残差网络引入编码器中,将红外与可见光图像分别送入编码器后,通过卷积层和残差块来获取图像的特征图;将得到的特征图采用改进的基于L1-norm的相似度融合策略进行融合,并将其整合为一个包含源图像显着特征的特征图;重新设计损失函数,利用解码器对融合后的图像进行重构。实验结果表明,与其他融合方法相比,该方法有效地提取并保留了源图像的深层信息,融合结果在主观和客观评价中都有着一定的优势。(本文来源于《光学学报》期刊2019年10期)
王雪[4](2019)在《基于堆栈自动编码器的植物叶片图像分类研究》一文中研究指出植物是地球上最基本的生命组成部分之一,保护植物种类多样性对维持地球生态系统的平衡至关重要。植物保护的前提是对植物有准确的分类和识别,以便完善植物数据库系统。为了解决基于传统机器学习方法的植物叶片图像分类准确率偏低的问题,利用堆栈自动编码器能够从原始数据中自动学习数据高层表示特征的特点,进行基于堆栈自动编码器的植物叶片图像分类研究,构建一个在植物叶片图像分类上性能良好的网络模型,提高植物叶片的分类准确率。本文的主要研究内容如下:(1)为了解决堆栈自动编码器过拟合的问题,在输入层连接一层去噪自动编码器,采用随机置0的方法对训练数据造成损坏,对受损数据进行特征学习,可以得到更具鲁棒性的特征,训练数据和测试数据之间的差异可以降低训练中过度拟合的可能性。(2)针对稀疏自动编码器不能对每个输入神经元进行稀疏限制的问题,在稀疏自动编码器上使用k稀疏方法,在隐藏层中仅保留k个激活值最高的神经元,剩余激活神经元归零。该方法实现对隐含层每个输入神经元的稀疏限制,使得训练阶段和测试阶段数据的稀疏不匹配,可以更集中于对叶片图像的关键信息进行特征表示,使得分类精度有所提升。(3)针对堆栈自动编码器的多层结构和大量的神经元导致训练时间很长的问题,在每层稀疏自动编码器输入数据上添加批量归一化,解决内部协变量偏移问题,可以加快网络模型训练速度,减少训练时间。(4)设计网络模型类比实验,验证改进的堆栈稀疏去噪自动编码器在植物分类上分类准确率提高,更具鲁棒性。(本文来源于《南昌大学》期刊2019-05-26)
史玉成[5](2019)在《残差自编码器在图像降嗓上的应用》一文中研究指出在如今信息高速发展的背景下,随着各种数字数码产品的普及,图像已经成为日常生活中最重要的信息载体,它包含着大量的信息,是我们获取外界信息的主要途径。然而现实中的图像在成像和传输过程中由于经常受到外部环境和成像设备的影响,图像的质量受到损害,严重影响后续图像处理和分析。因此长久以来图像降噪是机器视觉领域一个重要的研究分支,它在保证图像信息完整的同时,尽可能的去除图像中的噪声。然而,由于不同实际应用中图像噪声的数学统计分布各不相同,因此我们不可能一劳永逸地提出一种降噪算法来应对所有的噪声。随着神经网络技术的发展,基于深度神经网络的降噪模型已经表现出了很好的降噪能力,但是这种模型往往需要大量的标记数据和性能优越的集群进行模型的训练。然而对于一些特定的领域,如地震勘测、生物图像信息等,获取大量有效的标记图片几乎是不可能完成的任务。本论文结合当前的降噪自编码神经网络和传统的稀疏表示理论,提出了一种基于残差正则化的稀疏降噪自编码器模型。论文在最小化重构误差的基础上,增加了最小化相邻残差块之间相关性的正则化项,从而使残差统计特性更加接近噪声的统计特性,达到更好的降噪效果。另外通过滑动窗口的方式,将原始的图片切割成统一大小的图像块,这样新方法只用一张图片就能训练自编码器网络,完成图像降噪任务。本文提出的降噪模型在不同的图像数据集上进行了降噪实验,通过定性分析图像的降噪效果和定量分析图像降噪后的PSNR和SSIM值,并与经典的降噪算法进行对比。实验结果表明基于残差降噪稀疏自编码器模型具有很好的降噪性能,能够利用原始图片进行直接降噪,具有非常高的应用价值。(本文来源于《华中师范大学》期刊2019-05-01)
柯木源[6](2019)在《基于卷积自编码器的手机Logo图像异常检测研究》一文中研究指出手机Logo图像,作为手机外观的重要组成部分,其表面缺陷将严重影响智能手机的质量和消费者的使用体验。机器视觉作为一种无接触,无损伤的图像自动检测技术,凭借其精度高、响应速度快、安全可靠、能在恶劣生产环境下稳定工作的优势,已成为工业图像异常检测的一种常用技术手段。近几年,基于机器视觉的检测技术发展迅猛,已形成相应的技术体系,涌现了许多成熟的商用视觉算法软件。然而,手机Logo图像异常检测因为受到来料差异,光照变化,图像偏移,异常样本难以收集等因素的影响导致其检测准确率低下。本文以手机Logo图像为实验研究对象,结合优化算法、图像处理、深度学习等技术,运用基于卷积自编码器的无监督学习方法来对Logo图像进行异常检测,本文的主要工作如下:1.首先针对机器视觉中光源参数不稳定导致采集图像质量参差不齐的问题,本文创新性地将粒子群优化算法应用于打光机光源参数的调节,代替人工调节光源,构建打光参数优化系统。在光照质量不一的图像数据集上验证了多个无参考图像质量评价函数与人为主观视觉效果的一致性,最终确定图像信息熵函数作为粒子群优化中的适应度函数。在多个不同类型的手机产品上对基于粒子群优化算法的打光参数优化系统进行有效性验证。2.本文创造性地应用卷积自编码器对手机Logo图像进行无监督学习,获得的图像重建模型能够自适应生成与待测图像匹配的模版,用于与待测图像进行比较以实现异常检测。为了提高训练图片数据集的丰富程度,防止模型过拟合,使用叁种方法对训练数据集进行数据增强,分别是添加高斯噪声,对比度和亮度调整,旋转角度调整等图像处理方法。使用阈值分割、数学形态学处理等图像后处理方法来进行缺陷检测。最后在多个规模较大的Logo图像数据集上验证基于卷积自编码器的Logo图像异常检测系统的有效性。3.基于Python、PyQt、TensorFlow、OpenCV等技术,本文以模块化设计的方式开发了包括自适应打光参数优化系统在内的手机Logo图像异常检测系统,构建手机Logo图像异常检测自动化流程。(本文来源于《华南理工大学》期刊2019-04-11)
周叶萍[7](2019)在《基于编码器—解码器结构的眼底图像中视网膜血管分割的方法研究》一文中研究指出眼底图像是糖尿病性视网膜病和高血压性视网膜病等不同视网膜疾病的有用诊断工具之一。眼底图像中视网膜血管的分割结果能够辅助医生诊断潜在患者的病情,帮助医生大大减轻工作量,对医生的临床分析具有重要意义。由于视网膜血管的独特性,如何更高效地实现视网膜的血管分割仍是一个研究难点。最近,卷积神经网络(CNN)被广泛应用,并且在医学图像分割中表现出很好的性能。本文基于卷积编码器-解码器结构,构建了两种不同的卷积神经网络,来提高分割结果,并在可公开访问用于血管提取的数字视网膜图像(DRIVE)的数据集上进行了评估分析。本文主要的研究工作如下:首先,本文在卷积编码器-解码器结构上添加了两种跳过连接,其中,长跳过连接将编码过程的特征图连接到相应层次的解码器,使得上采样过程能够同时获得高层语义信息和浅层细节信息;短跳过连接在不增加网络计算复杂度的基础上,使网络通过学习残差映射来得到更好的收敛效果。实验结果表明,添加了跳过连接的模型能得到更好的分割性能。其次,为了充分利用网络在编码过程中学习到的特征,在跳过连接的分割模型的基础上提出了多路径融合的整合方式,来对分割结果进行微调。分别对不同层次学习到的特征图进行上采样,然后将不同路径的结果进行整合,来实现端到端的分割。通过实验对比,多路径聚合的分割模型提升了分割结果的精确度和AUC的值。最后,为了降低无用特征和解码过程中噪声的影响,提出了基于Attention机制的分割模型。通过在编码器和解码器中添加不同的空间软注意力,对特征图赋予一定的权值系数进行参数的调整,使得特征图中的重要信息得到更多的重视,而抑制不重要的信息。实验结果表明,在提升分割性能的同时,模型对血管像素的敏感度也得到了有效的提升。(本文来源于《华南理工大学》期刊2019-04-10)
靳海涛[8](2019)在《自动编码器的改进算法研究及其在基于高光谱图像的大米蛋白质含量检测中的应用》一文中研究指出近年来,随着人工智能技术的发展,深度学习受到越来越多专业学者的关注。自动编码器是一种典型的深度学习算法,堆迭自动编码器通过将多个自动编码器堆迭级联而成,以其优秀的特征提取能力被广泛应用于高维数据的降维处理中,尤其是非线性数据的处理,效果良好。但是在堆迭自动编码器数据降维中,无法评估提取的信息是否包含噪声。低秩矩阵恢复算法通过矩阵分解获取数据的低秩成分,从而实现了数据降噪。本文结合堆迭自动编码器的降维优势和低秩矩阵恢复算法的降噪优势,提出一种自动编码器的改进算法—低秩自动编码器算法,通过提取数据的深度鲁棒特征,提升自动编码器的算法性能。我国是大米的生产大国和消费大国,蛋白质含量是大米营养价值的重要指标,高光谱图像技术可以实现大米蛋白质含量的无损检测,但高光谱图像数据量大,且各波段间的信息具有较强的相关性,传统的线性降维手段在非线性数据降维上无法满足要求,同时高光谱图像夹杂的噪声也制约着最终分析的效果。本文以大米为研究对象,应用低秩自动编码器学习大米样本高光谱图像的深度鲁棒特征,并采用支持向量机回归构建大米样本蛋白质含量分析模型,实现了快速、精确、无损的大米蛋白质含量检测,验证了低秩自动编码器的高效性。具体研究内容和结论如下:(1)研究了自动编码器的原理并进行了算法改进。自动编码器具有优秀的特征提取能力,堆迭自动编码器通过将多个自动编码器进行堆迭级联而成,大幅提升了算法性能。应用低秩矩阵恢复算法于数据降噪的研究日趋成熟。本文结合堆迭自动编码器和低秩矩阵恢复算法,提出低秩自动编码器算法,在堆迭自动编码器训练网络的每一层隐含层训练前加入了低秩分解层,提取每一层神经元数据低秩或近似低秩的结构,该结构去除了大量噪声,然后进行相应隐含层数据的训练,设置合适的编码网络层数及各层神经元个数等参数,采用逐层贪婪训练法训练网络,最终提取最后一层隐含层的神经元信息,即训练数据的深度鲁棒特征。(2)获取了大米样本高光谱图像的光谱信息和图像信息。采集420个大米样本的高光谱图像(400-1000nm),获取感兴趣区域内平均光谱值作为样本的光谱信息,同时,分离感兴趣区域内各波段图像,每个样本得到478幅单波段图像,作为样本的图像信息。(3)从光谱信息、图像信息及光谱-图像融合信息叁个角度出发,采用主成分分析、堆迭自动编码器和低秩自动编码器叁种算法分别进行了特征提取,并结合支持向量机回归构建预测模型,以各模型效果为准,评估叁种算法的特征提取性能。第一,基于光谱信息的光谱特征构建预测模型。在特征提取前,对原始高光谱采用SG预处理,从而减少了采集过程中各种噪声的影响,然后基于叁种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果显示,基于低秩自动编码器提取的深度鲁棒光谱特征建立的模型预测效果最佳,_C~2为0.9926,RMSEC为0.0437,_P~2为0.9394,RMSEP为0.1232。第二,基于图像信息的图像特征构建预测模型。首先对获取的图像统一尺寸并转换为28像素×28像素的灰度图,进一步对灰度图作扁平化处理,变换为784维的列向量,然后基于叁种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果同样显示,基于低秩自动编码器提取的深度鲁棒图像特征建立的模型预测效果最佳,_C~2为0.9569,RMSEC为0.0860,_P~2为0.8769,RMSEP为0.3394。第叁,基于光谱-图像融合信息的融合特征构建预测模型。将478维的光谱信息和784维的图像信息进行有机融合,形成1262维的光谱-图像融合信息,基于叁种特征提取方法提取的特征,构建大米蛋白质含量预测模型。结果显示,基于低秩自动编码器提取的深度鲁棒融合特征建立的模型预测效果同样最佳,_C~2为0.9931,RMSEC为0.04,_P~2为0.9619,RMSEP为0.0854。纵观叁种模型,相较于主成分分析法和堆迭自动编码器,基于低秩自动编码器提取特征建模的性能最好,验证了低秩自动编码器的高效性。同时,基于光谱-图像融合信息的深度鲁棒融合特征建模的效果是叁个模型中最佳的,说明基于高光谱图像光谱信息和图像信息的融合信息进行特征提取,建立分析模型,能够实现更高效率的大米蛋白质含量快速、精确、无损检测。(本文来源于《江苏大学》期刊2019-04-01)
曹桂铭,丁香乾,高政绪[9](2019)在《基于栈式稀疏自编码器的青光眼眼底图像识别研究》一文中研究指出青光眼是一种常见的威胁视神经及视觉功能的眼病,其具有发病率高,难以察觉等特点。但是目前对青光眼的识别诊断方法还不是很完善,且识别方法复杂,识别率也不高。因此提出了一种基于栈式稀疏自编码器的眼底图像特征提取及图像识别的方法。该方法采用逐层贪婪训练法从无标签的数据集中学习到数据的内部特征,将学习到的特征作为softmax分类器的输入。然后利用带标签的数据通过反向传播算法对稀疏自编码器进行调优。仿真实验分析中,使用测试集数据对该方法进行验证,精确度可达89%,并且优于实验中的其他方法,对青光眼的识别具有一定的实用价值。(本文来源于《计算机与数字工程》期刊2019年02期)
欧庆芳,谢伙生[10](2019)在《基于自编码器图像重构的织物瑕疵检测算法》一文中研究指出针对含周期图案织物瑕疵检测通常要计算周期,而这又不适应纯色织物,本文提出适应2类织物的检测方法。首先设定检测块大小,按其在无瑕疵图像中随机提取图像块,并训练自编码器。然后将待检图像按设定大小分块,用自编码器重构,并计算重构前后的均方误差。最后对计算结果进行异常值检测,均方误差值偏大的为瑕疵块。实验表明,本文算法适应2类织物,容易实现,检测效果较好。(本文来源于《计算机与现代化》期刊2019年01期)
图像编码器论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
将图像增强方法低光网络(LLNet)应用于实际场景下的彩色图像时会产生大量冗余参数,为此基于LLNet提出卷积自编码器网络(CAENet)的图像增强方法.将LLNet方法中的低光处理模块与网络训练衔接在一起;采用卷积网络代替传统自编码器的编码和解码方式.实验结果表明:CAENet能够有效节约时间成本,减少网络参数,使网络训练更加高效,得到更好的图像低维表示.在Corel5k数据集上的实验效果表明,CAENet在减少网络参数的同时,能有效提高图像光感和色感;在高分辨率数据集上的实验结果表明,针对图像细节方面,CAENet能够保留细节不失真;针对含噪低光图像,CAENet能在增强图像的同时达到去噪的效果,证明CAENet具有较强的鲁棒性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
图像编码器论文参考文献
[1].刘贝贝,华蓓.基于编码器-解码器的半监督图像语义分割[J].计算机系统应用.2019
[2].王万良,杨小涵,赵燕伟,高楠,吕闯.采用卷积自编码器网络的图像增强算法[J].浙江大学学报(工学版).2019
[3].江泽涛,何玉婷.基于卷积自编码器和残差块的红外与可见光图像融合方法[J].光学学报.2019
[4].王雪.基于堆栈自动编码器的植物叶片图像分类研究[D].南昌大学.2019
[5].史玉成.残差自编码器在图像降嗓上的应用[D].华中师范大学.2019
[6].柯木源.基于卷积自编码器的手机Logo图像异常检测研究[D].华南理工大学.2019
[7].周叶萍.基于编码器—解码器结构的眼底图像中视网膜血管分割的方法研究[D].华南理工大学.2019
[8].靳海涛.自动编码器的改进算法研究及其在基于高光谱图像的大米蛋白质含量检测中的应用[D].江苏大学.2019
[9].曹桂铭,丁香乾,高政绪.基于栈式稀疏自编码器的青光眼眼底图像识别研究[J].计算机与数字工程.2019
[10].欧庆芳,谢伙生.基于自编码器图像重构的织物瑕疵检测算法[J].计算机与现代化.2019