导读:本文包含了图像扭曲论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:图像,文本,形态学,文档,图像处理,版面,信息论。
图像扭曲论文文献综述
小林健太,傅尔得[1](2019)在《涂抹与扭曲:数字时代图像的噪音》一文中研究指出作为生活在东京的"90后"创作者,小林健太对摄影的理解,不仅突破了传统的定义,而且反映着他这一世代在接收、观看、理解及分享影像方式上所发生的转变。他的作品,无论是街道、城市景观,还是肖像、日常生活等,都在经过后期处理后,或是呈现出未干的油画被突然的外力所刮擦、涂抹的效果,或是呈现出日常照片被故意扭曲与失真的景象,这些通过数字软件的操作而有意(本文来源于《中国摄影》期刊2019年12期)
廖翔宇[2](2019)在《基于深度学习的水下扭曲图像恢复的研究》一文中研究指出图像是传递信息的重要方式之一,它能将信息以直观的感受传递给人类。然而图像在拍摄过程中可能受到各种各样的干扰,从而造成信息的丢失。当使用摄像设备尝试去透过水面拍摄水下场景时,水面的扰动就可能造成所拍摄的图像呈现出扭曲的状态。由于清晰的水下图像对于工业生产有着的重要的指导意义,许多国家都已对水下扭曲图像的恢复问题展开了应用研究,然而我国在这方面仍处于起步阶段。之前绝大多数的水下扭曲图像恢复技术都是基于视频的方法。而随着深度学习的兴起,通过单帧水下扭曲图像进行恢复已经成为了可能,然而目前的方法在成像质量上仍不够理想。本文针对水下扭曲图像的恢复技术展开了相关研究,为了提高水下扭曲图像的恢复质量,提出了两种算法。本文的主要工作如下:1.提出了基于密集连接的水下扭曲图像恢复算法。通过采用密集连接的生成对抗网络对水下扭曲图像进行恢复,并引入了WGAN-GP(Wasserstein generative adversarial networks-gradient penalty)对抗损失函数使训练更为稳定。在验证集上的结构相似性(Structural Similarity,SSIM)与峰值信噪比(Peak Signal to Noise Ratio,PSNR)分别达到了0.5595与19.925的成绩,并提高了其视觉效果;2.提出了基于注意力机制的水下扭曲图像恢复算法。通过引入注意力机制,设计了一个两步图像恢复算法框架:首先,采用一个扭曲注意力网络来学习水下扭曲图像的扭曲场,并生成注意力图;而后根据扭曲场对输入图像进行初步的扭曲恢复,并将其输出图像与注意力图输入另一个网络来进行细节的恢复,进一步提升图像的成像质量。本算法在验证集上的SSIM与PSNR分别达到了0.6022与20.522的成绩,视觉效果也有了显着提高。(本文来源于《华南理工大学》期刊2019-04-09)
王娜[3](2017)在《4芯片CCD图像的几何扭曲求解》一文中研究指出测量图像的几何扭曲对于高精度的天体测量非常重要,我们在成功求解单个CCD芯片几何扭曲的基础上,开展4芯片CCD图像几何扭曲的求解。我们的观测资料是从国家天文台与美国Arizona大学合作的Bok望远镜获得的,Bok望远镜由4个CCD组成,共获得了364幅CCD图像。归算以后的结果显示恒星残差的标准差在几何扭曲改正以后有了明显的提高。(本文来源于《中国天文学会2017年学术年会摘要集》期刊2017-08-08)
王兆亮[4](2017)在《基于Snakes模型的中文扭曲文档图像校正技术研究》一文中研究指出随着互联网和计算机信息技术的发展,数字图像处理技术已经深入到我们生活中的方方面面,通过图像采集将传统纸质文档电子化已经成为一种趋势;然而,在通过扫描仪或数码产品获得图像的过程,可能伴随着文档表面倾斜、弯曲或人工操作的视角倾斜等原因,仪器得到的图像可能会有一定程度的失真,如倾斜、扭曲、形变等,这些问题都会对文字处理软件如OCR识别、版面分析等的处理造成极大的困难,也可能这些软件根本无法识别获得的文档图像;因此,需要对这些变形扭曲的文档图像进行校正复原。本文将致力于解决扭曲图像的校正恢复问题;通过对扭曲文档图像特征及中文汉字结构的分析,并参考国内外相关的经典校正算法,对比分析各种方法的优缺点,针对中文扭曲文档图像给出了基于Snakes模型的校正算法。该方法为实现扭曲文档图像的校正处理,考虑到光照不均、过度曝光等因素造成较差二值化效果的不利影响,本文不做二值化处理,直接从灰度化后的图像着手。在灰度图像的基础上,通过优化后的高斯滤波处理使得文字行实现平滑的效果,达到增强文本行结构的同时也能很好的保护图像边缘信息的目的;然后利用脊线检测找出文本行的中心线,并将其初始化作为Snakes模型的初始轮廓线;然后利用图像分割的思想通过对Snakes模型的能量泛函迭代法求极小值的过程,使得中心线向文本行上下边缘移动,并根据图像的阈值信息把两条线闭合,然后根据字符文本的灰度信息进行扩张或缩放,完成文本行的分割并获得其文本线,最后利用文本行信息拟合重构其文本线实现校正。实验结果表明该算法能有效地恢复扭曲,使得校正后的OCR文字识别率比之前有明显的提升;而且该算法实现简单,对于扭曲文本行的分割精度非常高,算法鲁棒性较强,基本满足实用性需求。(本文来源于《北方工业大学》期刊2017-06-12)
张吉福[5](2017)在《文本扫描图像折痕检测与扭曲去除》一文中研究指出与传统的纸质文档相比,电子文档更便于信息的存储和传输。使用扫描仪获取文档的扫描图像是纸质文档数字化的常用方式。相对于平板扫描仪,高拍仪可以采用非接触的方式对诸如脆弱的古籍善本等珍贵历史文本进行成像。由于高拍仪没有机械机构将文本固定在平面上,所获得的文本图像的质量经常会受到一些特殊因素的影响,比如:折痕和阴影等。这些因素会对文本图像的视觉效果和后续的深入分析识别造成严重影响。本文围绕大幅扫描文本图像开展折痕检测和扭曲去除相关研究,所提出的方法能准确的定位扫描图像中的折痕位置并矫正折痕引起的亮度变化和几何扭曲,有效的提高扫描得到文本图像质量,为后续的文本分析识别奠定了良好的基础。本论文首先介绍了国内外文本边框检测、阴影提取和文档扭曲去除等问题的研究现状,然后在现有的文本边框检测和阴影提取基础上提出了一种基于路径搜索的大幅扫描文本图像的折痕检测方法,并且根据折痕两侧的阴影像素分布来去除文本图像折痕附近的亮度变化和几何扭曲。本文的主要内容如下:1.在折痕检测方面,提出了一种基于路径搜索的大幅扫描文本图像的折痕检测方法。该方法首先根据亮度特征对折痕进行粗定位,然后采用水平集凸包络算法提取折痕附近图像的阴影特征,并通过折痕扫描方向滤波、二值化和形态学处理得到候选折痕路径,最后建立候选路径的图模型并采用迪杰斯特拉算法得到折痕的精确位置,完成折痕检测。在真实高拍仪获取的报纸扫描图像上的实验结果表明,本文提出的方法能够精确定位出扫描图像中各种不规则折痕的位置,具有很强的鲁棒性。2.在折痕修复方面,分别对图像的亮度和几何扭曲进行矫正。在阴影提取的基础上,利用本质分解原理对图像进行亮度矫正。针对折痕附近存在几何扭曲现象,提出了一种基于阴影像素分布的扭曲去除方法。该方法根据定位出的折痕提取出折痕附近的文本图像,计算折痕上下和没有折痕处的阴影像素大小比例,估计出折痕对扫描图像产生的扭曲比例,对折痕附近的文本图像进行相应的拉伸或缩放处理。实验结果表明它能有效的去除扫描方向存在的扭曲。(本文来源于《湖南大学》期刊2017-04-20)
谢铠泽[6](2016)在《基于信息论的图像快速识别算法及对多场景像元扭曲的有效性分析》一文中研究指出本文基于信息论的主要理论,运用图像熵值的计算及比对。以自动驾驶过程中的路标识别场景为例,将待识别图像与经过大数据学习处理的标准标志牌进行图像熵的空间距离计算,以最似然结果作为识别结果。研究发现,该算法具备快速、精确的特点。对于短时间的应急识别响应有着较成熟的输入准备。且该算法对于27种不同程度的环境扭曲都有较强的抵抗力和较高的有效性,可以大幅度解决目前自动驾驶技术中导致错误识别的环境扭曲问题。(本文来源于《通讯世界》期刊2016年22期)
曾凡锋,段漾波[7](2016)在《一种复杂版面扭曲文档图像快速校正方法》一文中研究指出在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。(本文来源于《计算机应用与软件》期刊2016年06期)
童立靖,郑俊朝[8](2016)在《基于点云数据的扭曲文本图像倾斜校正方法》一文中研究指出针对传统二维层面的倾斜校正算法难以处理扭曲文本的倾斜,提出一种基于点云数据的扭曲文本图像倾斜校正方法。首先,通过叁维扫描仪采集文本的数据信息,重建文本的叁维点云模型,接着通过检测文本在空间中的位置,定义为空间倾斜与平面倾斜,最后实现文本的自动倾斜校正。实验结果表明,基于点云数据的倾斜校正算法在处理扭曲文本的倾斜校正正确率达到95%以上。(本文来源于《计算机应用与软件》期刊2016年06期)
段漾波[9](2016)在《复杂版面扭曲文档图像的校正技术研究》一文中研究指出随着信息技术以及人工智能技术的快速发展,依赖于计算机技术的数字图像处理技术得到了更加广泛的应用。OCR (Optical Character Recognition)光学字符识别技术作为一种数字图像处理技术,可以将文本图像中的文字信息自动识别并转换为纯文本信息。这种技术已经被应用到现代生活生产的诸多方面。然而,在具体应用中,采集图像的过程,可能由于采集设备自身条件以及图像几何位置造成图像失真,如扭曲、倾斜、形变等,这些都会使OCR识别率降低。因此有必要在OCR处理之前对图像进行一定的失真恢复处理。在诸多引起图像失真的因素中,有一类是由于图像扭曲造成的失真。而在图像版面复杂的情况下,这种失真将严重影响OCR识别。为了有效解决这个问题,本文提出一种复杂版面扭曲文档图像的校正算法。该算法通过对复杂版面扭曲文档图像的版面分析,以及扭曲文本行的分析,提出了基于文本线的窗口扫描校正算法。本文首先介绍了目前文档图像版面分析领域以及扭曲文档图像校正领域的最新发展现状,并对相关的经典算法进行了总结分析;以及对本文算法思路进行了简单的介绍。第二部分着重介绍复杂版面扭曲文档图像校正的相关技术,包括图像灰度化、二值化、去噪、图像裁边及形态学处理等等。第叁部分分析复杂版面扭曲文档图像的特征,提出本文算法的整体设计方案,并分析校正算法的可行性,第四部分介绍复杂版面扭曲文档图像校正方法的具体实现,对各功能模块的设计及具体实现进行详细介绍。重点介绍本文所提出的基于形态学方法的版面处理、文本行定位及窗口扫描校正方法。第五部分是实验结果和方法测评,利用OCR识别技术对本文方法进行分析及评价。最后实验结果表明,本课题提出的校正算法对于复杂版面扭曲文档图像,能有较好的效果;使得校正后的文字识别率有了大幅提升,方法在效率上亦有明显优势;有着广阔的应用前景。(本文来源于《北方工业大学》期刊2016-06-08)
孙婷[10](2016)在《基于连通域的中英文混排扭曲图像校正研究》一文中研究指出在如今的数字化时代,数字图像处理技术已被运用在许多行业之中。光学字符识别(optical character recognition, OCR)技术的发展,给人们的生活带来了许多便利。在OCR处理时,诸如光照不均、书本倾斜、书本过厚造成文本扭曲等问题,都会造成文本图像识别率降低。因此需要在OCR识别之前对图像进行失真校正。现有的校正方法大都基于单种文字,对于混排文本图像的处理都存在着局限性。本文针对中英文混排扭曲文本图像进行研究,分析该种图像的特征,总结现有针对中文或者英文文本图像的扭曲校正方法的特点,并进行对比分析。针对本文处理对象,分析各类方法的适用性,在此基础上提出本文的扭曲校正算法。在文章开始,介绍了扭曲文本图像校正方面的中外发展现状以及本文的研究内容,并对算法思路进行了展示。第二部分针对图像预处理相关技术进行了简单介绍。在这之后,对中英文混排扭曲文本图像的特征进行分析,介绍现有的扭曲校正方法,在其基础上提出本文算法,并对实用性进行了分析。然后介绍了本文校正方法的实现过程,其中重点介绍了文本行定位及文字切分算法,通过各模块的处理最终实现扭曲校正。接下来是对算法进行评测并对实验结果进行分析,以OCR识别率和算法校正时间作为参考对本文方法进行分析。最后,对本文方法进行总结。实验结果表明,本文方法能够解决文本扭曲所带来的OCR识别率下降的问题,并且有较好的实现效率,有一定的应用前景。(本文来源于《北方工业大学》期刊2016-06-06)
图像扭曲论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
图像是传递信息的重要方式之一,它能将信息以直观的感受传递给人类。然而图像在拍摄过程中可能受到各种各样的干扰,从而造成信息的丢失。当使用摄像设备尝试去透过水面拍摄水下场景时,水面的扰动就可能造成所拍摄的图像呈现出扭曲的状态。由于清晰的水下图像对于工业生产有着的重要的指导意义,许多国家都已对水下扭曲图像的恢复问题展开了应用研究,然而我国在这方面仍处于起步阶段。之前绝大多数的水下扭曲图像恢复技术都是基于视频的方法。而随着深度学习的兴起,通过单帧水下扭曲图像进行恢复已经成为了可能,然而目前的方法在成像质量上仍不够理想。本文针对水下扭曲图像的恢复技术展开了相关研究,为了提高水下扭曲图像的恢复质量,提出了两种算法。本文的主要工作如下:1.提出了基于密集连接的水下扭曲图像恢复算法。通过采用密集连接的生成对抗网络对水下扭曲图像进行恢复,并引入了WGAN-GP(Wasserstein generative adversarial networks-gradient penalty)对抗损失函数使训练更为稳定。在验证集上的结构相似性(Structural Similarity,SSIM)与峰值信噪比(Peak Signal to Noise Ratio,PSNR)分别达到了0.5595与19.925的成绩,并提高了其视觉效果;2.提出了基于注意力机制的水下扭曲图像恢复算法。通过引入注意力机制,设计了一个两步图像恢复算法框架:首先,采用一个扭曲注意力网络来学习水下扭曲图像的扭曲场,并生成注意力图;而后根据扭曲场对输入图像进行初步的扭曲恢复,并将其输出图像与注意力图输入另一个网络来进行细节的恢复,进一步提升图像的成像质量。本算法在验证集上的SSIM与PSNR分别达到了0.6022与20.522的成绩,视觉效果也有了显着提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
图像扭曲论文参考文献
[1].小林健太,傅尔得.涂抹与扭曲:数字时代图像的噪音[J].中国摄影.2019
[2].廖翔宇.基于深度学习的水下扭曲图像恢复的研究[D].华南理工大学.2019
[3].王娜.4芯片CCD图像的几何扭曲求解[C].中国天文学会2017年学术年会摘要集.2017
[4].王兆亮.基于Snakes模型的中文扭曲文档图像校正技术研究[D].北方工业大学.2017
[5].张吉福.文本扫描图像折痕检测与扭曲去除[D].湖南大学.2017
[6].谢铠泽.基于信息论的图像快速识别算法及对多场景像元扭曲的有效性分析[J].通讯世界.2016
[7].曾凡锋,段漾波.一种复杂版面扭曲文档图像快速校正方法[J].计算机应用与软件.2016
[8].童立靖,郑俊朝.基于点云数据的扭曲文本图像倾斜校正方法[J].计算机应用与软件.2016
[9].段漾波.复杂版面扭曲文档图像的校正技术研究[D].北方工业大学.2016
[10].孙婷.基于连通域的中英文混排扭曲图像校正研究[D].北方工业大学.2016