导读:本文包含了文档图像论文开题报告文献综述、选题提纲参考文献,主要关键词:文档,图像,形态学,字符,算法,光学,在线。
文档图像论文文献综述写法
杨强,胡心宇[1](2019)在《基于图像识别技术的核电文档智能化应用实践》一文中研究指出为采用人工智能领域的新一代信息技术来有效提升实际业务开展的效率,达到降本增效的目的。本文对采用图像识别技术来辅助核电企业开展文档智能化应用进行研究。文章阐述了图像识别技术的概况、分析了采用图片识别技术的业务背景、项目实施的主要过程、项目实现的基本原理和典型应用场景解决方案等内容,通过对基于图像识别技术的扫描文件清晰度的自动化检测、基于光学图像文字识别技术的文件自动化拆分和比对这两个应用场景,阐述了所需要解决的问题、解决方案的原理、具体的程序功能设计方案以及最终的应用效果。根据对相关实际应用效果的评估,证明了采用图像识别技术的技术可行性,能够为文档智能化应用发挥重要的辅助作用。通过本课题的研究和实践,为基于人工智能等技术的文档信息化技术提升做出了有益的探索。(本文来源于《电力大数据》期刊2019年11期)
王平,张晓峰,王宜怀,程仁贵[2](2019)在《基于贪婪算法的文档图像中干扰线的去除》一文中研究指出各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础.(本文来源于《计算机系统应用》期刊2019年11期)
周文杰,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力[3](2019)在《基于形态学梯度算法的维文文档图像单词切分》一文中研究指出为提高文档图像字符的识别率,提出一种利用形态学梯度算法实现维吾尔文单词切分的方法。对维文文字的特点进行分析,综合利用形态学算法的基本特性,将文档图像中标点与单词分离开来,避免关键词与标点的误切。将形态学梯度算法用于文档图像分割,更好地寻找每个单词的边缘轮廓和边界,对单词进行有效切分。实验结果表明,该方法能很好地对维吾尔文单词进行切分,切分的准确率达到了97.96%,后续的多文种文档图像的对比实验验证了该方法在单词切分中的实用性。(本文来源于《计算机工程与设计》期刊2019年09期)
杨靖民[4](2019)在《复杂表格文档图像的模板识别与提取》一文中研究指出随着互联网信息技术的发展,越来越多的组织机构开始构建信息化系统以实现业务流程的无纸化处理,但涉及跨机构的协同业务时,由于保密等因素的限制,跨机构的信息化系统构建困难,所以目前协同业务基本仍在使用纸质表格文档作为业务载体。机构收到业务表格后,需要将表格信息录入内部信息化系统,录入工作以往由人工进行,而由于近些年业务数量持续增加,人工录入无法满足业务时效性要求,所以纸质表格文档的自动录入愈发重要。自动录入主要包括文本识别和版式提取,目前文本识别技术已经成熟,所以重点在于提取表格的版式,表格根据版式可分为有框线表格与无框线表格。通过影印扫描后得到表格图像,本文的目的就是从表格图像中提取出表格的版式。为提取出表格版式,本文定义了表格模板,通过提取模板实现表格结构与内容的自动化识别。其中,有框线表格图像的模板提取分为叁步,检测表格框线、还原表格结构、提取标题域,提取出的模板可用于对单张有框线表格图像进行分类;无框线表格图像的模板提取也分为叁步,提取表格文字块、标注训练语料、训练构词模型,提取出的模板可用于验证单张无框线表格图像识别结果并纠正文字块划分错误。本文设计并实现了复杂表格文档图像模板识别与提取系统。首先,论文阐述了研究背景及研究意义,给出了论文的研究内容、主要工作及章节安排。其次,对表格识别及图像相似度分析的相关技术进行了调研。然后,分析了系统的需求、设计了系统的总体架构,根据功能划分将系统拆分为模板提取与管理子系统和表格识别与分类子系统,分别给出了两个子系统的系统框架图,对两个子系统进行了模块划分。接着分别对两个子系统进行了详细的设计与实现,其中对检测表格框线以及还原表格结构的算法进行了改进,并提出利用空间位置信息还原表格行列的渐进式投影法和对齐特征查找法。最后,分别对两个子系统进行了功能测试和效果展示,验证整体系统符合设计原则并达到预期效果。(本文来源于《北京邮电大学》期刊2019-06-06)
李顺[5](2019)在《基于纹理特征的多文种文档图像文种识别研究》一文中研究指出随着信息时代的到来,在数字化大环境中,越来越多的资源以文本图像的形式保存。在全球化的进程中,国家之间交流日益频繁,在海量的信息处理过程中,光学字符识别技术(Optical Character Recognition,OCR)得到广泛应用。文种识别技术是OCR前端处理步骤,同样也是文本图像分析的一个重要环节,已经成为一个研究热点。文种识别的研究从1990年开始至今,已经取得不少具有重要价值的成果,大部分研究的数据库都只包含部分地区的文字,数据量少,不能确定适用于更多的文种。鉴于文种识别方法存在的一些问题,本文建立了多文种文档图像数据库,文种的选取包含全球通用文种、中亚文种和国内少数民族文字,具有普遍适用性。本文针对多文种文档图像的文种识别技术进行了相关研究。针对不同语言文字的构造特征、笔画书写特征、空间分布等存在一系列差异,在文档图像中所表现的就是不同的纹理特征,本文提出了基于离散曲波变换的文种识别方法和基于HOG特征的多文种文档图像文种识别方法。为提高单一纹理特征的文种查全率,提出了基于曲波变换纹理特征融合的文种识别方法。本文所做的主要工作如下:1.简述了文种识别领域的研究发展,总结了该方向取得的突出性研究成果,分析了多文种文档图像文种识别技术研究需要突破的难点。2.创建一个标准的实验数据库。分辨率为200dpi,图像尺寸为256×256,数据库包含中文、俄文、英文、土耳其文、哈萨克斯坦文、藏文、维吾尔文、吉尔吉斯斯坦文和蒙古文9个文种。每个文种各有1000幅图像。3.鉴于我们建立的数据库,扫描的书刊有些纸张软薄,会有另一面的影印。选取加权平均法灰度化、中值滤波去噪和全局阈值二值化对文档进行预处理,从而达到提取特征前的二值化图像的背景一样和降噪的目的。4.提出了一种基于离散曲波变换的多文种文档图像文种识别方法。利用文档图像经过曲波变换后得到的系数提取能量特征,组成特征向量。采用Bayes、LDA和SVM叁种分类器进行特征训练和分类。实验结果证明该方法优于传统的文种识别方法,如基于小波变换、二元复数小波变换、LBP等文种识别方法。5.提出了一种基于HOG特征的文种识别方法。计算和统计文档图像每一个区域的梯度方向直方图组成特征向量,采用不同的分类器进行特征训练和分类,与经典方法的对比实验结果证明,该方法特征提取时间短,且能准确地提取文档图像的纹理特征,有效提高文种查全率。6.提出了一种曲波变换纹理特征融合的多文种文档图像文种识别方法。利用曲波变换后的cell矩阵中的低频和高频系数,提取纹理特征,并融合图像统计特征,组成特征向量,采用不同的分类器进行特征训练和分类。实验结果证明该方法能有效地提取文档图像的纹理特征,提高文种识别效率。(本文来源于《新疆大学》期刊2019-06-03)
王鑫睿[6](2019)在《历史文档图像二值化算法研究》一文中研究指出文档分析与识别包含影像预处理、文字特征抽取以及数据库对比等技术,文档图像二值化对于整个系统至关重要,二值分割准确率直接影响识别结果的可靠性,由于历史文档图像存在页面污渍、字符褪色、纤细笔画、光照不均、墨迹浸润以及折迭印痕等多种退化因素,导致现有算法难以取得较好分割效果,因此本文围绕低质量历史文档图像二值化算法展开研究,主要工作及创新点如下:(1)针对低质量历史文档图像对比度较低问题,提出一种结合背景估计与能量函数的历史文档图像二值化算法。算法首先利用最小均值法对彩色图像进行灰度化,均衡字符灰度差异,增强图像对比度,其次利用基于信息熵的笔画宽度变换算法估计图像的字符宽度,然后采用形态学闭操作估计文档图像的大致背景,最后将去除背景的图像映射至能量函数,构造基于能量函数的图结构,通过图的最小割寻找能量函数的最优解,获取二值化图像。实验结果表明,算法能较好地抑制污渍背景,有效处理文字暗背景亮、文字亮背景暗的历史文档图像。(2)针对历史文档图像的二值化存在噪点问题,提出一种基于混合金字塔U型卷积神经网络(Hybrid Pyramid U-Net,HPU-Net)的文档图像二值化算法。首先基于上述算法的背景估计过程,获取去除背景后的文档图像,然后结合对数损失与Dice系数作为损失函数,采用卷积神经网络(HPU-Net)对减除背景的历史文档图像像素点进行分类,最后利用全局最优阈值方法(Otsu)获得二值分割图像。实验结果表明,该算法不仅可以保留笔画细节,而且分割精度较高。(3)采用文档图像二值化竞赛(Document Image Binarization Contest,DIBCO)所提供的数据集和评估指标,将本文提出的两种算法与十叁种图像二值化方法作对比,实验结果表明,在2016至2018年文档图像二值化算法竞赛,本文提出两种算法的F值(F-Measure,FM)、伪F值(pseudo F-Measure,p-FM)、峰值信噪比(Peak Signal to Noise Ratio,PSNR)、距离倒数失真度量(Distance Reciprocal Distortion,DRD)相较于性能次优的二值化算法最高分别有5.00%、5.82%、1.22dB、2.86%的性能提升。(本文来源于《湖北工业大学》期刊2019-06-01)
李翌昕,邹亚君,马尽文[7](2019)在《基于特征提取和机器学习的文档区块图像分类算法》一文中研究指出文档区块图像分类对于文档版面图像的理解和分析至关重要。在传统机器学习分类模型中,直接使用图像作为输入会导致学习模型参数量过大而无法进行有效的训练。为了克服这个困难,我们针对文档区块图像设计了一组有效的特征,并提出了基于这些特征和机器学习的文档区块分类算法。在特征设计上,我们提取了几何、灰度、区域、纹理和内容五方面在内的32种特征,以增强特征针对区块类别的分辨能力。在分类器方面,我们在所提出的特征上对传统机器学习分类模型、自动机器学习方法以及深度学习均进行了实验。在公开数据集上的实验结果表明,我们提出的文档版面区块分类算法具有很高的分类准确率,并且效率很高。另外,我们实现了一个简单的分步文档版面分析算法,以展示所提出的区块分类算法的推广能力。(本文来源于《信号处理》期刊2019年05期)
黄泽涛[8](2019)在《基于字符的文档图像方向矫正研究》一文中研究指出近年来,计算机视觉领域的发展日新月异。其中光学字符识别(optical character recognition,OCR)作为计算机视觉的一个重要分分支,旨在从图像中准确识别出所包含文字。而在现实生活和办公中,扫描文档图像作为文字的一种重要载体,准确对其进行OCR识别能够大大减少人力成本。但是获取文档图像的过程中,有很多因素将导致最终的文档图像处在错误的方向。例如扫描前没有将文档放在正确的方向,或者所获取的图像方向信息丢失。而这将影响OCR识别效果和后续图像处理工作。针对文档图像可能处在的四个方向,本文提出了基于字符的文档图像方向矫正算法。该算法从文档图像所包含的字符出发,通过分析字符方向以确定文档方向。本研究的主要工作如下:1.提出的基于字符的文档图像方向矫正方法,首先利用文本行检测和字符分割方法以确定字符位置,然后对文档内的字符进行方向分类以确定文档方向。最终在CASIA-HWDB2.1文档图像测试集上测试,准确率达到97.0%。2.提出了基于全卷积网络(fully convolutional network.FCN)的字符分割方法,可以端到端的判断文本行图像每一列是否为分割线,较传统图像处理手工设计的特征而言,能够更好的分割粘连字符。3.提出了基于残差神经网络(residual neural network.ResNet)字符图像四方向(同文档图像四方向)分类方法,在CASIA-HWDB1.1字符图像测试集上的准确率达到98.4%。本文提出的基于字符的文档图像方向矫正算法,准确率高具有实用性,且无需人工设计特征、因此能适应各种类型文档。(本文来源于《天津师范大学》期刊2019-05-21)
李顺,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力[9](2019)在《基于离散曲波变换的多文种文档图像文种识别》一文中研究指出为提高文种识别效果,提出一种基于离散曲波变换的文种识别方法。利用文档图像经过曲波变换后得到的cell矩阵中的实数曲波系数,提取共82维能量特征;使用贝叶斯、KNN和判别分析3种分类器进行训练和分类。对两个数据库进行实验,数据库1包含8种文字共1600幅图片,使用3种分类器得到平均大于99%的识别准确率;数据库2包含10种文字共10 000幅图片,得到平均大于98%的识别准确率。实验结果表明,该方法运算速度快,具有良好的鲁棒性,识别效果优于基于小波变换的文种识别方法和基于二元复数小波变换的文种识别方法。(本文来源于《计算机工程与设计》期刊2019年05期)
马云琪,陈庆春,周国剑,类先富[10](2019)在《在线传输电子文档图像脱敏系统设计与实现》一文中研究指出伴随着网络传输的高效便捷,个人隐私信息泄露等问题也是屡见不鲜。较之普遍的文字敏感信息,图像中所涵盖的隐私信息也不容忽视,例如电子文档内嵌的个人证件图像等。在文本信息的数据脱敏技术日益完善的同时,隐私图像数据泄露的问题亟待解决。着眼于生活工作中网络传输的电子文档中包含图像的电子文档脱敏需求,在研究HTTP协议、Word文档二进制格式和图片格式的基础上,结合HTTP协议解析、文档解析以及图片解析,利用网络数据包的抓取、修改和传输等操作,提出了一种在线传输电子文档图像脱敏技术解决方案。(本文来源于《信息通信》期刊2019年04期)
文档图像论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
各种文档中经常包含有各种特殊作用的横线、手划线等,当这些文档通过扫描等数字化方式存入计算机并需要进一步识别处理成文字编码时,这些线条却成为OCR的干扰因素,降低了文档内容的识别率.为此,本文提出一种新的文档干扰线去除算法,先将文档图像二值化,二值化过程考虑了不均匀光照带来的影响;然后将前景细化为单像素,减少线条粗细造成的影响;接着通过一种改进的贪婪算法计算横、竖两个方向线段的权重,判断权重较高的线段为干扰线;最后通过与干扰线距离的大小判断图像中每个前景像素的归属,从而获得一个完整的文档恢复图.仿真实验表明,本文提出的算法能够有效去除干扰线,特别在干扰线与文字粘连的情况下,去除干扰线的同时较少地影响文档图像的质量,且具有较高的计算速度和较好的去除效果,为图像进一步OCR识别提供了良好的基础.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文档图像论文参考文献
[1].杨强,胡心宇.基于图像识别技术的核电文档智能化应用实践[J].电力大数据.2019
[2].王平,张晓峰,王宜怀,程仁贵.基于贪婪算法的文档图像中干扰线的去除[J].计算机系统应用.2019
[3].周文杰,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于形态学梯度算法的维文文档图像单词切分[J].计算机工程与设计.2019
[4].杨靖民.复杂表格文档图像的模板识别与提取[D].北京邮电大学.2019
[5].李顺.基于纹理特征的多文种文档图像文种识别研究[D].新疆大学.2019
[6].王鑫睿.历史文档图像二值化算法研究[D].湖北工业大学.2019
[7].李翌昕,邹亚君,马尽文.基于特征提取和机器学习的文档区块图像分类算法[J].信号处理.2019
[8].黄泽涛.基于字符的文档图像方向矫正研究[D].天津师范大学.2019
[9].李顺,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于离散曲波变换的多文种文档图像文种识别[J].计算机工程与设计.2019
[10].马云琪,陈庆春,周国剑,类先富.在线传输电子文档图像脱敏系统设计与实现[J].信息通信.2019