导读:本文包含了字符提取论文开题报告文献综述、选题提纲参考文献,主要关键词:字符,特征,图像处理,图像,阈值,方差,号牌。
字符提取论文文献综述写法
李海浩,顾滨兵,刘艳平[1](2018)在《场景图像中文本区域字符提取方法研究》一文中研究指出随着计算机技术的发展,光学识别技术的发展已较为成熟,但自然场景图像包含较复杂背景,字符的提取和识别技术难度相对较大。在自然场景中文本区域提取技术的基础上,提出了一种字符提取模型,详细介绍了基于局部重迭阈值的图像二值化算法,通过字符的水平、垂直投影技术,实现了单个字符边界的划分,并根据字符的某些特征对非字符进行了过滤,最终实现了字符的提取。(本文来源于《计算机与数字工程》期刊2018年12期)
朱健菲[2](2018)在《档案图像版面分析与字符提取方法研究》一文中研究指出基于图像处理技术的文档数字化重构是模式识别研究的一个重要领域。将纸质档案原件影像化,通过图像处理、字符识别等技术实现文档的版面分析与版面理解并最终实现文档版面数字化重构,转化为数字化的文档资源并以双层PDF文档、Word文档等形式呈现,以互联网为媒介服务大众,极大地便利了档案资料的检索、查阅、保存与传播等工作。版面分析与字符提取是文档数字化重构的重要基础步骤,尤其是在这个追求个性与创造的时代,文档版面的排版结构越来越复杂,图片、文字、表格等元素甚至印刷体与手写体的混合排版对版面分析与字符提取带来了很大的挑战,异构文档图像版面分析的任务是实现版面多种组合元素的分解,将复杂的版面同构化为同质化的单一区域,进而通过字符提取、字符识别实现文档版面理解,进而实现版面重构。针对文档图像版面分析与字符提取问题,本文的主要研究工作体现在以下两个方面:(1)基于深度迁移学习的文档版面目标检测研究。由于文档图像版面中公式、表格、插图等基本图像单元排版的无序性与多样性,传统的版面分析方法针对不同的文档图像往往需要不同的处理策略,并且文档版面区域的定位与分类模块完全独立,不仅导致系统的冗余还严重限制了系统的通用性。为了更好的实现文档版面的区域定位与分类,同时克服文档图像标注样本数据不足的缺陷,提出了一种基于深度迁移学习的文档版面目标检测方法。由于在自然场景的语义理解方面具有大量的标注数据集来做深度学习的研究支撑,本文采用迁移学习的方式将自然场景下的目标检测模型迁移到文档版面目标即公式、插图、表格的检测任务上。在一个网络框架下同时实现了文档版面多种目标的检测与界限框的定位,提高了系统的通用性,实验结果表明该算法具有较高的准确率,不仅实现了文档图像版面区域的识别还实现了版面目标的精确定位。(2)无约束书写条件下的手写文本行提取算法研究。在没有基准线与界限框约束的条件下,自由书写的文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。传统的文本块几何线分割或超像素聚类的方法一般都无法保证文本行边缘字符笔画的精确分割。针对这些问题提出了一种改进的方案,文本行回归-聚类联合框架。首先,利用拖尾效应提取文本行主体区域,并结合形态学处理对其骨架化得到文本行回归模型。然后,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现字符连通域的聚类,并分配所属文本行标签。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。(本文来源于《五邑大学》期刊2018-05-01)
彭继彬,陈晓荣[3](2017)在《基于HALCON的票据字符提取系统设计与实现》一文中研究指出票据特殊字符提取识别工作量大、效率低。针对该问题,以HALCON作为机器视觉和图像处理核心软件,将计算机视觉检测技术应用于票据的特定字符识别,包括阈值分割、填充缝隙与滤波、图像分割和ORC图像处理等图像处理关键技术,实现图像采集、预处理和检测识别。(本文来源于《软件导刊》期刊2017年04期)
郑巧,唐鹏,韦璞[4](2016)在《基于自适应投影分割的接触网号牌字符提取》一文中研究指出针对接触网故障巡检,传统的人工巡检方式效率低下,不能及时发现潜在安全隐患。基于此,针对接触网的智能视频巡检,成为目前研究的重点。对接触网图像的智能分析,首先要实现对接触网杆的定位识别,而对接触网号牌字符进行精确提取,是实现接触网号牌识别的前提。由于背景干扰,传统的Hough矩形检测识别率较差,现提出了一种基于几何特征检测及自适应投影分割的接触网号牌字符提取方法:首先对号牌的矩形结构进行拆分检测,分别对不同方向的线条进行检测,求取不同方向的边框宽度及坐标,得到精细号牌区域,再采用自适应投影分割方法对单个字符进行提取。实验证明,该方法的字符提取正确率在92%以上,验证了该方法的有效性。(本文来源于《信息技术》期刊2016年05期)
唐瓒[5](2015)在《图片字符提取数字化处理浅谈》一文中研究指出图片字符提取数字化处理是指把图片中的数字和字符单独提取出来,并转换为方便我们调用的double格式和char格式。本文是对图片字符提取数字化处理的各个步骤进行简单的介绍,没有使用实际的案例。(本文来源于《通讯世界》期刊2015年01期)
殷羽,郑宏,王静,李圣,王震[6](2015)在《一种自适应烟标字符提取方法》一文中研究指出针对印刷质量不高、背景复杂的烟标字符难以提取问题,提出了一种自适应的烟标字符提取算法。通过对单通道烟标图像进行背景重构后,根据支持向量机中得到的训练模型自适应选取最优二值化方法;提取标准轮廓定位字符区域;结合标准轮廓,同时根据最优二值化图像投影直方图进行烟标字符提取。经过实验验证,该方法能够自适应地选择最优二值化方法,字符提取精度可达到90%以上,同时原理简单、鲁棒性强并便于硬件实现。(本文来源于《计算机应用研究》期刊2015年04期)
周启亚,杨高波[7](2012)在《MPEG-2压缩域车辆牌照字符提取算法》一文中研究指出针对车辆牌照字符这一特殊场景文本的提取,提出一种压缩域文本提取算法,它集文本区域检测、定位、跟踪和字符识别等环节于统一的框架。直接利用DCT系数可以表征图像的纹理特征这一特性,建立加权频率分量和的自适应阈值判断规则初步检测车辆牌照区域,利用分块的DC+2AC纹理值投影特征进行文本定位;利用与定位得到的文本框相交面积高于预定阈值的宏块运动矢量均值实现跟踪;在OCR识别前采用OTSU算法把车辆牌照区域图像转换为黑白二值图像。实验表明了算法的有效性,召回率与准确率分别可达95%与96.2%,该算法也适用于其他类型文本的提取。(本文来源于《计算机工程与应用》期刊2012年33期)
王振,魏志强[8](2011)在《交通标识牌字符提取算法》一文中研究指出为解决智能交通系统中道路标识牌字符提取问题,提出了一种快速的基于颜色与笔画的新算法。首先采用主元分析(PCA)方法提取标识牌颜色特征并进行定位;然后对确认后的标识牌区域进行仿射处理,获得容易进行文字提取的图像;最后根据形态学的top hat、skeleton算子以及区域生长等算法得出道路标识牌字符清晰的二值化图像,送光学符号识别(OCR)软件识别。实验结果显示该算法具有很强的准确性和鲁棒性。(本文来源于《计算机应用》期刊2011年01期)
刘莉,叶玉堂,谢煜,宋昀岑,蒲亮[9](2010)在《基于RBF网络的光学字符提取与识别新方法》一文中研究指出提出了一种新的基于统计与模糊隶属度的光学字符特征提取方法,可以快速准确地识别受噪声污染的光学字符。相比传统算法,本文方法的特征空间区分度更高,最小类间距离扩大33.2%以上。应用在径向基函数(Radical Basis Function,RBF)神经网络中,在字体字号变化且有背景噪声污染的影响下,识别率高达99%以上,且相比直方图投影法提速75%。理论分析与实验结果表明,与传统方法相比,该算法抗噪能力更强、模式区分度更高、时空复杂度更低,更简约、更全面地覆盖了字符的特征,应用范围广。已应用于实际系统,取得很好的实验结果。(本文来源于《光电工程》期刊2010年11期)
高一文[10](2009)在《基于Matlab的车牌字符提取》一文中研究指出基于Matlab强大的图像处理功能,首先对采集的车牌图像进行灰度化和去噪预处理,然后利用Sobel算子进行边缘检测,最后依据车牌字符对应的不同L值进行字符提取,得到了较为理想的视觉效果.(本文来源于《重庆文理学院学报(自然科学版)》期刊2009年05期)
字符提取论文开题报告范文
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
基于图像处理技术的文档数字化重构是模式识别研究的一个重要领域。将纸质档案原件影像化,通过图像处理、字符识别等技术实现文档的版面分析与版面理解并最终实现文档版面数字化重构,转化为数字化的文档资源并以双层PDF文档、Word文档等形式呈现,以互联网为媒介服务大众,极大地便利了档案资料的检索、查阅、保存与传播等工作。版面分析与字符提取是文档数字化重构的重要基础步骤,尤其是在这个追求个性与创造的时代,文档版面的排版结构越来越复杂,图片、文字、表格等元素甚至印刷体与手写体的混合排版对版面分析与字符提取带来了很大的挑战,异构文档图像版面分析的任务是实现版面多种组合元素的分解,将复杂的版面同构化为同质化的单一区域,进而通过字符提取、字符识别实现文档版面理解,进而实现版面重构。针对文档图像版面分析与字符提取问题,本文的主要研究工作体现在以下两个方面:(1)基于深度迁移学习的文档版面目标检测研究。由于文档图像版面中公式、表格、插图等基本图像单元排版的无序性与多样性,传统的版面分析方法针对不同的文档图像往往需要不同的处理策略,并且文档版面区域的定位与分类模块完全独立,不仅导致系统的冗余还严重限制了系统的通用性。为了更好的实现文档版面的区域定位与分类,同时克服文档图像标注样本数据不足的缺陷,提出了一种基于深度迁移学习的文档版面目标检测方法。由于在自然场景的语义理解方面具有大量的标注数据集来做深度学习的研究支撑,本文采用迁移学习的方式将自然场景下的目标检测模型迁移到文档版面目标即公式、插图、表格的检测任务上。在一个网络框架下同时实现了文档版面多种目标的检测与界限框的定位,提高了系统的通用性,实验结果表明该算法具有较高的准确率,不仅实现了文档图像版面区域的识别还实现了版面目标的精确定位。(2)无约束书写条件下的手写文本行提取算法研究。在没有基准线与界限框约束的条件下,自由书写的文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题。传统的文本块几何线分割或超像素聚类的方法一般都无法保证文本行边缘字符笔画的精确分割。针对这些问题提出了一种改进的方案,文本行回归-聚类联合框架。首先,利用拖尾效应提取文本行主体区域,并结合形态学处理对其骨架化得到文本行回归模型。然后,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现字符连通域的聚类,并分配所属文本行标签。在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割。实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度。在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
字符提取论文参考文献
[1].李海浩,顾滨兵,刘艳平.场景图像中文本区域字符提取方法研究[J].计算机与数字工程.2018
[2].朱健菲.档案图像版面分析与字符提取方法研究[D].五邑大学.2018
[3].彭继彬,陈晓荣.基于HALCON的票据字符提取系统设计与实现[J].软件导刊.2017
[4].郑巧,唐鹏,韦璞.基于自适应投影分割的接触网号牌字符提取[J].信息技术.2016
[5].唐瓒.图片字符提取数字化处理浅谈[J].通讯世界.2015
[6].殷羽,郑宏,王静,李圣,王震.一种自适应烟标字符提取方法[J].计算机应用研究.2015
[7].周启亚,杨高波.MPEG-2压缩域车辆牌照字符提取算法[J].计算机工程与应用.2012
[8].王振,魏志强.交通标识牌字符提取算法[J].计算机应用.2011
[9].刘莉,叶玉堂,谢煜,宋昀岑,蒲亮.基于RBF网络的光学字符提取与识别新方法[J].光电工程.2010
[10].高一文.基于Matlab的车牌字符提取[J].重庆文理学院学报(自然科学版).2009