导读:本文包含了光学字符识别论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:字符,光学,欧几里得,机器,形态学,神经网络,近邻。
光学字符识别论文文献综述
齐浩[1](2018)在《基于光学字符识别技术的机车视频转储分析系统设计》一文中研究指出文章通过利用高效快捷的光学字符识别技术,设计并实现了一种机车视频转储分析系统。为了提高转储分析效率,系统首先对列车运行监控装置(LKJ)文件预分析并提取关键数据,其次通过光学字符识别技术获取视频中附带时间、司机、车次等信息,最终以时间为主轴建立列车运行监控装置文件和视频文件之间的信息关联。同时集成视频转码功能以增强系统兼容性。实验结果表明:系统有效提高分析效率。(本文来源于《甘肃科技》期刊2018年22期)
麦尔旦·吐拉江[2](2018)在《基于光学字符识别维汉翻译软件的研究与实现》一文中研究指出如今随着社会科学技术的飞速发展,由于手机携带方便、功能日趋完善等原因,导致智能手机的普及率成直线上升趋势,移动互联网用户的规模愈来愈大。如今在国内外,英语、汉语等语言文字的OCR识别技术已经相当成熟,利用OCR技术进行某种语言的文本翻译也越来越火爆,但在新疆,利用OCR技术实现维吾尔文的识别与翻译的研究尚不成熟,因此研究维吾尔文的OCR技术与机器翻译技术,对于新疆的经济建设、各民族的文化交流、以及加快维吾尔文字信息化发展具有积极的作用。本文主要研究了维吾尔文的光学字符识别技术(OCR)和维汉统计机器翻译技术,在Tessetact-OCR平台上训练出维吾尔语图文识别训练模型,并其作为基础在Android平台开发维汉光学字符识别与翻译一体化的应用程序,实现了从维吾尔图文中识别出文字信息、并实时翻译功能。首先在包含维吾尔文字的图片识别方面,系统利用局部自适应阈值二值化和形态学闭运算去噪等图像处理算法对目标图文进行预处理,提高Tessetact-OCR识别成功率,基于改进的多尺度分水岭分割算法对维吾尔文图片进行切分,再利用Tesseract引擎对维吾尔文进行识别训练。然后在词汇存储及翻译方面,准备了4.9万条维汉单词和平行句对,利用NiuTrans Server工具包搭建维汉翻译系统,并在Azure云平台上实现翻译功能为客户端提供API接口,最后使用Java语言在Android Studio集成开发环境上实现Android客户端。(本文来源于《新疆大学》期刊2018-06-30)
卢畅畅,宁少文,唐德昌[3](2018)在《光学字符识别技术(OCR)的研究于应用》一文中研究指出光学字符识别技术是指电子设备通过检测纸面字迹暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,该技术对生产生活有着重要作用。本文根据公开的UCI光学字符数据集,建立模型,通过字符特征识别字符,具体如下:首先,为了找出同一字符之间的特征的相似性,我们对26个英文字符进行了分类处理,并且对于每个字符每一项特征取平均值,将其作为一个判断基准。为了识别字符,我们首先建立了相似度之欧几里得距离模型,为了求出两个字符的欧式距离d(x,y)运用以下公式:d(x,y)=((x_1-y_1)~2+(x_2-y_2)~2+...+(x_n-y_n)~2)~(1/2)=(∑_(i=1)~n(x_i-y_i)~2)~(1/2)其中指字符x的各项特征值。通过对待求字符与每个字符进行相似度的比较,近似求出待求字符。但在模型检验过程中,我们发现,该模型对于相似度较高的字符,如"N"和"H"并不能很好的区分,且正确率仅能维持在%60左右。于是,我们对欧几里得距离算法进行了改进,将欧几里得距离与KNN邻近算法相结合,建立了第二种模型,大大提高了模型的精确度。欧氏距离—KNN模型将待求字符的16个特征值与2万条数据的16个特征值分别求出其欧式距离,得到2万组欧氏距离并且比较2万个欧式距离的大小,提取出前K个最小邻。分别统计这K个字符中26类字符每一类的个数,个数最多的那一类,即为所求数据所归属的那一类。为了评价所建模型,我们建立AUG-基尼指数评价模型,对于所求得的ROC曲线进行函数拟合,再利用定积分求出AUG,进而求出基尼指数对模型精确度进行评估。最后,我们利用每个字符的前70%对模型进行训练,并利用数据的后30%对模型进行了精确度测试,测试结果如下:第一个模型正确率达57.825%,平均耗时为0.676毫秒。第二个模型在选取最优的K值和训练数据数量时,正确率高达95.265%,此时耗时为233.09毫秒。而且当精确率达到85%以上时,耗时均在80毫秒(0.08秒)以上。总的来说,字符识别模型一的精确度略低,但是省时省力。模型二虽然更加耗时,但是识别的精确度大为提升,生产应用中,应当根据实际情况采取不同的模型。(本文来源于《中国战略新兴产业》期刊2018年28期)
杨晨红[4](2018)在《基于机器学习的光学字符识别与应用研究》一文中研究指出光学字符识别(Optical Character Recognition,OCR)技术是机器视觉领域的一个重要分支。它涉及到模式识别、图象处理、数字信号处理、人工智能等学科,是一门综合技术。在文字信息处理、办公自动化、机器翻译、实时监控系统等高技术领域,都有重要的使用价值和理论意义。进入21世纪后,随着拥有高清晰摄像头的智能手机的普及,OCR的发展又有了新的追求:越来越多的人拿起手机拍摄所看到的事物和场景,获取图片中的文字信息。因此,对自然场景中的文字进行识别成为一个全新的课题。由于用手机拍摄的文字图像存在模糊、几何畸变、光线不均匀和背景复杂等问题,因此,相比于扫描图像的文字,对手机拍摄的图片做字符识别难度升级。本文的研究重点是图像预处理算法和字符识别算法,并针对手机拍摄的身份证图像进行检测和识别。本文工作主要包括以下几个方面:(1)详细介绍了常用的图像预处理算法和字符切分算法,以及他们各自的优缺点。预处理算法包括图像二值化和几何矫正。在图像二值化方面,使用局部阈值法与全局阈值法相结合的方式。在几何矫正之前,对整张图像采用全局阈值法得到图像的轮廓信息,对图像中的字符区域,采用局部阈值法得到二值化字符图像,实验结果表明,局部阈值与全局阈值相结合的二值化方法速度快,对文字区域的二值化效果好;在几何矫正方面,提出了基于分块Hough变换的图像畸变角检测方法,并在此基础上计算图像的倾斜角度和透视角度,然后分别做矫正,实验结果表明,基于分块Hough变换的图像畸变角检测方法速度快,几何畸变矫正效果良好;在字符切分方面,在垂直投影法的基础上通过识别反馈实现字符切分校验,对切分错误的字符重新切分,实验结果表明,通过切分校验,可以正确地切分左右分离结构的汉字和粘连字符。(2)详细介绍了卷积神经网络,根据身份证上的字符特点构建了包含6742个不同字符的数据集。构建不同层数的卷积神经网络,分别对卷积网络模型多次迭代训练并测试其字符识别性能。实验结果表明,4层的卷积神经网络在迭代训练15000次后识别效果最好。(3)最后,根据我国第二代身份证的特点,构建身份证识别系统,对身份证上的姓名、性别、住址、身份证号等信息进行检测识别。实验仿真证明,本文的身份证识别系统速度快,识别率高,识别准确率可以达到99.6%。(本文来源于《西安电子科技大学》期刊2018-06-01)
叶智铭[5](2018)在《针对保险理赔单据的光学字符识别的研究与实现》一文中研究指出随着经济的发展,保险业间竞争日益激烈,依靠传统手段拓展市场已经难以满足市场的需求,为了提高自身竞争力,保险公司对信息技术的投入不断提高。保险公司理赔部需要人工处理大量的理赔单据,每天需要对不同的理赔单据进行数据录入,分析与分类。这种反复的工作不但增加了保险公司的运营成本,而且效率低下并且错误率高。在当今保险行业中保单录入的环节已经实现了光学字符识别的录入,由于新保单格式规范,清晰度高,识别效果令人满意。但是理赔单据(用药清单)的自动录入一直没有实施,其主要原因是用药清单来自不同的医疗机构,药物与医疗项目等明细信息表达各不相同,没有统一规范。而且单据的清晰度较低,无法通过简单的数据扫描进行系统录入,中间过程仍需人工干预。本文通过对医疗单据(用药清单)进行图像预处理,结合光学字符识别技术,解决用药清单的自动录入问题,为不同的系统提供用药清单识别功能。主要工作如下,1.本文在识别前增加图像预处理操作,减少光照,图章和倾斜影响因素,使识别度提高至80%或以上。2.本文采用了开源的Tesseract作为识别工具,扩大其识别样本,并且通过机器学习训练Tesseract,减少由于原识别库对中文样本训练程度不足的问题,提高Tesseract对用药清单的识别能力。3.基于图像预处理和光学字符识别的用药清单识别结果仍然达不到理想的效果,通过对比概率,N-Gram和查字典法叁种方法的适用性和优劣性,本文最终采用查字典法校对识别结果,通过匹对方式,修复形象字导致的专业术语错误问题,从而使识别率提升至90%或以上。最后本文会通过对识别结果和实验进行分析,说明在研究过程中遇到的问题以及该方法的不足以及一些未来需要改进的方法。(本文来源于《华南理工大学》期刊2018-04-14)
郭昊冉,黎小琴[6](2016)在《形态学处理在光学字符识别中的应用研究》一文中研究指出讨论了形态学处理在字符识别中的应用研究,用开运算和闭运算等形态学处理知识对图像进行增强处理,目的是消除字符间断裂、粘连等问题。实验结果表明,用形态学处理进行图像预处理能有效消除笔画断裂、粘连等问题,进一步增强目标字符特征,提高字符识别正确率。(本文来源于《传感器世界》期刊2016年08期)
卢均溢[7](2016)在《牌照证件光学字符识别研究》一文中研究指出在交通越来越发达的今天,关于机动车牌照、证件的光学字符识别研究是计算机视觉和智能交通应用领域的重要研究课题之一。在不为机动车增加其他装置的基础上,实现用机器识别代替人工识别的方法,对车辆信息进行自动检测、监管,得到高质量、迅速的交通自动化控管,具有实际的经济和管理效益。随着电子信息技术领域的不断发展,对含有车辆牌照、证件的光学图片进行字符识别是推进现代交通管理系统自动化的重要核心步骤。首先,系统总结了国内外在光学字符识别领域的研究现状,选择目前主流的“文字信息提取+识别”方案。分析了机动车行驶证识别和车辆车牌识别原图像的区别与联系,介绍了数字图像预处理的基本方法。然后,基于车牌识别的文字信息提取。分析了预处理后的车牌图像,设计了基于SVM方法的车牌识别系统,并进行了实验仿真。得到只含有车牌区域的图像后,使用回返法分割车牌图像。其次,研究了基于行驶证识别的文字信息提取。分析了红色印章定位法的正确性,并进行了实验仿真。对行驶证照片进行下划线爆破操作后,使用投影法分割字符图像。再次,研究了文字信息识别方法。分别介绍了基于神经网络和模板匹配两种字符识别方法。分析得到使用神经网络法识别车牌字符,使用模板匹配法识别行驶证字符。最后,基于实际图片样本库。实现行驶证识别和车牌识别两个系统。在理论研究的基础上,得到实验结果,满足前期设定实验要求。比较分析叁种判断、识别方法,验证识别过程设计的正确性和可行性。(本文来源于《哈尔滨工业大学》期刊2016-06-01)
赖志伟[8](2016)在《基于安卓的光学字符识别应用研究与实现》一文中研究指出将图像中的文字抄袭下来编辑既费时又费力,研究如何将图像中的文字准确地识别出来,具有重要的研究意义。目前光学字符识别应用主要是基于PC客户端的,而基于移动设备(如安卓手机)客户端的光学字符识别技术还并不成熟。随着硬件性能的提升和移动设备的不断普及,计算机设备移动化的时代已经到来。安卓操作系统的产生与发展,使得安卓移动设备在市场中占据着极大的份额及其应用越来越广泛。因此,研究实现基于安卓的光学字符识别应用,具有很好的应用前景。本文针对目前安卓手机上的光学字符识别应用支持识别的字体少,功能性较单一,开发完成了一个功能完整并且具备一定的实用价值的系统。系统实现了印刷体中英文字体识别及医疗设备的七段数码管数字识别,同时还实现了用户远程注册和登录的功能,用户可将图像及其识别出来的文字上传到远程服务器并查看上传的记录与再次编辑的功能,以及将识别出来的文字转化成语音信息返回给用户。实现该应用的主要流程为:首先,选择原图像,包括调用安卓手机摄像头拍摄图像和从安卓手机中选择图像;然后对选择的图像进行预处理;最后,使用Tesseract光学字符识别技术对预处理过的图像中的文字进行识别。通过对该应用的各功能模块进行测试,结果表明:本文实现的基于安卓的光学字符识别应用识别速度较快、准确率高、综合性能较好,具有一定的研究意义与实用价值。(本文来源于《暨南大学》期刊2016-05-01)
李湛[9](2016)在《基于Android平台的光学字符识别应用的设计与实现》一文中研究指出随着数字化时代的蓬勃发展,信息量以指数级的速度增长,然而手工录入并存储信息的速度远不及信息的产生速度。光学字符识别(OCR)技术能够自动化地检测信息并识别出来,有效地解决了信息录入速度和正确率的问题。目前,基于PC设备的光学字符识别已经被广泛的应用于办公自动化和工业智能化等方面,然而由于PC端的弱便携性,很难随时随地处理生活信息。得益于智能手机硬件和Android平台的发展,在移动设备上进行光学字符识别成为可能。基于Android平台的光学字符识别成为一个被迫切需要的功能。本文将PC端上有关光学字符识别的先验知识和基本理论,应用于移动端,设计并实现了一个基于Android平台的光学字符识别应用。本文重点研究了光学字符识别功能的具体实现,以及应用的功能设计和界面设计。本文的主要工作包括:1)应用的需求分析和概要设计,将应用分为图像采集模块,字符识别模块,信息存储模块这叁个模块。图像采集模块负责采集含有字符信息的图像;字符识别模块负责处理采集到的图像,进行识别并输出识别结果;信息存储模块负责存储原图像,识别结果以及针对它们的编辑操作。2)应用的详细设计和具体实现。图像采集模块实现两种方式采集图像,分别调用了Android平台的相机和相册接口。对于图像识别模块,结合对文献的研究以及实际场景的分析,设计了一系列光学字符识别的算法策略组合。针对生活场景的复杂,设计了灰度化,平滑,二值化,形态学操作等图像预处理算法,增强背景和识别目标的区别,然后找出图像中的字符区域,进行字符分割和字符归一化,输入到学习生成的SVM模型中进行识别。信息存储模块,采用SQLite这一轻量的嵌入式数据库引擎,将数据存储到手机SD卡中。3)应用测试和评价。在实际使用案例中对应用进行测试,通过对准确率,查全率和F值的计算,分析应用使用效果。本文的目标是利用移动平台日益强大的计算能力,实现服务于日常生活的光学字符识别应用,使用户能够获取并存储所需的信息。(本文来源于《南京大学》期刊2016-05-01)
霍强[10](2016)在《光学字符识别技术:让电脑像人一样阅读》一文中研究指出2015年04月03日新浪科技把手机摄像头对准菜单上的法语菜名,屏幕上实时显示出翻译好的中文菜名;将全世界图书馆的藏书转化为电子书;街景车游走于大街小巷,拍摄街景的同时也从街景图像中自动提取文字标识,让地图信息更丰富更准确……这些场景的背后有一个共同的关键技术——OCR(Optical Character Recognition),光学字符识别。OCR让电脑"读"懂世界鼠标发明人Douglas Engelbart曾经针对人工智能的简称AI提出了另一个(本文来源于《《科学与现代化》2016年第1期(总第066期)》期刊2016-03-01)
光学字符识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
如今随着社会科学技术的飞速发展,由于手机携带方便、功能日趋完善等原因,导致智能手机的普及率成直线上升趋势,移动互联网用户的规模愈来愈大。如今在国内外,英语、汉语等语言文字的OCR识别技术已经相当成熟,利用OCR技术进行某种语言的文本翻译也越来越火爆,但在新疆,利用OCR技术实现维吾尔文的识别与翻译的研究尚不成熟,因此研究维吾尔文的OCR技术与机器翻译技术,对于新疆的经济建设、各民族的文化交流、以及加快维吾尔文字信息化发展具有积极的作用。本文主要研究了维吾尔文的光学字符识别技术(OCR)和维汉统计机器翻译技术,在Tessetact-OCR平台上训练出维吾尔语图文识别训练模型,并其作为基础在Android平台开发维汉光学字符识别与翻译一体化的应用程序,实现了从维吾尔图文中识别出文字信息、并实时翻译功能。首先在包含维吾尔文字的图片识别方面,系统利用局部自适应阈值二值化和形态学闭运算去噪等图像处理算法对目标图文进行预处理,提高Tessetact-OCR识别成功率,基于改进的多尺度分水岭分割算法对维吾尔文图片进行切分,再利用Tesseract引擎对维吾尔文进行识别训练。然后在词汇存储及翻译方面,准备了4.9万条维汉单词和平行句对,利用NiuTrans Server工具包搭建维汉翻译系统,并在Azure云平台上实现翻译功能为客户端提供API接口,最后使用Java语言在Android Studio集成开发环境上实现Android客户端。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
光学字符识别论文参考文献
[1].齐浩.基于光学字符识别技术的机车视频转储分析系统设计[J].甘肃科技.2018
[2].麦尔旦·吐拉江.基于光学字符识别维汉翻译软件的研究与实现[D].新疆大学.2018
[3].卢畅畅,宁少文,唐德昌.光学字符识别技术(OCR)的研究于应用[J].中国战略新兴产业.2018
[4].杨晨红.基于机器学习的光学字符识别与应用研究[D].西安电子科技大学.2018
[5].叶智铭.针对保险理赔单据的光学字符识别的研究与实现[D].华南理工大学.2018
[6].郭昊冉,黎小琴.形态学处理在光学字符识别中的应用研究[J].传感器世界.2016
[7].卢均溢.牌照证件光学字符识别研究[D].哈尔滨工业大学.2016
[8].赖志伟.基于安卓的光学字符识别应用研究与实现[D].暨南大学.2016
[9].李湛.基于Android平台的光学字符识别应用的设计与实现[D].南京大学.2016
[10].霍强.光学字符识别技术:让电脑像人一样阅读[C].《科学与现代化》2016年第1期(总第066期).2016