一、西夏文字识别中的图像预处理(论文文献综述)
陈燕[1](2021)在《西夏文献注译辅助识别系统平台设计》文中研究说明西夏文字是由西夏王朝创造、使用和记录的一种古文字。西夏古籍文献的解读和分析是西夏学研究的重要手段,由于熟练掌握西夏文字的研究者稀缺,同时传统文献查阅检索工作耗时费力。针对以上问题,本文设计并实现了西夏文献注译辅助识别系统平台,作为西夏文献解读的辅助工具,为西夏古文献研究提供字符辨识、文字检索等便利辅助,提高效率,本系统设计完成包括的主要研究内容如下:(1)确定西夏文字数据源,通过扫描的方式获取98张西夏文献图像版文件,采用文字提取算法对其进行单字提取,将提取的16320个单字样本,按照使用频率分为668类,构建单字样本数据集。通过对照相应的西夏文献参考资料查阅提取文字的汉语释义等信息,并建立MySQL文本数据库。(2)根据西夏文字的特点搭建文字识别卷积神经网络,在提取的单字样本数据集的基础上进行样本扩充,将其分为测试集和训练集对卷积神经网络进行训练和测试,识别准确率达到80.16%,将其保存为.h5识别模型待使用。(3)设计实现基于B/S架构的系统交互平台,在Django框架下采用MTV设计模式完成对数据业务的分层处理。前端通过在HTML脚本中嵌入CSS和JQuery来实现Web界面,PHP连接数据库并对数据进行操作,采用轻量级的数据格式Json实现前后端数据交互,建立西夏文献注译识别平台。该辅助识别系统的实现,便于西夏学研究者及爱好者对西夏文字的汉语释义、出处以及所在上下文翻译的查阅与检索。
杨丽娟[2](2021)在《基于风格迁移的手写西夏文字样本生成研究》文中认为在当前人工智能技术迅速发展的背景下,将智能识别技术应用于西夏文字识别,势必为西夏学研究带来高效的科技研究手段和资源组织方式。但由于现有的西夏文字样本分布不均衡,对深度学习模型的训练和识别结果会产生很大的影响。为了解决在探索西夏文字样本集建立的过程中受到样本来源限制面临样本类别不完备问题,本文提出基于风格迁移的手写西夏文字样本生成研究。同现有的应用于图像、字母以及汉字生成的风格迁移不同,本文将现有的风格迁移技术应用到西夏文字从标准字库字体到古籍文献字体的生成中,主要研究内容如下:(1)对西夏文字图像结构特征与风格特征的分离提取及重构进行研究,实现字体结构与风格重组,即将给定的西夏文字体结构与所期望的字体风格进行重组生成期望风格的字符。(2)通过对现有的风格迁移技术进行分析,设计生成网络模型以及鉴别网络模型,实现西夏文字从标准字库字体到古籍文献风格字体的迁移。所研究的生成网络模型包含文字风格特征与结构特征提取以及重构模块,采用编-解码结构设计风格特征提取网络,基于U-NET网络和残差网络设计结构特征提取网络,基于PatchGAN设计鉴别网络模型,通过实验验证了所生成样本的有效性。(3)对原始样本识别准确率和风格迁移扩充后识别准确率进行对比,经风格迁移扩充后西夏文字样本集在深度识别模型上的准确率比原始样本识别准确率至少提升36%。最后,使用本文设计的风格迁移网络模型生成西夏文字图像,构建样本类别完备、样本表观多样性的古籍文献手写风格西夏字符样本库。本文提出的基于风格迁移的西夏文字样本生成研究解决了原始西夏文字样本数据集不均衡分布的缺陷,使得该数据库可以应用在西夏学研究的各个领域,对西夏学研究者的研究效率也有所提升。
薛春寒[3](2021)在《朝鲜语古籍文字识别方法研究》文中研究说明中国朝鲜语古籍的数字化对保护中国朝鲜语的历史语言资源、研究朝鲜族历史、文化传承和古籍资料的再生利用,具有重要研究价值和现实意义。古籍资源的传统手工录入或简单数字化采集保存方式,效率低下,不利于记录、交流和传播,因此采用先进的数字化技术实现古籍文字的自动识别,进而实现全文数据库需求变得越来越迫切。古籍文字识别是古籍全文数字化过程中最重要的基础工作之一,由于少数民族文字的复杂性,且受样本数据量的限制,使得少数民族古籍文字识别技术仍然面临着不少的困难。经过调研发现国内在中国朝鲜语古籍数字化研究领域非常落后,鲜见相关的研究文献和成果。为了推进朝鲜语古籍数字化进程,本文研究并提出了一种小样本的朝鲜语古籍文字的识别方法。首先,本文针对朝鲜语古籍文字识别的小样本学习问题,采用了两类数据增强方法扩充数据样本。一是传统数据增强方法,生成的图像可以在保持原始图像特征的同时获得一些其它特征;二是基于条件深度卷积生成对抗网络的数据增强方法,生成的新文字图像样本具有多样性优点,同时避免了模式坍塌问题的出现。采用以上方法扩充的数据集能够满足后续识别任务。其次,采用经典的卷积神经网络对本文扩充后的富数据集N1进行了预训练并得到预训练模型。预训练过程中实验对比了VGGNet16、Res Net18和Res Net50等三种卷积神经网络,三者识别性能指标接近,能够准确有效地提取朝鲜文字的结构特征,取得富数据测试集较高的分类精度。最后,采用同源迁移学习的策略提出了小样本朝鲜语古籍文字识别方法。为了证明采用同源迁移学习策略的有效性,本文采用同源预训练模型和Image Net预训练模型,同样在三种网络模型上进行了对比实验。实验结果表明本文提出的同源预训练模型在小样本数据集N2获取的识别性能明显优于后者,进一步反映了本文的同源预训练模型在提取朝鲜文字结构方面比Image Net模型更优秀。本文研究的数据增强方法有效,扩充的样本显着地丰富了实验数据。在富数据集N1的预训练任务中,Res Net18模型在测试集上达到了99.77%的分类精度。在采用同源迁移学习策略后,深度卷积网络可以在更小规模的数据集N2上解决小样本的朝鲜古籍文字图像识别问题。最终使用Res Net50模型在全类数据集上得到99.72%的分类精度。证明了本文提出的迁移学习方法能够解决小样本且不平衡的朝鲜语古籍文字识别问题。
陈琢[4](2021)在《融合多特征的老挝语文字识别研究》文中提出老挝语是老挝人民民主共和国的文字,作为“一带一路”重要盟国的老挝,其研究意义重大,由于老挝语使用人口少,且数字化落后,故从网络直接获取老挝语文本语料较为困难,但存在大量老挝语文本图像,因此,如何从现有文本图像中准确识别老挝语字符序列用以扩充老挝语文本语料,成为目前老挝语自然语言处理研究重点之一。光学字符识别可有效提取文本图像所含字符,但目前老挝语文字识别研究寥寥无几,故本文参考相关文字识别研究,提出一种融合多特征的老挝语文字识别方法,以解决目前老挝语研究工作中的难点,其主要包括以下三个部分:(1)构建ResNet-BiLSTM-CTC端到端老挝语文字识别模型。因老挝句子由字符构成,且以上中下结构组成的字符较多,故在模型中融合音调特征和下位辅音特征辅助模型准确识别老挝语文字。首先,以深度卷积网络提取更丰富的字符结构信息,并通过边框回归矫正单字符包围框,然后利用BiLSTM网络表征更高级的语义信息,最后对预测结果以CTC进行转录获得识别序列。并以Deep BLSTM、DenseNet、Text-CNN 等模型作进行对比,证实了 ResNet-BiLSTM-CTC模型的有效性,准确率达到了 80.45%。(2)在ResNet-BiLSTM-CTC模型基础之上,针对因文本图像质量原因出现的字符断裂、粘连等情况,本文提出了“老挝字符书写等级”,构建结合字符识别损失和字符书写等级辅助损失的多任务学习模型,首先利用ResNet网络作为共享特征提取层,一侧分割老挝语单字符,另一侧拟合字符书写等级,然后二者向量与输入文本图像向量拼接后,通过BiLSTM识别老挝字符序列,最后进行CTC转录获得识别结果。且在进行实验并与其他主流方法对比之后,证明了 ResNet-BiLSTM-CTC 模型融合老挝字符书写等级特征后切实有效,其准确率达到了86.94%,相比之前的工作准确率提升了 6.49%。(3)为获得更准确老挝语文字识别结果,对先前识别结果进行错误分析,发现因模型不能很好区分老挝语相似字符,故对相似字符区分问题进行建模,在模型不同阶段引入Spatial和Channel注意力机制分别关注字符局部形态信息和序列的上下文信息。并针对老挝语相似字符易混淆问题构建Unicode表,辅助区分字符对间的视觉相似性。为了证明其有效性,以老挝语印刷体、手写体以及场景文本图像的识别情况测试模型有效性,实验结果显示,准确率达到了 90.45%。
张光伟[5](2020)在《基于深度学习的西夏文献数字化》文中研究指明西夏文献的数字化是近半个世纪以来西夏文研究学者一直在努力地工作,以往西夏文献的录入几乎都是手工进行,效率非常低。近年来,以深度学习为代表的人工智能技术进行手写文字识别的准确率已经达到或超过人类专家的水平,我们训练的深度神经网络模型在单个手写体西夏字数据集上的识别准确率超过97%。深度学习算法用于西夏字识别需要大量的标注数据,即每个西夏字都需要几十上百的实际例子;从大量的西夏文献中找到西夏字典中的每个字的多个实例需要的工作量巨大,而且有些西夏字的使用频率比较低更难以找到大量实例。我们提出了一种目标导向的混合算法来对西夏字进行标注:使用已有大量实例的西夏字生成虚拟字符表示那些实例数量不足的西夏字。实验证明这些虚拟字符在训练神经网络方面的效能与实际数据近似,让我们能够从大量未标注的西夏字图片中找到那些神经网络尚未识别的西夏字,并进行标注,而且这些虚拟字符可以与使用频率低的西夏字实例一起纳入训练集,以逐步迭代的方式训练识别能力更强的神经网络。在识别单个西夏字的基础上,我们通过在模型中引入循环神经网络单元,实现了西夏文献整列的识别,从而将传统的扫描文献切割为单个字符进行识别工作流程改进为以列为单位进行识别。TDM与列级别的识别模型相结合能够为我们构建高效的西夏文献自动转录系统,进而加速西夏文献的数字化进程。
王德青,吾守尔·斯拉木,许苗苗[6](2020)在《场景文字识别技术研究综述》文中进行了进一步梳理对文字检测和识别技术进行了全面的介绍。介绍了自然场景文字识别技术的研究背景、应用领域、技术难点等;介绍了场景文字识别的预处理技术及流程,介绍了近年来出现的基于深度学习的通用检测网络、维吾尔文和中英文的深度学习文字检测网络、场景文字识别深度学习网络、端到端场景文字检测与识别深度学习网络,并总结了各类网络的结构特点、优势、局限性、应用场景以及实现成本,接着进行了综合分析;最后介绍了公开数据集,并探讨了场景文字识别技术的发展趋势及可能的研究方向。
王葭[7](2020)在《基于深度学习的西夏文字识别研究》文中指出西夏文字作为一种记录西夏王朝历史的文字,有着极具特色的文化内涵,西夏文字的识别对于整个西夏学研究工作有着重要的意义。到目前为止,西夏文字识别率较低的问题限制着西夏学研究的发展,与广泛使用的文字例如汉字的识别研究相比较,针对古籍文献手写西夏文字符的识别研究存在更多困难,主要包括:西夏文字结构比汉字更复杂,字符笔划更多;西夏文字符类别之间相似度更高;手写西夏文字符的训练样本集受限于样本来源,存在部分字符类别样本数量稀少的问题。基于此,本文结合能够提取更多复杂西夏文字的表层信息的深度卷积神经网络以及关注西夏文字各笔划之间的位置关系CapsNet网络,搭建出A-CapsNet深度识别网络用于对单类样本数量少的西夏文字的识别研究。本文主要的研究内容如下:1.针对西夏文字样本图像大小不一、文字区域占比不均匀、背景噪声信息多的特点,提出了改进的MSER算法的预处理,对西夏文字样本图像进行文字区域提取,滤除多余的背景和噪声信息,并将其进行尺度归一化处理;2.基于经典深度卷积神经网络分类模型和动态路由算法的CapsNet网络对预处理后的西夏文字进行训练识别,经过实验证明该网络结构适用于对西夏文字的识别;3.在CapsNet网络的基础上,构建了 A-CapsNet网络结构完成对西夏文字的识别。在相同数据集的基础上,从动态路由迭代次数、训练轮次、重构效果方面对识别效果进行实验。最终实验结果表明,A-CapsNet网络对西夏文字的识别准确率更高,并且有更好的适用性。
邹志文[8](2019)在《图文混编图像的版面分析及识别研究》文中指出现如今,越来越多的用户通过社交软件向好友分享存在图文混编版面的图像(下文简称“图文混编图像”),而图文混编图像存在庞杂的信息使得用户无法在短时间内获取重要信息。为了快速地帮助用户从图文混编图像中获取尽可能多的有效信息,本文提出了基于图文混编的版面分析算法。该算法不仅能够快速区分图文混编图像的文本标题区、文本正文区以及图像区。而且能够高效地识别文本标题区和图像区的内容,以较低的算法复杂度获取图文混编图像中重要信息。本文主要研究内容如下。(1)提出了融合轮廓投影的连通域版面分割算法。该算法在对图文混编图像进行图像预处理的基础上,首先基于八连通将整个图文混编图像进行单字区域扩充。然后根据轮廓投影后的灰度直方图中波形的规律性和周期性对不同区域进行大致划分。最后通过引入文本行(列)间隔阈值以及图文间隔阈值对各个连通区域进行合并,更加有效地区分文本标题区、文本正文区以及图像区。(2)提出了基于多级划分的单字识别算法。该算法对标题汉字采用36×36点阵归一化处理,首先对标题汉字进行粗划分,根据绝对值距离,从字典库7000个汉字中选出与标题汉字匹配的前m个汉字。然后对标题汉字进行细划分,根据欧氏距离,从m个汉字中选出匹配的前n(n<<m)个汉字。最后根据匹配度计算,完成最终匹配。通过对标题汉字进行粗划分和细划分降低了计算量,同时提高了算法的识别效率。(3)研究了基于局部特征的SIFT算法的图像匹配技术。首先构建图像尺度空间金字塔找出其极值点;然后对于找到的极值点进行筛选确定稳定的特征点;最后根据由特征点所表示的局部描述子对图像进行匹配和识别。本文将基于图文混编的版面分析算法移植到移动端,从而设计了移动端版面分析系统。该系统能够对图文混编图像版面进行分割,准确识别出标题区域和图像区域,并将识别结果通过手机移动端推送给用户。通过对算法实验和系统测试的分析,证明了算法的有效性和系统的实用性。图[22]表[8]参[63]。
李小璐[9](2019)在《基于优化分割与提取的西夏古籍文字识别研究》文中研究说明随着信息技术的飞速发展,人工智能的理论及技术日益成熟,应用领域也在不断扩大。本文将人工智能技术应用于古籍文献的保护,使其在古籍文献保护中发挥出应有的作用。计算机字符识别(OCR)是人工智能识别西夏文字的常用方法,其基于人工智能算法来识别文字符号的数字影像,将其转换为数字文本,达到可识别的目的。本文以西夏文字古籍金光明最胜王经卷一为例,研究应用先进人工智能领域的热点算法实现对研究对象的自动识别。西夏文字是仿照汉字制造而成,其字形相比汉字更为相近且笔画繁多,以会意字居多,象形字很少。在识别过程中,存在的难点有:1.西夏文字的字符集较大、结构复杂、字符之间相似度极高;2.手写的西夏文字粘连严重,图像分割更加困难。在研究过程中,借鉴了汉字的识别方法不断提高基于人工智能技术的西夏文字识别的识别率。本文所做具体工作有:1、介绍了西夏文字的研究背景、古籍信息化保护的意义以及国内外研究现状;2、对古籍图像作预处理及古籍图像分割,其中包括:古籍图像二值化、数学形态学处理,以及边缘检测和连通域分析算法相结合的古籍图像分割;3、对分割后的西夏字符采用三线性插值算法作方向梯度直方图的特征提取;4、基于三类分类器(SVM、RF、K-NN)的西夏文字直方图特征的识别作比较,得出本文实验识别率最高的算法。
刘兴长[10](2019)在《基于改进模糊支持向量机的西夏文字识别研究》文中认为在日常生活中经常会遇到需要将纸质上的文字转换为可以被电子设备存储的数字信息的情况。基于这一需求诞生了文字识别技术。文字识别隶属于模式识别学科,是在OCR(光学字符识别)的基础上,对获取图片进行预处理,特征提取,然后选择合适的分类器识别不同文字的技术。显然,文字识别拥有非常广泛的应用领域,特别是在邮政,考试,票据等很多需要识别复杂手写体,且对精度需求极高的场合。本文所研究的西夏文字识别技术是近年来文字识别技术中待发展的全新领域。西夏文明作为中华文明中不可或缺的一部分,一直有待人们挖掘探索。作为西夏文明的载体,古西夏文字的识别工作显得格外重要。不同于现代汉字,古西夏文字结构复杂,组成字符的各部分偏旁极其相似,且平均笔画高达25画,难以数字化。此外,目前出土的西夏文载体主要以手抄本和活字刻版字为主,同一个字在不同文献上的位置和布局均不相同,这都给文字识别工作带来了很大困难。为解决这一难题,针对传统的文字识别技术中存在的预处理数据冗余,特征复杂,泛化能力不足等问题,本文在采用HOG特征提取的基础上,提出了基于改进模糊支持向量机的西夏文字识别技术。模糊支持向量机是Lin Chun-fu等人为了解决支持向量机推广到多分类时存在的混分和漏分问题而提出的新分类器。本文提出的基于多超平面距离度量的隶属度函数对模糊支持向量机进行了改进,通过用过正负类中心的超平面代替类中心的作用,用样本点到各类中心平面及类中心的距离做比较来设计新的函数。根据样本分布,赋予不同样本点不同的权重,从而优化了分类器。针对非平衡数据分类,在支持向量机的数学模型中引入了新的约束公式,减小了隶属度函数赋值误差,增强了新算法的泛化能力,进一步优化了分类器。本文将改进后的模糊支持向量机应用于西夏文字识别并进行实验,然后与已有的几种常见算法进行对比实验,分析了各个算法的优劣性。实验结果表明新方法具有收敛速度快,识别率高的优点,具有一定的应用价值。本文的研究意义主要有四点:首先,有利于西夏文字的再生保护。本文提出的技术实现了西夏文字的数字化,将古籍资料以图像的形式存放在计算机里;其次,提高了文字整理效率。数字化后的图像数据库极大的方便了科研工作者;再次,提供了可借鉴的文字识别模型。同西夏文字情形类似的还有契丹文,女贞文等,本文的文字识别模型可供其他古文字保护工作借鉴;最后,实现了古籍文献的信息化检索。对于如西夏文字这样相似度极高的字符集,建立图像数据库,实现自由检索信息具有重要的意义。
二、西夏文字识别中的图像预处理(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、西夏文字识别中的图像预处理(论文提纲范文)
(1)西夏文献注译辅助识别系统平台设计(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 研究现状 |
1.4 论文主要研究内容与章节安排 |
第2章 西夏文献注译辅助识别系统的设计与应用 |
2.1 西夏文献注译辅助识别系统的应用 |
2.2 识别系统设计 |
2.3 系统的整体架构 |
2.4 本章小结 |
第3章 西夏文字文本数据库的设计与实现 |
3.1 引言 |
3.2 数据库的数据提取 |
3.3 MySQL数据库的实现 |
3.4 本章小结 |
第4章 卷积神经网络在识别系统中的应用 |
4.1 卷积神经网络 |
4.2 针对西夏文字识别的CNN结构模型 |
4.3 本章小结 |
第5章 西夏文献注译辅助识别平台的设计与实现 |
5.1 开发环境与相关技术介绍 |
5.2 网页功能模块的设计 |
5.3 网页功能模块的实现 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
(2)基于风格迁移的手写西夏文字样本生成研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.3 论文的主要研究内容 |
1.4 论文章节安排 |
第2章 生成对抗网络(GAN) |
2.1 引言 |
2.2 GAN基本原理及结构 |
2.3 条件生成对抗网络cGAN |
2.4 本章小结 |
第3章 基于CGAN的风格迁移 |
3.1 图像风格迁移技术 |
3.2 基于cGAN的图像风格迁移 |
3.3 应用于字体生成的风格迁移 |
3.4 本章小结 |
第4章 基于风格迁移的西夏字符样本生成研究 |
4.1 基于U-NET的生成网络模型设计 |
4.2 基于PATCHGAN的鉴别网络模型设计 |
4.3 西夏文字体风格迁移网络模型GAN结构设计 |
4.4 损失函数及参数优化设计 |
4.5 本章小节 |
第5章 西夏文字样本生成实验及分析 |
5.1 手写体西夏文字样本生成实验设置 |
5.2 实验平台和参数 |
5.3 实验结果分析 |
5.4 风格迁移后深度模型识别结果 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
个人简历及论文发表情况 |
(3)朝鲜语古籍文字识别方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究目的和意义 |
1.2 研究现状 |
1.2.1 古籍数字化 |
1.2.2 文字识别 |
1.2.3 小样本学习 |
1.3 研究内容与主要工作 |
1.4 本文结构 |
第2章 相关理论基础 |
2.1 引言 |
2.2 传统的数据增强方法 |
2.3 卷积神经网络 |
2.3.1 VGGNet |
2.3.2 ResNet |
2.4 生成对抗网络 |
2.4.1 基本的GAN网络 |
2.4.2 深度卷积生成对抗网络 |
2.4.3 条件生成对抗网络 |
2.5 迁移学习方法 |
2.5.1 迁移学习概述 |
2.5.2 迁移学习的分类 |
2.6 本章小结 |
第3章 朝鲜语古籍文字图像的数据增强方法 |
3.1 引言 |
3.2 基于传统和生成对抗网络的数据增强方法 |
3.2.1 基于传统的数据增强方法 |
3.2.2 基于生成对抗网络的数据增强方法 |
3.3 数据增强实验 |
3.3.1 数据集 |
3.3.2 实验环境 |
3.3.3 实验结果分析 |
3.4 本章小结 |
第4章 朝鲜语古籍文字图像识别 |
4.1 引言 |
4.2 构建卷积神经网络 |
4.3 朝鲜语古籍文字图像的预训练模型 |
4.3.1 实验设置 |
4.3.2 实验结果分析 |
4.4 基于迁移学习的小样本数据集的多分类识别 |
4.4.1 模型构建和训练 |
4.4.2 实验结果分析 |
4.5 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文 |
致谢 |
(4)融合多特征的老挝语文字识别研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 老挝语文字识别挑战点 |
1.3 研究现状与分析 |
1.3.1 基于规则的方法 |
1.3.2 基于统计学习的方法 |
1.3.3 基于深度学习的方法 |
1.4 主要研究内容 |
1.5 本文的组织结构 |
第二章 老挝语文字识别实验数据及其预处理 |
2.1 老挝语文本图像识别语料库构建 |
2.1.1 合成数据 |
2.1.2 互联网获取数据 |
2.1.3 收集数据 |
2.2 本文使用数据集情况 |
2.3 本章小结 |
第三章 ResNet-BiLSTM-CTC文字识别模型构建 |
3.1 研究思路 |
3.2 ResNet-BiLSTM-CTC模型构建 |
3.2.1 深度卷积网络 |
3.2.2 边框回归 |
3.2.3 双向长短期记忆网络 |
3.2.4 CTC |
3.3 数字特征分析 |
3.4 实验分析与评价标准 |
3.4.1 评价指标和模型参数 |
3.4.2 部件参数性能实验 |
3.4.3 融合数字特征实验 |
3.4.4 模型对比实验 |
3.5 本章小结 |
第四章 融合字符结构特征的多任务老挝语文字识别方法 |
4.1 引言 |
4.2 老挝语字符书写等级特征 |
4.3 融合字符结构特征的多任务老挝语文字识别模型 |
4.3.1 共享特征提取层 |
4.3.2 老挝语字符序列识别层 |
4.3.3 识别结果后处理 |
4.4 多任务学习 |
4.5 模型参数与实验分析 |
4.5.1 模型参数设置 |
4.5.2 不同文字识别方法对比实验 |
4.5.3 端到端老挝语文字识别模型消融实验 |
4.6 本章小结 |
第五章 融合多特征的老挝语相似字符识别方法 |
5.1 引言 |
5.2 相似字符特征和音调特征融合 |
5.2.1 相似字符对特征 |
5.2.2 音调与死闭音节特征 |
5.3 融合多特征的老挝语相似字符识别方法 |
5.3.1 共享特征提取层 |
5.3.2 编码层 |
5.3.3 解码层 |
5.3.4 注意力机制 |
5.4 实验对比与分析 |
5.4.1 评价标准与模型参数 |
5.4.2 不同训练集对比实验 |
5.4.3 模型对比实验 |
5.4.4 消融实验 |
5.5 本章小结 |
第六章 结论与展望 |
参考文献 |
致谢 |
附录A 攻读硕士学位期间发表论文 |
附录B 攻读硕士学位期间发表发明专利 |
附录C 攻读硕士学位期间参与科研项目 |
(6)场景文字识别技术研究综述(论文提纲范文)
1 引言 |
2 场景文字识别预处理技术及流程 |
3 基于深度学习的自然场景文字检测与识别技术 |
3.1 基于深度学习的通用检测网络 |
3.2 基于深度学习的场景文字检测技术 |
3.3 基于深度学习的图像文字识别技术 |
3.4 端到端场景文字检测与识别网络 |
4 数据集 |
5 场景文字识别技术研究趋势 |
6 结束语 |
(7)基于深度学习的西夏文字识别研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景和意义 |
1.2 研究现状 |
1.3 本文主要内容与结构 |
第2章 相关理论知识 |
2.1 引言 |
2.2 深度神经网络 |
2.3 卷积神经网络 |
2.4 本章小结 |
第3章 基于改进的MSER算法的图像预处理 |
3.1 引言 |
3.2 基于改进的MSER算法文字区域提取 |
3.3 图像平滑滤波 |
3.4 西夏文字图像尺度规范 |
3.5 本章小结 |
第4章 基于深度识别网络的西夏文字识别研究 |
4.1 引言 |
4.2 深度卷积神经网络 |
4.3 CAPSNET网络 |
4.4 A-CAPSNET网络 |
4.5 实验结果与分析 |
4.6 本章小结 |
第5章 总结与展望 |
5.1 研究总结 |
5.2 未来展望 |
参考文献 |
致谢 |
个人简历及论文发表情况 |
(8)图文混编图像的版面分析及识别研究(论文提纲范文)
摘要 |
ABSTRACT |
引言 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状综述 |
1.2.1 版面分割方法的研究 |
1.2.2 文字识别方法的研究 |
1.3 本文的组织结构 |
第二章 相关理论与算法基础 |
2.1 版面图像预处理 |
2.1.1 图像灰度化 |
2.1.2 图像二值化处理 |
2.1.3 图像去噪 |
2.1.4 版面校正 |
2.2 版面分割方法 |
2.2.1 非层次化版面分割方法 |
2.2.2 层次化的版面分割方法 |
2.3 文字识别方法 |
2.3.1 基于结构模式的识别方法 |
2.3.2 基于统计模式的识别方法 |
2.3.3 基于结构模式与统计模式相结合的识别方法 |
2.4 本章小结 |
第三章 基于图文混编的版面分析算法 |
3.1 问题的提出 |
3.2 融合轮廓投影的连通域版面分割算法 |
3.2.1 形成连通域与单字区域扩充 |
3.2.2 轮廓投影 |
3.2.3 间隔阈值获取 |
3.2.4 同质连通域合并 |
3.3 基于多级划分的单字识别算法 |
3.3.1 特征提取 |
3.3.2 模板匹配 |
3.4 图像匹配技术 |
3.5 实验分析 |
3.6 本章小结 |
第四章 系统设计与实验分析 |
4.1 问题的提出 |
4.2 系统框架流程 |
4.3 算法实验结果分析 |
4.4 系统测试 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
作者简介及读研期间主要科研成果 |
(9)基于优化分割与提取的西夏古籍文字识别研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 论文主要内容及设计 |
第二章 西夏文字字形特征分析 |
2.1 西夏文字的简介 |
2.2 西夏文字的四角号码 |
2.3 西夏文字研究的难点分析 |
2.4 本章小结 |
第三章 古籍图像预处理与分割 |
3.1 图像二值化 |
3.2 数学形态学 |
3.2.1 形态学算子 |
3.3 基于连通域分析算法的古籍图像分割 |
3.3.1 连通域 |
3.3.2 连通区域分析算法 |
3.4 边缘检测 |
3.4.1 概述 |
3.4.2 实验 |
3.5 本章小结 |
第四章 特征提取 |
4.1 方向梯度直方图(HOG)简介 |
4.2 方向梯度直方图HOG算法实现 |
4.2.1 颜色空间归一化 |
4.2.2 梯度计算 |
4.2.3 特征向量归一化 |
4.3 三线性插值 |
4.3.1 概述 |
4.3.2 算法的由来 |
4.3.3 实验 |
4.4 本章小结 |
第五章 基于三种分类器的识别对比 |
5.1 机器学习 |
5.1.1 机器学习的简述 |
5.1.2 机器学习的分类 |
5.1.3 机器学习的发展 |
5.2 支持向量机 |
5.2.1 支持向量机简介 |
5.2.2 支持向量机的数学推导 |
5.2.4 基于SVM的西夏文字识别 |
5.3 Random Forests算法 |
5.3.1 Random Forests算法简介 |
5.3.2 随机森林算法原理 |
5.3.3 基于随机森林的西夏文字识别 |
5.4 K Nearest Neighbor算法 |
5.4.1 K Nearest Neighbor算法简介 |
5.4.2 K-NN算法之球树实现原理 |
5.4.3 K-NN算法小结 |
5.4.4 基于KNN的西夏文字识别 |
5.5 实验结果及分析 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文工作总结及创新点分析 |
6.2 展望 |
参考文献 |
致谢 |
个人简介 |
(10)基于改进模糊支持向量机的西夏文字识别研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文工作及安排 |
1.3.1 研究的主要成果 |
1.3.2 章节安排 |
第二章 西夏文字识别理论 |
2.1 西夏文字识别概论 |
2.1.1 西夏文字编码研究 |
2.1.2 西夏文字识别流程 |
2.1.3 西夏文字识别难点 |
2.2 西夏文字图像预处理 |
2.2.1 灰度处理 |
2.2.2 滤波去噪 |
2.2.3 二值化处理 |
2.2.4 文字图像的细化处理 |
2.3 西夏文字图像的特征提取 |
2.3.1 HOG特征提取算法 |
2.3.2 特征提取结果分析 |
2.4 本章小结 |
第三章 支持向量机及模糊支持向量机理论 |
3.1 支持向量机理论 |
3.1.1 线性可分 |
3.1.2 非线性可分 |
3.2 模糊支持向量机 |
3.3 基于多超平面的模糊支持向量机 |
3.3.1 常见的隶属度函数设计及不足 |
3.3.2 基于多超平面的模糊支持向量机 |
3.3.3 仿真实验及结果分析 |
3.4 本章小结 |
第四章 基于改进模糊支持向量机的西夏文字识别 |
4.1 非平衡数据集介绍 |
4.1.1 非平衡数据集特点 |
4.1.2 非平衡数据集分类的难点 |
4.1.3 非平衡数据集分类的评价标准 |
4.2 非平衡数据集的处理方法 |
4.2.1 常见的非平衡数据集的处理方法 |
4.2.2 一种新的非平衡数据集处理方法 |
4.2.3 数值实验 |
4.3 西夏文字识别实验 |
4.3.1 数据集介绍 |
4.3.2 识别实验及结果分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
四、西夏文字识别中的图像预处理(论文参考文献)
- [1]西夏文献注译辅助识别系统平台设计[D]. 陈燕. 宁夏大学, 2021
- [2]基于风格迁移的手写西夏文字样本生成研究[D]. 杨丽娟. 宁夏大学, 2021
- [3]朝鲜语古籍文字识别方法研究[D]. 薛春寒. 延边大学, 2021
- [4]融合多特征的老挝语文字识别研究[D]. 陈琢. 昆明理工大学, 2021(01)
- [5]基于深度学习的西夏文献数字化[J]. 张光伟. 西夏学, 2020(02)
- [6]场景文字识别技术研究综述[J]. 王德青,吾守尔·斯拉木,许苗苗. 计算机工程与应用, 2020(18)
- [7]基于深度学习的西夏文字识别研究[D]. 王葭. 宁夏大学, 2020(03)
- [8]图文混编图像的版面分析及识别研究[D]. 邹志文. 安徽理工大学, 2019(01)
- [9]基于优化分割与提取的西夏古籍文字识别研究[D]. 李小璐. 宁夏大学, 2019(02)
- [10]基于改进模糊支持向量机的西夏文字识别研究[D]. 刘兴长. 兰州交通大学, 2019(03)