导读:本文包含了手写汉字分割论文开题报告文献综述及选题提纲参考文献,主要关键词:手写汉字识别,池化,文本分割,并查集
手写汉字分割论文文献综述
雷鑫,李俊阳,宋宇,赛琳伟[1](2018)在《用于手写汉字识别的文本分割方法》一文中研究指出本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白。本方法首先对预处理后的文本图片进行池化处理,然后运用并查集算法得到每行为一个连通区域,最后调整每行上下的孤立区域的归属,最终把多行文本图片分割为单行,为后期的汉字列分割做准备。此方法虽然用行分割,但也为汉字的列分割提供了新的思路。(本文来源于《智能计算机与应用》期刊2018年02期)
李昕岩,陈联[2](2017)在《一种基于SVG的在线连续手写汉字多步分割方法》一文中研究指出为了对基于可伸缩矢量图SVG的在线连续手写汉字进行有效的分割,提出一种基于图论的在线连续手写汉字多步分割方法。该方法以SVG格式存储的手写汉字为基本研究对象,根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的Tarjan算法对部件中的粘连字符进行分割;最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。(本文来源于《计算机应用研究》期刊2017年11期)
黄志敏,姚舜奕,熊玉洁[3](2016)在《基于两方向动态时间规整的无分割手写汉字检测》一文中研究指出中文文本布局复杂、汉字种类多、书写随意性大,因而手写汉字检测是一个很有挑战的问题。针对上述问题,提出了一种无分割的手写中文文档字符检测的方法。该方法用SIFT定位文本中候选关键点,然后基于关键点位置和待查询汉字大小来确定候选字符的位置,最后用两个方向动态时间规整(dynamic time warping,DTW)算法来筛选候选字符。实验结果表明,该方法能够在无须将文本分割为字符的情况下准确找到待查询的汉字,并且优于传统的基于DTW字符检测方法。(本文来源于《计算机应用研究》期刊2016年11期)
杨侠[4](2012)在《手写体汉字分割的研究与应用》一文中研究指出随着计算机信息技术的飞速发展,传统的纸张文字已无法满足人们对信息的要求,将纸张文字通过各种扫描设备输入到计算机中,即将传统的纸张文字转化为数字化信息已成为时代的必然趋势。随着各种扫描设备的不断发展,基于OCR光学字符识别系统的电子设备已逐渐投入到使用中来。OCR技术是一种图像信息数字化的过程,主要包括原始图像的输入、图像预处理、字符分割、字符特征提取和字符识别几个步骤。OCR的最终目的是要将纸张信息转化为数字化信息,并进行字符识别,而在该过程中,字符分割是字符识别的一个基础和难点。本文主要针对手写体汉字进行研究,研究重点是字符分割以及图像预处理中的字符图像细化。现有的手写体汉字图像细化和分割方法仍存在许多不足之处,如字符图像细化不彻底、字符图像的误分割或过分割现象等。针对这些不足之处,本文对原有的手写体汉字图像细化方法及分割方法进行了一定的改进,较好的解决了细化不彻底现象与误分割问题。本文主要针对手写体汉字的二值化图像进行研究,这样做可以很好的排除其他因素的干扰,将字符图像与背景相分离,更加关注字符图像的细节信息,有利于进一步的字符图像特征的提取和字符识别。本文所做的主要工作包括:(1)介绍了OCR技术的应用与发展,并针对本文的研究内容,对字符分割的国内外研究现状进行分析。针对手写体汉字的字符特征以及字符特性,分析使用各种方法的优缺点,并对其分割准确度进行比较。(2)介绍了字符图像的预处理工作,主要包括图像去噪、图像二值化以及文本行分割。内容包括进行该工作使用的方法以及进行该预处理的好处,并通过相应的实验效果对比说明进行预处理工作的必要性。(3)主要论述了手写体汉字的字符特征,以及针对手写体汉字的独特性对字符图像进行的细化处理,即手写体汉字细化。简单介绍了字符细化研究现状和研究背景,并针对原有的细化方法进行分析,提出了一种改进的基于数学形态学的手写体汉字细化方法。(4)介绍了字分割方法中的两大难点,粘连字的确认以及如何寻找正确的分裂点。针对原有的基于连通域标记和基于投影的分割方法的不足之处,本文提出了一种改进的基于投影的手写体汉字分割方法。(5)根据论文中所介绍的方法,对手写体汉字图像进行实验,并对实验结果进行分析和比较。对本研究方向中还存在的缺点以及需要改进的地方进行阐述,并介绍了手写体汉字分割在模式识别领域中的应用情况。(本文来源于《山东师范大学》期刊2012-06-15)
周双飞,刘纯平,柳恭,龚声蓉[5](2012)在《最小加权分割路径的古籍手写汉字多步切分方法》一文中研究指出针对古籍古文献中部分汉字易发生粘连现象,提出一种古籍手写汉字多步分割方法.该方法继承了以往粗分割和细分割相结合的思想,首先采用投影进行粗分割,将手写汉字分为粘连字符和非粘连字符两类;然后针对粘连字符串抛弃常用的串行模式,直接采用粗分割的统计信息,设置初始分割路径,并基于最短分割路径的思想,在初始分割路径的局部邻域内基于最小权值搜索并修改分割路径,从而获得最佳的加权分割路径.实验证明该方法解决了字符分割不足和多处粘连字符的分割问题,有效的提高了分割的准确率,且算法的时间复杂度较低,算法效率较高.(本文来源于《小型微型计算机系统》期刊2012年03期)
朱雷[6](2011)在《古籍手写汉字图像分割算法研究》一文中研究指出文本图像的分割对于进行正确的单字提取和字符识别有着重大的影响和使用价值,而古籍手写汉字图像分割更是古籍汉字识别过程中的难点。同时古籍手写汉字图像的分割对开展古籍文物研究、文献研究及文字研究工作具有十分重要的价值。由于古籍汉字资料保存时间久远,大量存在纸张变色、破损、文字残缺等现象,导致古籍手写汉字图像噪声很大,处理难度很大。现有的大多数预处理及单字切分算法多以印刷文本图像为处理对象,在对古籍手写汉字图像进行处理时往往效果欠佳。因此,论文根据古籍手写汉字分割的要求对现有的方法进行改进,并设计了新的文本图像处理方法,以期得到满意的单字图像分割结果。在参与对敦煌遗书等古籍进行研究的社科基金项目的过程中,分析了古籍手写汉字图像的特点和复杂性,在阈值分割、连通域标记和基于偏微分方程的目标轮廓提取等理论与算法的基础上,对古籍手写汉字图像的分割问题进行了深入的研究。主要内容有:①针对单纯采用全局阈值法或局部阈值法对图像进行分割时的不足,提出了整体阈值与局部阈值相结合的二次OTSU算法。算法综合考虑全局阈值与局部阈值来确定各像素点的阈值。与单纯采用全局阈值法和单纯采用局部阈值法相比,该算法在克服了以上两种算法的缺点的同时,继承了以上两种算法的优点,既考虑到了局部图像的特殊性,也兼顾了整个图像的整体性。通过实验证明,这种方法很好地将全局阈值的概括性与局部阈值的针对性结合了起来,能够取得明显优于原来两种算法的处理结果,这给后续的字符切分打下了良好的基础。②针对传统连通域标记算法需要多次扫描才能完成像素标记,运算时间较长的缺点,提出了快速非递归连通域生成及合并算法。算法对二值图像只需进行一次扫描,对需要识别的目标进行标记,遇到分叉时即进行连通域的合并。因此,在扫描过程中就可得到已扫描区域中的连通域,一次扫描后,无需再进行任何处理,就得到了二值图像的连通域的正确划分。实验证明,算法对于简单图像、一次分叉图像、多次分叉图像、连通域相互包含的图像,都可以正确、快速地进行连通域的标记处理。③应用快速非递归连通域生成及合并算法,设计了基于连通域特征的去噪去边框算法,及基于连通域并结合方块字特征进行单字切分的算法。并进一步采用局部投影法进行粘连字的切分。对应用快速连通域标记算法进行手写汉字图像处理的算法都进行了实验及结果分析。实践证明算法对手写汉字图像进行连通域生成、去噪、去边框及单字切分效果良好。④针对传统C-V主动轮廓模型达到稳定状态所需的迭代次数过多,对图像的尺寸比较敏感的缺点,提出了局部C-V主动轮廓模型快速图像分割算法。算法对图像进行预先的分块,将各分块单独作为输入图像以C-V模型算法进行分割处理。实验证明,算法在保证处理效果的前提下速度上得到了极大的提高。⑤根据手写汉字每个汉字单独成块的特点,提出了窄带快速C-V手写汉字图像分割方法。算法首先采用阈值法对汉字进行初步的分割,再利用汉字图像的连通域信息,进行汉字图像轮廓标记及窄带的构造,进一步进行基于窄带C-V模型的手写汉字图像分割。实验表明,采用窄带法对手写汉字进行分割,能够保留更多的文字细节,更加真实自然,同时处理速度进一步提高,有利于对文字进行后续的分析研究。综合本文提出的各种手写汉字图像分割算法,设计出了对手写汉字图像进行分割处理的完整的算法流程。对灰度化的手写汉字图像采用二次OTSU算法,对整幅图像进行二值化处理。接着采用非递归快速连通域算法,标记出图像的连通域情况。根据手写汉字的特点,进行去边框、去噪及单个汉字的分割操作。根据连通域情况初步分割出单个汉字后,再从原灰度图像中的对应位置取出小图像,采用OTSU算法进行二值化,以避免由于一个汉字处理不同区域采用不同阈值造成的差异。对以此方法得到的二值化图像进行轮廓标记。对每个单个汉字的原图像区域,以刚得到的轮廓为窄带划分的依据,采用前述的窄带C-V算法,进行汉字图像的细致分割。采用本文所提出的一系列算法对古籍手写汉字图像进行分割,能在提高处理效率的同时得到良好的分割效果。(本文来源于《重庆大学》期刊2011-03-01)
袁媛,刘文才[7](2010)在《基于形状分割的手写汉字笔划提取方法》一文中研究指出笔迹鉴别的目的是区分不同的书写者,而笔划提取是笔迹鉴别的基础。本文提出了一种用于笔迹鉴别的手写汉字笔划提取算法,该算法定义了凹凸点与四种基本笔划相交类型的对应关系,通过字符图像轮廓上的凹凸点检测来确定笔划相交区域和相交类型;接着,在各个相交区域上,根据其笔划相交类型进行形状分割;最后,用对笔划轮廓两侧对应点进行跟踪的方法来进行细化。我们将该算法与基于细化和基于段化的笔划提取算法进行比较,实验结果表明,该提取算法具有比较高的准确率和有效性,因此本文提出的基于形状分割的手写汉字笔划提取方法具有较高的可操作性和实用价值。(本文来源于《计算机工程与科学》期刊2010年12期)
冯志敏,杨明海[8](2009)在《规范手写体汉字的部首分割研究》一文中研究指出本文在预处理的基础上提取出笔段特征,然后提取出部首,按照部首查字法的思想对部首和剩余的部分进行识别并给出最终的识别结果。在提取部首的时候对于对没有连笔的采用各静态分割的方法,对有连笔的提出基于笔段的的部首的动态组合算法。由于汉字切分成笔段以后连笔与不连笔没有太大的区别,所以能在一定程度上解决连笔这个手写体识别中的难点。(本文来源于《内江科技》期刊2009年08期)
陈念,黄孝[9](2008)在《基于投影与结构信息的汉字手写体分割》一文中研究指出手写体汉字识别是有着广泛应用的研究领域,非限定手写体汉字串由于大量存在笔画嵌入、粘连等现象,将单字从串中分离开就成为字识别的前提。本文以投影法为基础,有效利用字间距和汉字本身固有的结构信息对手写体汉字进行分割。本文提到的方法在银行票据,邮件等签字认定等领域有着广泛的应用。(本文来源于《池州学院学报》期刊2008年05期)
周正,童维勤[10](2008)在《一种适用于嵌入式环境下的手写汉字分割算法》一文中研究指出汉字分割是连续手写汉字识别的关键问题之一,现有多数汉字分割算法需要对笔划结构进行分析,由于汉字具有复杂的结构和不同的书写风格,因此往往计算量偏大。针对嵌入式系统处理能力和内存资源相对较少的特点,介绍了一种基于笔划连通域和字符投影的手写汉字分割算法,以连通域为单元实现连续汉字的分割,不用考虑连通域中所包含笔划的结构和风格,降低了计算量。(本文来源于《计算机应用与软件》期刊2008年07期)
手写汉字分割论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了对基于可伸缩矢量图SVG的在线连续手写汉字进行有效的分割,提出一种基于图论的在线连续手写汉字多步分割方法。该方法以SVG格式存储的手写汉字为基本研究对象,根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的Tarjan算法对部件中的粘连字符进行分割;最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
手写汉字分割论文参考文献
[1].雷鑫,李俊阳,宋宇,赛琳伟.用于手写汉字识别的文本分割方法[J].智能计算机与应用.2018
[2].李昕岩,陈联.一种基于SVG的在线连续手写汉字多步分割方法[J].计算机应用研究.2017
[3].黄志敏,姚舜奕,熊玉洁.基于两方向动态时间规整的无分割手写汉字检测[J].计算机应用研究.2016
[4].杨侠.手写体汉字分割的研究与应用[D].山东师范大学.2012
[5].周双飞,刘纯平,柳恭,龚声蓉.最小加权分割路径的古籍手写汉字多步切分方法[J].小型微型计算机系统.2012
[6].朱雷.古籍手写汉字图像分割算法研究[D].重庆大学.2011
[7].袁媛,刘文才.基于形状分割的手写汉字笔划提取方法[J].计算机工程与科学.2010
[8].冯志敏,杨明海.规范手写体汉字的部首分割研究[J].内江科技.2009
[9].陈念,黄孝.基于投影与结构信息的汉字手写体分割[J].池州学院学报.2008
[10].周正,童维勤.一种适用于嵌入式环境下的手写汉字分割算法[J].计算机应用与软件.2008