导读:本文包含了汉字分割论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:汉字,字符,图像,文本,算法,日中,在线。
汉字分割论文文献综述
杨谢柳,牛玺辉,梁文峰[1](2019)在《面向非规则排列汉字文本的字符分割方法》一文中研究指出针对现有字符分割方法应用于非规则排列汉字文本时分割正确率低的问题,提出一种基于连通区域捆绑规则的汉字字符分割方法.首先,提取文本前景并标记连通区域;其次,通过计算连通区域的质心及半径构建其包围圆;然后,根据包围圆大小判断并剔除错误的连通区域;最后,基于汉字的结构特征制定文本连通区域捆绑规则,实现汉字字符的分割.实验表明,与现有方法相比,文中方法在处理非规则排列汉字文本时具有更高的分割正确率,且该方法对规则排列汉字文本的字符分割也具有良好的适用性.(本文来源于《计算机辅助设计与图形学学报》期刊2019年09期)
雷鑫,李俊阳,宋宇,赛琳伟[2](2018)在《用于手写汉字识别的文本分割方法》一文中研究指出本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白。本方法首先对预处理后的文本图片进行池化处理,然后运用并查集算法得到每行为一个连通区域,最后调整每行上下的孤立区域的归属,最终把多行文本图片分割为单行,为后期的汉字列分割做准备。此方法虽然用行分割,但也为汉字的列分割提供了新的思路。(本文来源于《智能计算机与应用》期刊2018年02期)
叶栩邑[3](2017)在《日中同形语字形类似度の统计 自然言语処理における汉字分割法の利用を中心に》一文中研究指出近30年来关于中日同形词对照的研究为数众多,其中不乏有许多在中日字形方面进行比较的质性研究,但对于中日整体字形对照比较的量性研究却极少,同时现有的调查在统计类似度时所使用的判定基准也存在诸多问题。本文利用自然语言处理中的汉字分割法,按照汉字本身构造分割成字根进行中日间对比,整理出中日同形词汉字结构对应的各个类型,并且以1000词为例按照对应字根在整体汉字中所占的比例分析统计了中日同形词的类似度情况。(本文来源于《日本学研究》期刊2017年00期)
李昕岩,陈联[4](2017)在《一种基于SVG的在线连续手写汉字多步分割方法》一文中研究指出为了对基于可伸缩矢量图SVG的在线连续手写汉字进行有效的分割,提出一种基于图论的在线连续手写汉字多步分割方法。该方法以SVG格式存储的手写汉字为基本研究对象,根据汉字笔画间的坐标位置关系对手写笔画序列构建无向图模型,并利用图的广度优先搜索将原笔画序列分割为互不连通的笔画部件,使偏旁部首分离较远、非粘连汉字得到正确分割;然后利用改进的Tarjan算法对部件中的粘连字符进行分割;最后基于笔画部件间距,利用二分类迭代算法对间距进行分类,找出全局最佳分割位置,对过分割的部件进行重组合并。实验结果表明,该方法对于在线手写汉字的分割是有效可行的。(本文来源于《计算机应用研究》期刊2017年11期)
黄志敏,姚舜奕,熊玉洁[5](2016)在《基于两方向动态时间规整的无分割手写汉字检测》一文中研究指出中文文本布局复杂、汉字种类多、书写随意性大,因而手写汉字检测是一个很有挑战的问题。针对上述问题,提出了一种无分割的手写中文文档字符检测的方法。该方法用SIFT定位文本中候选关键点,然后基于关键点位置和待查询汉字大小来确定候选字符的位置,最后用两个方向动态时间规整(dynamic time warping,DTW)算法来筛选候选字符。实验结果表明,该方法能够在无须将文本分割为字符的情况下准确找到待查询的汉字,并且优于传统的基于DTW字符检测方法。(本文来源于《计算机应用研究》期刊2016年11期)
付芦静,钱军浩,钟云飞[6](2015)在《基于汉字连通分量的印刷图像版面分割方法》一文中研究指出针对彩色印刷图像背景色彩丰富和汉字存在多个连通分量,连通域文字分割算法不能精确提取文字,提出基于汉字连通分量的彩色印刷图像版面分割方法。利用金字塔变换逆半调算法对图像进行预处理,通过颜色采样和均值偏移分割图像颜色,标记文字连通分量,根据汉字结构和连通分量特性重建汉字连通分量,分析文字连通分量连接关系确定文字排列方向实现文字分割。实验结果表明,该方法能够有效地重建汉字连通分量,在彩色印刷图像中实现对不同字体、字号、颜色的文字分割。(本文来源于《计算机工程与应用》期刊2015年05期)
杨侠[7](2012)在《手写体汉字分割的研究与应用》一文中研究指出随着计算机信息技术的飞速发展,传统的纸张文字已无法满足人们对信息的要求,将纸张文字通过各种扫描设备输入到计算机中,即将传统的纸张文字转化为数字化信息已成为时代的必然趋势。随着各种扫描设备的不断发展,基于OCR光学字符识别系统的电子设备已逐渐投入到使用中来。OCR技术是一种图像信息数字化的过程,主要包括原始图像的输入、图像预处理、字符分割、字符特征提取和字符识别几个步骤。OCR的最终目的是要将纸张信息转化为数字化信息,并进行字符识别,而在该过程中,字符分割是字符识别的一个基础和难点。本文主要针对手写体汉字进行研究,研究重点是字符分割以及图像预处理中的字符图像细化。现有的手写体汉字图像细化和分割方法仍存在许多不足之处,如字符图像细化不彻底、字符图像的误分割或过分割现象等。针对这些不足之处,本文对原有的手写体汉字图像细化方法及分割方法进行了一定的改进,较好的解决了细化不彻底现象与误分割问题。本文主要针对手写体汉字的二值化图像进行研究,这样做可以很好的排除其他因素的干扰,将字符图像与背景相分离,更加关注字符图像的细节信息,有利于进一步的字符图像特征的提取和字符识别。本文所做的主要工作包括:(1)介绍了OCR技术的应用与发展,并针对本文的研究内容,对字符分割的国内外研究现状进行分析。针对手写体汉字的字符特征以及字符特性,分析使用各种方法的优缺点,并对其分割准确度进行比较。(2)介绍了字符图像的预处理工作,主要包括图像去噪、图像二值化以及文本行分割。内容包括进行该工作使用的方法以及进行该预处理的好处,并通过相应的实验效果对比说明进行预处理工作的必要性。(3)主要论述了手写体汉字的字符特征,以及针对手写体汉字的独特性对字符图像进行的细化处理,即手写体汉字细化。简单介绍了字符细化研究现状和研究背景,并针对原有的细化方法进行分析,提出了一种改进的基于数学形态学的手写体汉字细化方法。(4)介绍了字分割方法中的两大难点,粘连字的确认以及如何寻找正确的分裂点。针对原有的基于连通域标记和基于投影的分割方法的不足之处,本文提出了一种改进的基于投影的手写体汉字分割方法。(5)根据论文中所介绍的方法,对手写体汉字图像进行实验,并对实验结果进行分析和比较。对本研究方向中还存在的缺点以及需要改进的地方进行阐述,并介绍了手写体汉字分割在模式识别领域中的应用情况。(本文来源于《山东师范大学》期刊2012-06-15)
周双飞,刘纯平,柳恭,龚声蓉[8](2012)在《最小加权分割路径的古籍手写汉字多步切分方法》一文中研究指出针对古籍古文献中部分汉字易发生粘连现象,提出一种古籍手写汉字多步分割方法.该方法继承了以往粗分割和细分割相结合的思想,首先采用投影进行粗分割,将手写汉字分为粘连字符和非粘连字符两类;然后针对粘连字符串抛弃常用的串行模式,直接采用粗分割的统计信息,设置初始分割路径,并基于最短分割路径的思想,在初始分割路径的局部邻域内基于最小权值搜索并修改分割路径,从而获得最佳的加权分割路径.实验证明该方法解决了字符分割不足和多处粘连字符的分割问题,有效的提高了分割的准确率,且算法的时间复杂度较低,算法效率较高.(本文来源于《小型微型计算机系统》期刊2012年03期)
朱雷[9](2011)在《古籍手写汉字图像分割算法研究》一文中研究指出文本图像的分割对于进行正确的单字提取和字符识别有着重大的影响和使用价值,而古籍手写汉字图像分割更是古籍汉字识别过程中的难点。同时古籍手写汉字图像的分割对开展古籍文物研究、文献研究及文字研究工作具有十分重要的价值。由于古籍汉字资料保存时间久远,大量存在纸张变色、破损、文字残缺等现象,导致古籍手写汉字图像噪声很大,处理难度很大。现有的大多数预处理及单字切分算法多以印刷文本图像为处理对象,在对古籍手写汉字图像进行处理时往往效果欠佳。因此,论文根据古籍手写汉字分割的要求对现有的方法进行改进,并设计了新的文本图像处理方法,以期得到满意的单字图像分割结果。在参与对敦煌遗书等古籍进行研究的社科基金项目的过程中,分析了古籍手写汉字图像的特点和复杂性,在阈值分割、连通域标记和基于偏微分方程的目标轮廓提取等理论与算法的基础上,对古籍手写汉字图像的分割问题进行了深入的研究。主要内容有:①针对单纯采用全局阈值法或局部阈值法对图像进行分割时的不足,提出了整体阈值与局部阈值相结合的二次OTSU算法。算法综合考虑全局阈值与局部阈值来确定各像素点的阈值。与单纯采用全局阈值法和单纯采用局部阈值法相比,该算法在克服了以上两种算法的缺点的同时,继承了以上两种算法的优点,既考虑到了局部图像的特殊性,也兼顾了整个图像的整体性。通过实验证明,这种方法很好地将全局阈值的概括性与局部阈值的针对性结合了起来,能够取得明显优于原来两种算法的处理结果,这给后续的字符切分打下了良好的基础。②针对传统连通域标记算法需要多次扫描才能完成像素标记,运算时间较长的缺点,提出了快速非递归连通域生成及合并算法。算法对二值图像只需进行一次扫描,对需要识别的目标进行标记,遇到分叉时即进行连通域的合并。因此,在扫描过程中就可得到已扫描区域中的连通域,一次扫描后,无需再进行任何处理,就得到了二值图像的连通域的正确划分。实验证明,算法对于简单图像、一次分叉图像、多次分叉图像、连通域相互包含的图像,都可以正确、快速地进行连通域的标记处理。③应用快速非递归连通域生成及合并算法,设计了基于连通域特征的去噪去边框算法,及基于连通域并结合方块字特征进行单字切分的算法。并进一步采用局部投影法进行粘连字的切分。对应用快速连通域标记算法进行手写汉字图像处理的算法都进行了实验及结果分析。实践证明算法对手写汉字图像进行连通域生成、去噪、去边框及单字切分效果良好。④针对传统C-V主动轮廓模型达到稳定状态所需的迭代次数过多,对图像的尺寸比较敏感的缺点,提出了局部C-V主动轮廓模型快速图像分割算法。算法对图像进行预先的分块,将各分块单独作为输入图像以C-V模型算法进行分割处理。实验证明,算法在保证处理效果的前提下速度上得到了极大的提高。⑤根据手写汉字每个汉字单独成块的特点,提出了窄带快速C-V手写汉字图像分割方法。算法首先采用阈值法对汉字进行初步的分割,再利用汉字图像的连通域信息,进行汉字图像轮廓标记及窄带的构造,进一步进行基于窄带C-V模型的手写汉字图像分割。实验表明,采用窄带法对手写汉字进行分割,能够保留更多的文字细节,更加真实自然,同时处理速度进一步提高,有利于对文字进行后续的分析研究。综合本文提出的各种手写汉字图像分割算法,设计出了对手写汉字图像进行分割处理的完整的算法流程。对灰度化的手写汉字图像采用二次OTSU算法,对整幅图像进行二值化处理。接着采用非递归快速连通域算法,标记出图像的连通域情况。根据手写汉字的特点,进行去边框、去噪及单个汉字的分割操作。根据连通域情况初步分割出单个汉字后,再从原灰度图像中的对应位置取出小图像,采用OTSU算法进行二值化,以避免由于一个汉字处理不同区域采用不同阈值造成的差异。对以此方法得到的二值化图像进行轮廓标记。对每个单个汉字的原图像区域,以刚得到的轮廓为窄带划分的依据,采用前述的窄带C-V算法,进行汉字图像的细致分割。采用本文所提出的一系列算法对古籍手写汉字图像进行分割,能在提高处理效率的同时得到良好的分割效果。(本文来源于《重庆大学》期刊2011-03-01)
袁媛,刘文才[10](2010)在《基于形状分割的手写汉字笔划提取方法》一文中研究指出笔迹鉴别的目的是区分不同的书写者,而笔划提取是笔迹鉴别的基础。本文提出了一种用于笔迹鉴别的手写汉字笔划提取算法,该算法定义了凹凸点与四种基本笔划相交类型的对应关系,通过字符图像轮廓上的凹凸点检测来确定笔划相交区域和相交类型;接着,在各个相交区域上,根据其笔划相交类型进行形状分割;最后,用对笔划轮廓两侧对应点进行跟踪的方法来进行细化。我们将该算法与基于细化和基于段化的笔划提取算法进行比较,实验结果表明,该提取算法具有比较高的准确率和有效性,因此本文提出的基于形状分割的手写汉字笔划提取方法具有较高的可操作性和实用价值。(本文来源于《计算机工程与科学》期刊2010年12期)
汉字分割论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白。本方法首先对预处理后的文本图片进行池化处理,然后运用并查集算法得到每行为一个连通区域,最后调整每行上下的孤立区域的归属,最终把多行文本图片分割为单行,为后期的汉字列分割做准备。此方法虽然用行分割,但也为汉字的列分割提供了新的思路。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
汉字分割论文参考文献
[1].杨谢柳,牛玺辉,梁文峰.面向非规则排列汉字文本的字符分割方法[J].计算机辅助设计与图形学学报.2019
[2].雷鑫,李俊阳,宋宇,赛琳伟.用于手写汉字识别的文本分割方法[J].智能计算机与应用.2018
[3].叶栩邑.日中同形语字形类似度の统计自然言语処理における汉字分割法の利用を中心に[J].日本学研究.2017
[4].李昕岩,陈联.一种基于SVG的在线连续手写汉字多步分割方法[J].计算机应用研究.2017
[5].黄志敏,姚舜奕,熊玉洁.基于两方向动态时间规整的无分割手写汉字检测[J].计算机应用研究.2016
[6].付芦静,钱军浩,钟云飞.基于汉字连通分量的印刷图像版面分割方法[J].计算机工程与应用.2015
[7].杨侠.手写体汉字分割的研究与应用[D].山东师范大学.2012
[8].周双飞,刘纯平,柳恭,龚声蓉.最小加权分割路径的古籍手写汉字多步切分方法[J].小型微型计算机系统.2012
[9].朱雷.古籍手写汉字图像分割算法研究[D].重庆大学.2011
[10].袁媛,刘文才.基于形状分割的手写汉字笔划提取方法[J].计算机工程与科学.2010