论文摘要
针对低质量文档图像存在的背景渗透、页面污渍、边缘大面积与文本相似的噪声等现象,改进D-LinkNet框架,提出了一种融合多尺度特征(multiple scale feature)的低质量文档图像二值化算法,简称为MD-LinkNet。该算法有两处改进,一是在编解码中间部分增加剩余多核池化(RMP)模块来通过四个池化操作以提取丰富的文档特征信息;二是将池化后的低分辨率图像通过DUpsample而不是双线性插值进行上采样,结合了文档图像像素邻域信息,将文档图像的全局与局部特征进行融合,提高了分割精度。实验结果表明,在2017年和2018年国际文档图像二值化竞赛(DIBCO)数据集中,本文算法的F值(F-measure)最高分别达到了90.54、91.42,验证了所提出算法在解决多种复杂噪声背景的低质量文档图像下的鲁棒性,且相比其他最新经典算法效果较优。
论文目录
文章来源
类型: 期刊论文
作者: 熊炜,贾锈闳,金靖熠,王娟,刘敏,曾春艳
关键词: 文档图像二值化,空洞卷积
来源: 光电子·激光 2019年12期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用
单位: 湖北工业大学电气与电子工程学院,美国南卡罗来纳大学计算机科学与工程系
基金: 国家留学基金项目(201808420418),国家自然科学基金项目(61571182,61601177),湖北省自然科学基金项目(2019CFB530)资助项目
分类号: TP391.41
DOI: 10.16136/j.joel.2019.12.0279
页码: 1331-1338
总页数: 8
文件大小: 2129K
下载量: 59