光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方法的可行性和稳健性。
类型: 期刊论文
作者: 杨恒杰,闫铮,邬宗玲,方定邦,段放
关键词: 机器视觉,特定文本抽取,光学字符识别,双向长短时记忆网络,条件随机场
来源: 激光与光电子学进展 2019年24期
年度: 2019
分类: 信息科技
专业: 计算机软件及计算机应用,自动化技术
单位: 华侨大学信息科学与工程学院
基金: 福建省自然科学基金(2017J01116),华侨大学中青年培育计划(Z16J0070),华侨大学科研基金(605-50Y18023),华侨大学研究生科研创新能力培育计划(17014082026)
分类号: TP391.41;TP183
页码: 188-195
总页数: 8
文件大小: 757K
下载量: 200
本文来源: https://www.lunwen90.cn/article/9bc49ffff895c4f5beed9166.html