Print

基于循环神经网络的图像特定文本抽取方法

论文摘要

光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方法的可行性和稳健性。

论文目录

  • 1 引言
  • 2 基本原理
  •   2.1 序列标注
  •   2.2 长短时记忆网络单元
  •   2.3 双向长短时记忆网络
  •   2.4 条件随机场
  •   2.5 BLSTM-CRF模型
  •   2.6 场景文字检测与识别
  • 3 实验结果及分析
  •   3.1 实验数据集
  •   3.2 模型训练
  •   3.3 模型测试
  • 4 结论
  • 文章来源

    类型: 期刊论文

    作者: 杨恒杰,闫铮,邬宗玲,方定邦,段放

    关键词: 机器视觉,特定文本抽取,光学字符识别,双向长短时记忆网络,条件随机场

    来源: 激光与光电子学进展 2019年24期

    年度: 2019

    分类: 信息科技

    专业: 计算机软件及计算机应用,自动化技术

    单位: 华侨大学信息科学与工程学院

    基金: 福建省自然科学基金(2017J01116),华侨大学中青年培育计划(Z16J0070),华侨大学科研基金(605-50Y18023),华侨大学研究生科研创新能力培育计划(17014082026)

    分类号: TP391.41;TP183

    页码: 188-195

    总页数: 8

    文件大小: 757K

    下载量: 200

    相关论文文献

    本文来源: https://www.lunwen90.cn/article/9bc49ffff895c4f5beed9166.html