全文摘要
本申请提供一种证件图像处理方法及装置,用于改善边缘检测在复杂背景下会失效导致很难截取出目标字段内容图像的问题。该方法包括:从获得的证件图像中提取多个可识别的第一字符和每个第一字符的可识别位置;从多个可识别的第一字符中筛选出多个与第二字符相同的字符,获得多个第三字符,第二字符为多个证件模板中的第一证件模板中的字段名称字符,证件模板包括:多个字段名称字符、多个字段名称位置和多个字段内容边框,字段名称位置为字段名称字符对应的位置;根据多个第三字符的可识别位置和多个第三字符的字段名称位置将证件图像转换为标准图像;从标准图像截取出多个与第一证件模板的字段内容边框对应的字段内容图像。
主设计要求
1.一种证件图像处理方法,其特征在于,包括:从获得的证件图像中提取多个可识别的第一字符和每个所述第一字符的可识别位置;从所述多个可识别的第一字符中筛选出多个与第二字符相同的字符,获得多个第三字符,所述第二字符为多个证件模板中的第一证件模板中的字段名称字符,所述证件模板包括:多个字段名称字符、多个字段名称位置和多个字段内容边框,所述字段名称位置为所述字段名称字符对应的位置,所述字段内容边框为所述字段名称字符对应的字段内容图像的外接边框;根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像;其中,所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像,包括:将所述多个第三字符的可识别位置和所述多个字段名称位置代入透视变换方程计算,获得透视变换矩阵;将所述证件图像的多个像素的坐标值乘以所述透视变换矩阵,获得所述标准图像;从所述标准图像截取出多个与所述第一证件模板的字段内容边框对应的所述字段内容图像。
设计方案
1.一种证件图像处理方法,其特征在于,包括:
从获得的证件图像中提取多个可识别的第一字符和每个所述第一字符的可识别位置;
从所述多个可识别的第一字符中筛选出多个与第二字符相同的字符,获得多个第三字符,所述第二字符为多个证件模板中的第一证件模板中的字段名称字符,所述证件模板包括:多个字段名称字符、多个字段名称位置和多个字段内容边框,所述字段名称位置为所述字段名称字符对应的位置,所述字段内容边框为所述字段名称字符对应的字段内容图像的外接边框;
根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像;其中,所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像,包括:将所述多个第三字符的可识别位置和所述多个字段名称位置代入透视变换方程计算,获得透视变换矩阵;将所述证件图像的多个像素的坐标值乘以所述透视变换矩阵,获得所述标准图像;
从所述标准图像截取出多个与所述第一证件模板的字段内容边框对应的所述字段内容图像。
2.根据权利要求1所述的方法,其特征在于,所述证件模板还包括多个与所述字段内容边框对应的字段名称,在所述从所述标准图像截取出多个与所述第一证件模板的字段内容边框对应的所述字段内容图像之后,还包括:
使用预先训练的卷积神经网络模型从多个所述字段内容图像中提取内容字符,并将内容字符连接成内容字符串,获得多个字段内容和所述字段内容对应的字段名称,所述字段名称为多个所述字段名称字符连接的字符串。
3.根据权利要求1所述的方法,其特征在于,在所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像之前,还包括:
判断所述第三字符的个数是否大于预设阈值;
若是,则执行所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像。
4.根据权利要求3所述的方法,其特征在于,在所述判断所述第三字符的个数是否大于预设阈值之后,还包括:
若所述第三字符的个数小于或等于预设阈值,则将所述多个证件模板中的第二证件模板中的字段名称字符确定为第四字符,并从所述多个可识别的第一字符中筛选出多个与所述第四字符相同的字符,获得多个第五字符,并根据所述多个第五字符的可识别位置和所述多个第五字符的字段名称位置将所述证件图像转换为标准图像,从所述标准图像截取出多个与所述第二证件模板的字段内容边框对应的所述字段内容图像。
5.根据权利要求1所述的方法,其特征在于,所述将所述多个第三字符的可识别位置和所述多个字段名称位置代入透视变换方程计算,获得透视变换矩阵,包括:
使用随机抽样一致算法将所述多个第三字符的可识别位置和所述多个字段名称位置代入设计说明书
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种证件图像处理方法及装置。
背景技术
在证件图像中,证件图像的可识别内容包括:字段名称和字段内容,字段名称是指证件图像中某字段的名称,字段内容是指证件图像中某字段的具体内容,例如:身份证上的字段名称为“性别”,字段内容则可以为“男”,字段内容也可以为“女”;再例如:身份证上的字段名称为“民族”,字段内容则可以为“汉”。证件字段内容图像则是指证件图像中某字段的具体内容的区域图像,以上面的例子说明,该区域图像是指包括“男”或“女”其中一个字符的区域图像,或者包括“汉”这个字符的区域图像。
目前,从证件图像中提取字段内容图像可以是基于传统图像处理的方法,该方法的步骤是:图像预处理、边缘检测、矫正图像、版面分析、行切分等。其中,版面分析和行切分主要依赖直方图统计和匹配算法,也就是统计像素点的分布,然后与预设分布数据进行对比,以判断是否属于目标字段内容图像;若是,则截取出目标字段内容图像。然而,这种方法中的边缘检测在复杂背景下会失效导致很难截取出目标字段内容图像。
发明内容
本申请的目的在于提供一种证件图像处理方法及装置,用于改善边缘检测在复杂背景下会失效导致很难截取出目标字段内容图像的问题。
本申请提供了一种证件图像处理方法,包括:从获得的证件图像中提取多个可识别的第一字符和每个所述第一字符的可识别位置;从所述多个可识别的第一字符中筛选出多个与第二字符相同的字符,获得多个第三字符,所述第二字符为多个证件模板中的第一证件模板中的字段名称字符,所述证件模板包括:多个字段名称字符、多个字段名称位置和多个字段内容边框,所述字段名称位置为所述字段名称字符对应的位置,所述字段内容边框为所述字段名称字符对应的字段内容图像的外接边框;根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像;从所述标准图像截取出多个与所述第一证件模板的字段内容边框对应的所述字段内容图像。在上述的实现过程中,通过获得证件模板的多个字段名称字符和证件图像中的多个可识别字符中的相同字符,获得相同字符对应的可识别位置和相同字符对应的字段名称位置,根据上述匹配的不同位置将证件图像转换为标准图像后,再从标准图像截取出字段内容图像,也就是说,根据相同字符确定出不同的位置有效地提高了图像矫正的正确率,从而有效地避免了在复杂背景下会失效导致很难截取出目标字段内容图像的问题。
可选地,所述证件模板还包括多个与所述字段内容边框对应的字段名称,在所述从所述标准图像截取出多个与所述第一证件模板的字段内容边框对应的所述字段内容图像之后,还包括:使用预先训练的卷积神经网络模型从多个所述字段内容图像中提取内容字符,并将内容字符连接成内容字符串,获得多个字段内容和所述字段内容对应的字段名称,所述字段名称为多个所述字段名称字符连接的字符串。在上述的实现过程中,从多个字段内容图像中提取多个字段内容和该字段内容对应的字段名称,有效地增加了字段内容和字段名称匹配率和正确率。
可选地,在所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像之前,还包括:判断所述第三字符的个数是否大于预设阈值;若是,则执行所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像。在上述的实现过程中,通过根据相同字符的可识别位置和该相同字符的字段名称位置将证件图像转换为标准图像,通过字符匹配从而获得匹配位置,以增加图像矫正的正确率。
可选地,在所述判断所述第三字符的个数是否大于预设阈值之后,还包括:若所述第三字符的个数小于或等于预设阈值,则将所述多个证件模板中的第二证件模板中的字段名称字符确定为第四字符,并从所述多个可识别的第一字符中筛选出多个与所述第四字符相同的字符,获得多个第五字符,并根据所述多个第五字符的可识别位置和所述多个第五字符的字段名称位置将所述证件图像转换为标准图像,从所述标准图像截取出多个与所述第二证件模板的字段内容边框对应的所述字段内容图像。在上述的实现过程中,通过根据相同字符的个数小于或等于预设阈值,则更换证件模板重新进行匹配操作,可以增加图像矫正的正确率。
可选地,所述根据所述多个第三字符的可识别位置和所述多个第三字符的字段名称位置将所述证件图像转换为标准图像,包括:将所述多个第三字符的可识别位置和所述多个字段名称位置代入透视变换方程计算,获得透视变换矩阵;将所述证件图像的多个像素的坐标值乘以所述透视变换矩阵,获得所述标准图像。在上述的实现过程中,通过将多个第三字符的可识别位置和多个字段名称位置代入透视变换方程计算,获得透视变换矩阵后,再根据证件图像和透视变换矩阵获得标准图像,可以增加图像矫正的正确率。
可选地,所述将所述多个第三字符的可识别位置和所述多个字段名称位置代入预设方程计算,获得透视变换矩阵,包括:使用随机抽样一致算法将所述多个第三字符的可识别位置和所述多个字段名称位置代入设计图
相关信息详情
申请码:申请号:CN201910868248.2
申请日:2019-09-16
公开号:CN110378328A
公开日:2019-10-25
国家:CN
国家/省市:84(南京)
授权编号:CN110378328B
授权时间:20191213
主分类号:G06K 9/20
专利分类号:G06K9/20;G06K9/34;G06K9/62;G06N3/04
范畴分类:40B;39C;
申请人:图谱未来(南京)人工智能研究院有限公司
第一申请人:图谱未来(南京)人工智能研究院有限公司
申请人地址:210000 江苏省南京市栖霞区马群街道紫东路2号C4幢
发明人:岑曙生
第一发明人:岑曙生
当前权利人:图谱未来(南京)人工智能研究院有限公司
代理人:安卫静
代理机构:11463
代理机构编号:北京华凯弘信专利代理事务所(特殊普通合伙)
优先权:关键词:当前状态:审核中
类型名称:外观设计