全文摘要
本发明提供了一种基于知识图谱的人工智能辅助行政审批方法,建立审批规则库;基于审批规则库,构建审批本体;抽取审批材料中的审批知识;基于审批本体,从抽取的审批知识中建立审批本体与知识之间的关系,构建审批知识图谱;基于构建的审批知识图谱,根据审批材料的不同审批事项,利用知识图谱的查询功能,进行相关审批知识的获取,并进行自动审批;输出审批结果。同时提供了一种基于知识图谱的人工智能辅助行政审批系统及终端。本发明为行政审批高效化、智能化提供技术支撑,辅助窗口工作人员完成事项审核,加快工作人员审核速度,提高审核准确率与工作效率。
主设计要求
1.一种基于知识图谱的人工智能辅助行政审批方法,其特征在于,包括:提取审批规则,运用命名实体抽取方式和关系抽取方式分别对审批规则的命名实体以及实体与实体之间的审批逻辑关系进行抽取,得到审批规则库;所述关系抽取方式是指对审批规则进行逻辑筛选并整理审批事项的审批逻辑;基于所述审批规则库构建审批本体;抽取审批材料中的审批知识,基于所述审批本体,从抽取的所述审批知识中建立审批本体与知识之间的关系,构建审批知识图谱;基于构建的所述审批知识图谱,根据审批材料的不同审批事项,利用所述审批知识图谱的查询功能,进行审批知识的获取,并进行自动审批;所述审批规则的命名实体为构建审批本体提供术语,包括如下一项或多项:1)申请公司相关实体,包括:申请名称、名称预先核准文号、住所、生产经营地、邮政编码、公司类型、经营范围以及营业期限中的任意一项或任意多项;2)人员相关实体,包括法定代表人、监理、董事、经理、财务负责人、股东发起人以及联络员中的任意一项或任意多项;3)人员信息相关属性实体,包括姓名、固定电话、移动电话、电子邮箱、身份证类型以及身份证号码中的任意一项或任意多项;所述审批逻辑关系包括如下一项或多项:1)一致性检查,审查申请材料中相关信息的一致性;2)完备性检查,审查申请材料是否满足完备性要求;3)矛盾性审查,审查申请材料是否违反相应的法律条例;4)有效性检查,审查申请材料中信息是否有效;所述构建审批本体,采用七步法进行,包括:1)本体需求分析:利用领域内通用的知识概括,为审批材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储;2)参考及复用现有本体:确认没有能够参考及复用的现有本体;3)罗列重要概念及术语:参考审批材料、审批规则、法律法规、规范标准和\/或先验知识,得到重要概念及术语作为审批术语,以审批术语作为本体概念,对存在重复和交叉的本体概念进行剔除,从而进行本体概念的确定,将最终确定的本体概念作为本体类的来源;4)建立本体框架:通过本体概念之间的关系,确定本体的框架,所述本体的框架包括:审批主体、审批材料、审批要点以及审批依据;其中,所述审批主体为需要审查的对象;所述审批要点为审批主体的需要审批的属性;所述审批材料为需要审批的材料;所述审批依据为审批结果判断的依据;5)整理本体概念的层次结构:所述审批主体、审批材料、审批要点以及审批依据分别构成一个父类,每一个父类包含若干个子类,层层类推;6)添加本体概念之间的关系和限制:所述本体概念之间的关系包括对象属性和数据属性,其中对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值;对本体概念之间的关系进行限制,得到如下属性关系:对象属性,包括信息来源属性、属于属性和依据属性,其中:所述信息来源属性对应的定义域和值域分别为审批主体和审批材料;所述属于属性对应的定义域和值域分别为审批要点和审批主体;所述依据属性对应的定义域和值域分别为审批要点和审批依据;数据属性,包括值属性、平均置信度属性和最小置信度属性,其中:所述值属性对应的定义域为审批主体、审批要点、审批材料和\/或审批依据,对应的值域为数字、文字和字符串;所述平均置信度属性对应的定义域和值域分别为审批要点和数字;所述最小置信度属性对应的定义域和值域分别为审批要点和数字;7)通过以上操作构建完成本体实例,对本体实例进行检验和评价:通过对构建完成的本体实例进行初步的检验和评价,经过反复修改直至达到设定要求,最终形成审批本体,其中,所述初步的检验和评价是按照设定要求进行,设定要求包括:所述构建完成的本体应满足审批要求,所述本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;所述构建完成的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性;不满足所述设定要求中的任何一项要求,都要对所述构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到所述设定要求,最终形成审批本体;所述构建审批知识图谱,包括:对于每一个审批本体中的命名实体,将在审批知识中出现的该命名实体单独创建实例,作为审批本体的实例化,所述审批本体的实例化与审批知识之间的连接关系作为信息来源,形成实例化后的审批知识图谱;实例化后的审批知识图谱采用RDF进行存储;实例化过程采用填充知识图谱中的三元组方式,通过create_individual函数实现。
设计方案
1.一种基于知识图谱的人工智能辅助行政审批方法,其特征在于,包括:
提取审批规则,运用命名实体抽取方式和关系抽取方式分别对审批规则的命名实体以及实体与实体之间的审批逻辑关系进行抽取,得到审批规则库;所述关系抽取方式是指对审批规则进行逻辑筛选并整理审批事项的审批逻辑;
基于所述审批规则库构建审批本体;
抽取审批材料中的审批知识,基于所述审批本体,从抽取的所述审批知识中建立审批本体与知识之间的关系,构建审批知识图谱;
基于构建的所述审批知识图谱,根据审批材料的不同审批事项,利用所述审批知识图谱的查询功能,进行审批知识的获取,并进行自动审批;
所述审批规则的命名实体为构建审批本体提供术语,包括如下一项或多项:
1) 申请公司相关实体,包括:申请名称、名称预先核准文号、住所、生产经营地、邮政编码、公司类型、经营范围以及营业期限中的任意一项或任意多项;
2) 人员相关实体,包括法定代表人、监理、董事、经理、财务负责人、股东发起人以及联络员中的任意一项或任意多项;
3) 人员信息相关属性实体,包括姓名、固定电话、移动电话、电子邮箱、身份证类型以及身份证号码中的任意一项或任意多项;
所述审批逻辑关系包括如下一项或多项:
1) 一致性检查,审查申请材料中相关信息的一致性;
2) 完备性检查,审查申请材料是否满足完备性要求;
3) 矛盾性审查,审查申请材料是否违反相应的法律条例;
4) 有效性检查,审查申请材料中信息是否有效;
所述构建审批本体,采用七步法进行,包括:
1)本体需求分析:利用领域内通用的知识概括,为审批材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储;
2)参考及复用现有本体:确认没有能够参考及复用的现有本体;
3)罗列重要概念及术语:参考审批材料、审批规则、法律法规、规范标准和\/或先验知识,得到重要概念及术语作为审批术语,以审批术语作为本体概念,对存在重复和交叉的本体概念进行剔除,从而进行本体概念的确定,将最终确定的本体概念作为本体类的来源;
4)建立本体框架:通过本体概念之间的关系,确定本体的框架,所述本体的框架包括:审批主体、审批材料、审批要点以及审批依据;其中,所述审批主体为需要审查的对象;所述审批要点为审批主体的需要审批的属性;所述审批材料为需要审批的材料;所述审批依据为审批结果判断的依据;
5)整理本体概念的层次结构:所述审批主体、审批材料、审批要点以及审批依据分别构成一个父类,每一个父类包含若干个子类,层层类推;
6)添加本体概念之间的关系和限制:所述本体概念之间的关系包括对象属性和数据属性,其中对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值;对本体概念之间的关系进行限制,得到如下属性关系:
对象属性,包括信息来源属性、属于属性和依据属性,其中:
所述信息来源属性对应的定义域和值域分别为审批主体和审批材料;
所述属于属性对应的定义域和值域分别为审批要点和审批主体;
所述依据属性对应的定义域和值域分别为审批要点和审批依据;
数据属性,包括值属性、平均置信度属性和最小置信度属性,其中:
所述值属性对应的定义域为审批主体、审批要点、审批材料和\/或审批依据,对应的值域为数字、文字和字符串;
所述平均置信度属性对应的定义域和值域分别为审批要点和数字;
所述最小置信度属性对应的定义域和值域分别为审批要点和数字;
7)通过以上操作构建完成本体实例,对本体实例进行检验和评价:通过对构建完成的本体实例进行初步的检验和评价,经过反复修改直至达到设定要求,最终形成审批本体,其中,所述初步的检验和评价是按照设定要求进行,设定要求包括:
所述构建完成的本体应满足审批要求,所述本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;
所述构建完成的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性;
不满足所述设定要求中的任何一项要求,都要对所述构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到所述设定要求,最终形成审批本体;
所述构建审批知识图谱,包括:
对于每一个审批本体中的命名实体,将在审批知识中出现的该命名实体单独创建实例,作为审批本体的实例化,所述审批本体的实例化与审批知识之间的连接关系作为信息来源,形成实例化后的审批知识图谱;实例化后的审批知识图谱采用RDF进行存储;
实例化过程采用填充知识图谱中的三元组方式,通过create_individual函数实现。
2.根据权利要求1所述的基于知识图谱的人工智能辅助行政审批方法,其特征在于,所述抽取审批材料中的审批知识,包括:
通过OCR技术对审批材料进行文字识别,首先进行块识别,区分出文字区域块,再将文字区域块分别转化为统一的JSON格式信息;
在JSON格式信息的基础上,采用正则表达式对信息进行审批知识提取。
3.根据权利要求1所述的基于知识图谱的人工智能辅助行政审批方法,其特征在于,所述进行自动审批,其中:将审批规则与相应的法律法规进行关联,采用SPARQL语言,获取知识图谱中的相关审批知识后,根据知识图谱中的审批规则,进行自动审批。
4.根据权利要求1至3中任一项所述的基于知识图谱的人工智能辅助行政审批方法,其特征在于,还包括:输出审批结果;所述审批结果包括通过、不通过以及人工审核中任一种。
5.一种用于实现权利要求1-4任一项所述方法的基于知识图谱的人工智能辅助行政审批系统,其特征在于,包括:
审批规则库抽取模块:提取审批规则,运用命名实体抽取方式和关系抽取方式分别对审批规则的命名实体以及实体与实体之间的审批逻辑关系进行抽取,得到审批规则库;
审批本体搭建模块:基于所述审批规则库抽取模块抽取的审批规则库构建审批本体,包括术语定义单元、术语属性定义单元以及术语之间基本关系定义单元;
审批知识提取模块:提取审批材料中的属性概念信息及其所对应的属性信息作为审批知识;
基于本体的审批知识图谱构建模块:基于所述审批本体搭建模块中搭建的审批本体,利用知识图谱的实例化方式,从审批材料中抽取的审批知识中建立知识之间的关系,构建审批知识图谱的实例化,并将实例化后的知识图谱作为审批知识图谱进行存储;
基于知识图谱高效查询的审批模块:利用所述基于本体的审批知识图谱构建模块构建的审批知识图谱的查询功能,根据审批材料的不同审批事项,从审批知识图谱中提取相应的审批点信息,根据审批规则进行审批,得到审批结果。
6.根据权利要求5所述的基于知识图谱的人工智能辅助行政审批系统,其特征在于,所述术语定义单元用于定义法律概念、审核主体和\/或审批材料;
所述术语属性定义单元用于描述术语自身具有的值;
所述术语之间基本关系定义单元用于定义术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系和\/或术语的属性关系。
7.一种基于知识图谱的人工智能辅助行政审批终端,包括存储器、处理器及存储在存储器上并能够在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时能够用于执行权利要求1-4任一项所述的方法。
设计说明书
技术领域
本发明涉及人工智能技术领域,更为具体地,涉及一种基于知识图谱的人工智能辅助行政审批方法、系统及终端。
背景技术
为落实国务院对政府公共服务“简政放权”的改革目标,政府在不断推进各种简便与高效的行政审批方式,其中以“互联网+政务”服务为主推形式。但随着审批业务的不断扩大,窗口行政事项的办理压力大幅增加,原因主要如下:
1、办件量大,工作人员业务负荷重。审批业务受理量大,工作人员工作强度大幅增加,此外行政审批种类繁多、标准化程度低,办事人员因资料不齐/不符合标准而多次面柜,审核人员重复审核资料,存在大量重复性冗余劳动,降低工作效率,增加沟通成本;
2、审批标准化程度不高,种类繁多。行政审批的标准化差,审批种类繁多,窗口工作人员与当事人对“一次性告知”的办事体验易形成不满情绪而使窗口工作人员面临不必要的投诉,从而损伤了办事人与工作人员之间的信任关系。行政审批事项作为市场准入、国家经济监管的重要环节,在审批事项办理中,材料提交的种类、审批标准不一,不同的工作人员有不同的要求标准。办事对象大多数情况下属于初次办理,对行政审批的很多环节、材料、操作步骤都不够熟悉,材料准备不够充分导致多次面柜,加重工作人员的任务负荷,增加办事人员的时间投入;
3、审批质量与效率受人的自然特性制约明显。当前行政审批主要由人工来完成各类工作,存在较大的主观性,且收到人的天然特性的制约。例如人的知识水平、业务素质、智力程度会明显影响审批事项的分析、判断结果,因而可能造成不必要的纠纷。此外,人的体力、情绪等天然特性也会在审批过程中影响到审批事项的质量和效率;
4、审批过程仍存在大量重复性冗余工作,拖累效率提升。审批流程中存在大量纸质存档文档,存储、管理、查询不便,造成审核期间无法查询历史审核记录,降低工作效率,影响审批质量。审批流程的重复、阻塞现象普遍存在于审批部门。常见的情况有:审批流程复杂、手续繁琐、周期漫长;一些涉及多个部门的审批事项,数据、资料不共享,审批权限、标准不一,造成申报人无所适从,重复乃至反复提供同一材料;造成各地审批大厅存在审批事项承诺件比例大、即办件比例小的问题,在受理审批事项后在部门内部积淀,降低了审批效率。
与此同时,人工智能技术和大数据分析技术的发展为行政审批的推进带来了新的思路。一方面,采用人工智能技术进行辅助审批,可以在一定程度上帮助审批人员实现判定准则的标准化,并且可以较好的克服人的天然因素制约。另一方面,行政审批类别多样,但存在一定的规律性,对应办事人员审批事项,需提供材料及咨询事宜等规则明确的工作完全可以用机器替代人工,解放一部分工作人员投入到繁杂的内容审查工作中。行政审批的繁琐是由于法律行政法规对行政审批事项形式和内容要求严格,该部分工作可以通过机器知识储备的智能解答,利用技术解构繁琐步骤,给当事人予以详细释明,推进行政审批事项的公开、透明。
知识图谱作为大数据时代下新的知识组织与检索技术,用于以符号形式描述物理世界中的概念及其相互关系。其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属值-值对,实体间通过关系相互联结,构成网状的知识结构。经过人机交互技术,获取大量的、计算机可读的知识,实现知识图谱的构建与完善,运用知识图谱的强大信息检索功能进行高效查询。
人工智能技术中的图像智能识别技术用以对图像进行对象识别,以识别各种不同模式的目标和对象。对于表格与表格之间相互嵌套、存在水印等问题,现有方法下切分准确度不高,抗噪能力弱。自然语言处理技术是对文本数据进行处理从而使计算机可以理解的一种技术。机器学习用以从数据中自动发现模式。
但是,如何将人工智能技术真正融合于行政审批工作中,仍是本领域亟待解决的问题。
经过检索发现:申请号为201510487211.7的中国专利申请《一种基于人工智能平台辅助业务办理行政审批的方法》,公开了一种基于人工智能平台辅助业务办理行政审批的方法,行政业务系统通过人工智能平台与请求人交互,人工智能平台确认请求人的身份信息及待办事项后,根据预设的办理条件,提示请求人提供与办理条件相对应的信息材料,当信息材料为实物时,则采集实物的影像数据;当信息材料中的一部分在办理当前的待办事项之前已进行采集并证实,则不再提示请求人再次提供;信息材料被审批合格后,请求人前往办事窗口,将实物与先前选的影像数据进行对比,核实信息材料的真伪,如果为真,则待办事项继续进行至完成。最大限度减少纸质存档,大大提高信息检索的速度、管理的有序性、服务的快捷性;基于大数据分析可提供各类统计数据和高质量的决策支持。该方法通过人工智能平台登录并访问相关部门的行政业务系统,获取请求人的资料,并对相关信息材料的图像数据进行采集,减少纸质存档,大大提高信息检索的速度。该方法的人工智能平台,设置有虚拟办事员,基于大数据分析和知识库,与请求人开展高度拟人的对话式交流,实现辅助业务办理。但该方法的人工智能平台侧重于辅助业务办理,运用的效果和效益受限于各部门的行政业务系统。同时,人工智能平台下设置的知识库,是基于大数据分析根据请求人的信息推测相关度最高的内容,缺乏一定的语义关联和逻辑性,没有对知识库中的数据进行进一步数据分析与挖掘,并且未涉及行政审批环节。
目前没有发现同本发明类似技术的说明或报道,也尚未收集到国内外类似的资料。
发明内容
针对现有行政审批中存在的上述不足,本发明的目的是提供一种基于知识图谱的人工智能辅助行政审批方法、系统及终端,充分发挥互联网的优势,借助先进的计算机与人工智能技术,为行政审批高效化、智能化提供技术支撑,辅助窗口工作人员完成事项审核,加快工作人员审核速度,提高审核准确率与工作效率。
本发明是通过以下技术方案实现的。
根据本发明的一个方面,提供了一种基于知识图谱的人工智能辅助行政审批方法,包括:
提取审批规则,运用命名实体抽取方式和关系抽取方式分别对审批规则的命名实体以及实体与实体之间的审批逻辑关系进行抽取,得到审批规则库;
基于审批规则库,构建审批本体;
抽取审批材料中的审批知识;基于审批本体,从抽取的审批知识中建立审批本体与知识之间的关系,构建审批知识图谱;
基于构建的审批知识图谱,根据审批材料的不同审批事项,利用知识图谱的查询功能,进行相关审批知识的获取,并进行自动审批。
优选地,所述审批规则的命名实体为构建审批本体提供相关术语,包括如下一项或多项:
- 申请公司相关实体,包括:申请名称、名称预先核准文号、住所、生产经营地、邮政编码、公司类型、经营范围以及营业期限中的任意一项或任意多项;
- 人员相关实体,包括法定代表人、监理、董事、经理、财务负责人、股东发起人以及联络员中的任意一项或任意多项;
- 人员信息相关属性实体,包括姓名、固定电话、移动电话、电子邮箱、身份证类型以及身份证号码中的任意一项或任意多项;
所述审批逻辑关系包括如下任意一项或任意多项:
- 一致性检查,审查申请材料中相关信息的一致性;
- 完备性检查,审查递交材料是否满足完备性要求;
- 矛盾性审查,审查申请材料是否违反相应的法律条例;
- 有效性检查,审查申请材料中信息是否有效;
优选地,采用七步法构建审批本体,包括如下步骤:
本体需求分析:利用领域内通用的知识概括,为审批材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储;
参考及复用现有本体:没有能够参考及复用的现有本体;
罗列重要概念及术语:参考审批材料、审批规则、法律法规,规范标准和\/或先验知识,得到重要概念及术语作为审批术语,以审批术语作为本体概念,对存在重复和交叉的本体概念进行剔除,从而进行本体概念的确定,将最终确定的本体概念作为本体类的来源;
建立本体框架:通过本体概念之间的关系,确定本体的框架,所述本体的框架包括:审批主体、审批材料、审批要点以及审批依据;其中,所述审批主体为需要审查的对象;所述审批要点为审批主体的需要审批的属性;所述审批材料为需要审批的材料;所述审批依据为审批结果判断的依据;
整理本体概念的层次结构:所述审批主体、审批材料、审批要点以及审批依据分别构成一个父类,每一个父类包含若干个子类,每一个子类又可以包含若干个下一层子类,层层类推;
添加本体概念之间的关系和限制:所述本体概念之间的关系包括对象属性和数据属性,其中对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值;对本体概念之间的关系进行限制,得到如下属性关系:
通过以上步骤,构建完成本体,对本体进行检验和评价:通过对构建完成的本体实例进行初步的检验和评价,经过反复修改直至达到设定要求,最终形成审批本体。其中,所述初步的检验和评价是按照设定要求进行,设定要求包括:
所述构建完成的本体应满足审批要求,所述本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;
所述构建完成的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性。
不满足所述设定要求中的任何一项要求,都要对所述构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到所述设定要求,最终形成审批本体。
上述初步的检验和评价的过程可以通过人工或计算机来实现。
优选地,抽取审批材料中的审批知识,包括:
通过OCR技术对审批材料进行文字识别,首先进行块识别,区分出文字区域块,再将文字区域块分别转化为统一的JSON格式信息;
在JSON格式信息的基础上,采用正则表达式对信息进行审批知识提取。
优选地,构建审批知识图谱,包括:
对于每一个审批本体中的命名实体,将在审批知识中出现的该命名实体单独创建实例,作为审批本体的实例化,所述审批本体的实例化与审批知识之间的连接关系为信息来源,形成实例化后的审批知识图谱;实例化后的审批知识图谱采用RDF进行存储;
实例化过程采用填充知识图谱中的三元组方式,通过create_individual函数实现。
优选地,在进行自动审批的步骤中,将审批规则与相应的法律法规进行关联,采用SPARQL语言,获取知识图谱中的相关审批知识后,根据知识图谱中的审批规则,进行自动审批。
优选地,还包括:输出审批结果。所述审批结果包括通过、不通过以及人工审核三种。
根据本发明的第二个方面,提供了一种基于知识图谱的人工智能辅助行政审批系统,包括:
审批规则库抽取模块:提取审批规则和法律法规,运用命名实体抽取方式和关系抽取方式分别对审批规则的基本实体以及实体与实体之间的关系进行抽取,得到审批规则库;
审批本体搭建模块:基于所述审批规则库抽取模块抽取的审批规则库构建审批本体,包括术语定义单元、术语属性定义单元以及术语之间基本关系定义单元;
审批知识提取模块:提取审批材料中的属性概念信息及其所对应的属性信息作为审批知识;
基于本体的审批知识图谱构建模块:基于审批本体搭建模块中搭建的审批本体,利用知识图谱的实例化方式,从审批材料中抽取的审批知识中建立知识之间的关系,构建审批知识图谱的实例化,并将实例化后的知识图谱作为审批知识图谱进行存储;
基于知识图谱高效查询的审批模块:利用基于本体的审批知识图谱构建模块构建的审批知识图谱的查询功能,根据审批材料的不同审批事项,从审批知识图谱中提取相应的审批点信息,根据审批规则进行审批,得到审批结果。
优选地,所述审批知识图谱以RDF格式进行存储。
优选地,所述术语定义单元用于定义法律概念、审核主体和\/或审批材料;所述术语属性定义单元用于描述术语自身具有的值;所述术语之间基本关系定义单元用于定义术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系和\/或术语的属性关系。
根据本发明的第三个方面,提供了一种基于知识图谱的人工智能辅助行政审批终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时可用于执行上述任一所述的基于知识图谱的人工智能辅助行政审批方法。
根据本发明的第四个方面,提供了另一种终端,包括存储器、处理器及存储在存储器上并可通过处理器运行上述任一所述的系统。
优选地,所述的系统可用于执行上述任一所述的方法。
与现有技术相比,本发明具有如下有益效果:
本发明提供了一种基于知识图谱的人工智能辅助行政审批方法、系统及终端,运用人工智能技术,实现审批判断准则的标准化,实现部分审批材料的智能审批,以及复杂审批点提醒人工注意,有效解放人力资源,降低人力成本,提高审批效率和质量。
进一步的,本发明所提供的基于知识图谱的人工智能辅助行政审批方法、系统及终端,可以在审批过程中将审批材料、审批结果、审批记录统一存储管理,运用知识图谱强大的信息检索功能,辅助审批人员开展各类审批工作,提高审批速度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一实施例中系统的结构示意图;
图2为本发明一实施例中行政审批方法中七步法构建审批本体流程图;
图3为本发明一实施例中所提供的行政审批方法中进行自动审批的过程示意图;
图4为本发明一实施例中所提供的行政审批方法中采用七步法构建的审批本体框架结构示意图;
图5为本发明一实施例中所提供的行政审批方法流程图;
图6为本发明一实施例中所提供的行政审批方法中审批本体具有的主要的属性关系示意图;
图7为本发明一实施例中所提供的行政审批方法中审核本体框架在protégé中搭建后的部分结构示意图;
图8为本发明一实施例中所提供的行政审批方法中建立审批知识图谱时采用的实例化方法示意图;
图9为本发明一实施例中新设公司申请材料中的一份公司登记(备案)申请书图表。
具体实施方式
下面对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
本发明实施例提供一种基于知识图谱的人工智能辅助行政审批系统,包括五个模块,分别为:审批规则库抽取模块,审批本体搭建模块,审批知识提取模块,基于本体的审批知识图谱构建模块,基于知识图谱高效查询的审批模块。其中:
审批规则库抽取模块:提取审批规则和法律法规,运用命名实体抽取方式和关系抽取方式分别对审批规则的基本实体以及实体与实体之间的关系进行抽取。审批规则是智能审批的依据,审批规则库的建立可以为审批本体的构建提供领域专业术语,也可以使审批本体更具有针对性,即使得基于该审批本体的审批知识图谱做到“检查什么就获取什么信息”。这样不仅提高了审批的效率,节省了信息存储的空间,同时因为本体自身的易扩展的性质使之更容易被维护。所述命名实体抽取方式是指整理审批规则的命名实体,所述关系抽取方式是指对审批规则进行逻辑筛选并整理审批事项的审批逻辑。将得到的审批规则加入数据库并进行整理和管理,建立审批规则库。
审批本体搭建模块:搭建审批本体,包括术语定义单元、术语属性定义单元以及术语之间基本关系定义单元;其中,术语定义单元用于定义法律概念、审核主体和\/或审批材料;术语属性定义单元用于描述术语自身具有的值;术语之间基本关系定义单元用于定义术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系和\/或术语的属性关系。知识图谱的构建离不开领域本体(即审批本体)的框架搭建。领域本体(Domain Ontology)是专业性的本体,描述的是特定领域中的概念和概念之间的关系,提供了某个专业学科领域中概念的词表以及概念间的关系,或在该领域里占主导地位的理论。审批本体的搭建主要包括术语的定义、术语属性的定义和术语之间的基本关系的定义。术语是领域中的重要概念,在人工智能辅助行政审批项目中,术语应基本涵盖法律概念、审核主体、审批材料等方面。术语的属性主要描述术语自身具有的各方面的性质,例如审查主体的值、置信度等。术语之间的基本关系可以理解为领域本体框架的基本结构,这些关系多种多样,包括术语之间部分与整体的关系、术语之间的继承关系、术语的实例与术语之间的关系、术语的属性关系等。
审批知识提取模块:提取审批材料中的属性概念信息及其所对应的属性信息作为审批知识。审批材料是审批所需知识的载体,但是审批材料可能涉及多种多样的格式,如文本、表格、图片等等,要提高审批效率,首先要对审批知识进行结构化存储。结构化存储审批知识的第一步是提取审批知识,即审批材料中的属性概念信息及其所对应的属性信息。首先通过OCR技术对行政审批中以图片、表格等形式递交的审批材料进行文字识别,转化为JSON格式。之后由于样式比较统一,对于识别后的审批信息,可以利用正则表达式进行提取。
基于本体的审批知识图谱构建模块:基于审批本体搭建模块搭建的领域本体,从审批知识中提取所需知识,建立知识之间的关系,完成审批知识图谱的构建,并对审批知识图谱进行存储。基于本体从审批材料中“有目的”地抽取知识,建立知识之间的关系,完成审批知识图谱的构建。
基于知识图谱高效查询的审批模块:通过图查询方式在基于本体的审批知识图谱构建模块构建的审批知识图谱中进行查询图查找,并根据查找得到的信息进行匹配审批,得到审批结果。由于知识图谱中的数据在逻辑上本身就是一种图结构,因此本发明通过图查询技术来完成相应查询图的查找。根据查找得到的信息进行匹配审批,得到审批结果。
在一具体应用实施例中,基于知识图谱的人工智能辅助行政审批系统结构如图1所示,包括五个模块:审批规则库抽取模块11,审批本体搭建模块12,审批知识提取模块13,基于本体的审批知识图谱构建模块14和基于知识图谱高效查询的审批模块15。其中:审批规则库抽取模块11,用以提取与审批相关的审批规则和法律法规,运用命名实体抽取技术和关系抽取技术分别对审批相关规则的基本实体以及实体和实体之间的关系进行抽取。审批本体搭建模块12,用以根据审批相关内容,搭建审批本体,通过对行政审批涉及的相关术语、术语的属性以及术语之间的关系等概念进行人工梳理,采用七步法,基于protégé平台搭建审批本体,如图4所示,图中实线表示父类和子类之间的关系,虚线表示对象属性。审批知识提取模块13,审批知识的提取是审批知识结构化存储的第一步,由于行政审批中审批材料的样式比较统一,对于通过OCR技术文字识别后的审批材料,可以采用正则表达式进行提取。基于本体的审批知识图谱构建模块14,用以基于审批本体搭建模块12中搭建的审批本体,利用知识图谱的实例化技术,从审批材料中“有目的”地抽取知识,建立知识之间的关系,完成审批知识图谱的实例化,并将实例化后的知识图谱采用RDF(ResourceDescription Framework,资源描述框架)进行存储。基于知识图谱高效查询的审批模块15,用以利用基于本体的审批知识图谱构建模块13中构建的审批知识图谱的强大、高效的查询能力,根据审批材料的不同审批事项,采用SPARQL语言从知识图谱提取相应的审批点信息,根据审批规则进行自动审核,得到审批结果。
在本发明实施例还提供了一种基于知识图谱的人工智能辅助行政审批方法,该方法可以参照以下步骤进行:
S1,审批规则库的抽取
审批规则库的抽取主要包括命名实体的抽取和逻辑关系的抽取。命名实体抽取主要针对审批规则中的有固定含义的名词进行提取,这类名词可以作为审批本体中的审批主体或审批要点。逻辑关系提取则主要是梳理审批规则之间的逻辑结构,梳理其条件判断、因果关系,以及相互引用及嵌套关系等。
S2,审批本体的搭建
采用七步法,基于protégé平台搭建审批本体。七步法是美国斯坦福大学医学院开发的本体建模方法,较之之前的本体构建方法,其应用范围更广,在音乐领域、地理领域、疾病领域等方面都有应用和研究,且符合人类的思维逻辑,操作简单,具有较强的推理能力以及很好的扩展特性。通过利用七步法创建本体,包括如下子步骤:
(1)本体需求分析
审批本体的建立旨在能够在建立少而全的概念结构下,利用领域内通用的知识概括,同时为审批相关文件和材料的自然语言处理提供领域词典,将审批相关知识进行抽取并进行结构化的存储。
(2)参考及复用现有本体
目前,国内外研究中关于审批本体构建尚处于空白,因此在审批本体构建中,想要复用现有本体几乎不可行。
(3)罗列重要概念及术语
参考审批材料、法律法规,规范标准以及专家的经验积累(先验知识),以审批相关术语作为本体中的概念,对存在重复和交叉的概念进行剔除,从而进行概念的确定,将最终确定的概念作为本体类的来源。
(4)建立本体框架
通过本体概念之间的关系,确定本体的框架,包括:审批主体、审批材料、审批要点以及审批依据。
表1 本体概念及涵义
(5)整理本体概念的层次结构,创建本体实例
通过本体概念之间的关系,可以确定本体的框架。首先,在该本体项目中,先创建审批主体、审批材料、审批要点、审批依据这几个父类,每个父类也包含一定的子类,这样层层类推。
(6)添加本体概念之间的关系和限制
在构建本体时,主要的关系分为对象属性(Object Property)和数据属性(DataProperty)两个方面。对象属性是指类与类或实例与实例之间的关系,数据属性是指实例的值。通过对审批相关文件的分析,该审批本体具有以下六个主要的属性关系。
表2 本体中的关系
(7)本体的检验和评价
通过对构建完的本体按照下述设定要求进行初步的检验和评价:
构建完的本体应满足审批要求,在本体框架中定义的术语、概念、属性应覆盖审批过程所涉及审批主体、审批要点、审批依据、审批材料;
构建完的本体应符合本体的构建准则,满足术语、概念定义清晰,满足关系定义完整,满足本体的前后一致性。
不满足设定要求中的任何一项要求,都要对构建完成的本体中定义的术语、概念、属性进一步明确、补充、修改,直至达到设定要求,最终形成审批本体。
Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,即本体开发工具。本实施例基于protégé平台,采用上述七步法,搭建了审批本体框架。
S3,审批知识的提取
审批知识的提取是审批知识结构化存储的第一步,由于行政审批中审批材料的样式比较统一,在通过OCR技术对图片、表格等审批材料进行文字识别转化为JSON格式信息后,可以采用正则表达式进行提取。正则表达式即是利用设定的表达式对文本相应约束下的知识进行提取的工具。首先,应对审批材料按照知识表达方式进行分类;其次,对不同的知识表达方式确定正则表达式;最后,对各类审批材料依据相应的正则表达式进行抽取。
S4,基于本体,构建审批知识图谱
知识图谱是实现审批知识结构化存储的重要方向,基于本体的审批知识图谱构建主要依赖于知识图谱的实例化技术。在读取项目信息之后,可以根据知识图谱框架进行实例化。对于每份材料中出现的每个审批实体单独创建实例,这个实例是审批实体的实例化,与审批材料的连接关系是信息来源。实例化之后的知识图谱主要利用图数据库对其进行存储,采用RDF(Resource Description Framework,资源描述框架)来制定术语之间以及术语和其属性值之间的关系。
S5,基于审批知识图谱,进行相关审批指示的高效查询,并进行自动审批
审批过程从审批要点出发,每个审批要点与不同的实体相关联,需要参与审批的实体根据其实例化类别和信息来源确定。根据审批规则进行审核,会得到“通过”“不通过”“人工审核”三种审核结果,审批规则与相关的法律法规进行关联。本专利采用SPARQL语言,进行知识的获取与管理,对获取的知识进行审批。SPARQL是Simple Protocol and RDFQuery Language的缩写,是由W3C为RDF数据开发的一种查询语言和数据获取协议,是被知识图谱广泛支持的查询语言。
S6, 输出审批结果。
审批结果包括:通过、不通过以及人工审核三种结果。
在一具体应用实施例中,基于知识图谱的人工智能辅助行政审批方法工作流程图如图3和图5所示。
下面本实施举例以新设公司申请材料审批为例,进行基于知识图谱的人工智能辅助行政审批:
步骤S21:建立审批规则库。首先,梳理审批规则的命名实体;其次,对审批规则进行逻辑筛选,梳理审批事项的审批逻辑;最后,对于梳理得到的审批规则,加入数据库进行整理和管理。
命名实体包括:(1)申请公司相关实体,如申请名称,名称预先核准文号,住所,生产经营地,邮政编码,公司类型,经营范围,营业期限等等;(2)人员相关实体,如法定代表人,监理,董事,经理,财务负责人,股东发起人,联络员等;(3)人员信息相关属性实体,如姓名,固定电话,移动电话,电子邮箱,身份证类型,身份证号码,等等;以及其他相关实体。这些实体可以为后续建立审批本体提供相关领域术语。
审批逻辑包括:(1)一致性检查,主要审查申请材料中相关信息的一致性,例如《公司备案登记申请书》中的法定代表人与《法定代表人信息》的一致性;(2)完备性检查,主要审查递交材料是否满足完备性要求,例如股东签名是否齐全、申请材料中的信息是否完整,等等;(3)矛盾性审查,主要审查申请材料是否违反相应的法律条例,比如《公司法》第51条规定“有限责任公司设监事会,其成员不得少于三人”,就需要先审查其是否为有限责任公司,若为有限责任公司则需审查其是否设有监事会且成员不少于三人;(4)有效性检查,主要审查申请材料中信息是否有效,例如身份证日期是否在有效期内,电话和邮箱是否满足要求等;以及其他类型的审批逻辑。
步骤S22,构建审批本体。本实施例中搭建的审批本体中,术语包括法条、审批主体和审批材料,术语的属性包括审批主体的值,术语之间的关系,包括术语的实例与术语之间的关系,术语的属性关系等。由于本体的需求已经明确,目前也没有可以复用的本体,步骤S21也给出了相关的重要概念和术语,本体框架也已经明确,因此从七步法的“梳理本体概念的层次结构,创建本体实例”这一步开始,给出基于protégé平台搭建本体的实施步骤。
梳理本体概念的层次结构,创建本体实例:通过本体概念之间的关系,可以确定本体的框架。首先,在该本体项目中,先创建审批主体、审批材料、审批要点、审批依据这几个父类,每个父类也包含一定的子类,这样层层类推,如下表3所示。
表3 本体概念及其子类
申请码:申请号:CN201910396188.9 申请日:2019-05-14 公开号:CN109919585A 公开日:2019-06-21 国家:CN 国家/省市:31(上海) 授权编号:CN109919585B 授权时间:20190910 主分类号:G06F 16/36 专利分类号:G06F16/36;G06Q10/10 范畴分类:40B; 申请人:上海市浦东新区行政服务中心(上海市浦东新区市民中心);上海交通大学 第一申请人:上海市浦东新区行政服务中心(上海市浦东新区市民中心) 申请人地址:200135 上海市浦东新区合欢路2号 发明人:史健勇;蒋红军;黄海霞;张丽丽;姚冯鑫;姜柳;田济东;陈培智 第一发明人:史健勇 当前权利人:上海市浦东新区行政服务中心(上海市浦东新区市民中心);上海交通大学 代理人:徐红银;刘翠 代理机构:31317 代理机构编号:上海恒慧知识产权代理事务所(特殊普通合伙) 优先权:关键词:当前状态:审核中 类型名称:外观设计相关信息详情