一种用于数字政务的智能政策匹配方法及系统技术方案

技术编号:26342641 阅读:18 留言:0更新日期:2020-11-13 20:36
本发明专利技术公开了一种用于数字政务的智能政策匹配方法及系统,解析政策文件的内容生成知识图谱,处理企业信息与政策条件的匹配度,通过梳理政策条件得到多组标签,标签与政策条件存在单选、多选和输入类型三种对应关系,计算匹配度最终得到每个政策条件的匹配度;企业信息补充,过滤掉奖励路径不匹配的政策奖励,得到候选政策奖励所对应的政策条件;将政策条件关联到标签,得到候选标签及其值,而后计算每个标签对应的信息熵以及政策数量,综合排序后将权重最高的标签推荐给企业进行填写;政策推理,基于信息匹配最终得到的政策条件匹配度,采用深度优先搜索的方法搜索知识图谱,给出企业最终不同政策奖励的匹配情况,给出政策的匹配报告。

An intelligent policy matching method and system for Digital Government

【技术实现步骤摘要】
一种用于数字政务的智能政策匹配方法及系统
本专利技术涉及数字政务
,特别涉及一种用于数字政务的智能政策匹配方法及系统。
技术介绍
企业发展是我国经济和社会发展的中流砥柱,为了支持企业的技术研发创新,政府会在公共服务平台和相关网站上发布各种各样的扶持政策。这些政策能够帮助企业快速发展,然而政策发布后企业通常无法清晰地判断自己是否满足申报要求,需要咨询相关工作人员;另外,政府也需要安排人力来处理大量咨询和政策申报的审核工作,面对这种情况,智能而精确的政策匹配能够有效地减少人力工作量,提升申报效率。目前政策匹配系统一般采用政策画像技术进行构建:1、针对大量政策,人工制定出一批标签用于政策画像的构建;2、使用自然语言处理技术对政策文件进行解析分类,打上相应的标签;3、搭建政策匹配系统,根据企业输入的标签信息,系统自动过滤掉不符合的政策,留下筛选后与企业信息相符合的政策。上述现有的政策匹配系统存在着以下缺点:1、简单的标签体系无法处理政策匹配过程中的逻辑问题,只能给出初步的筛选结果,企业填写信息后还是无法知道自己是否能够申报该政策;2、企业需要填写的信息过多,且信息输入过程中不能根据企业情况动态调整需要填写的信息;3、政策梳理过于依赖人工,对于大量政策的场景政策梳理效率低、耗时长;4、由于缺乏知识图谱的支持,无法基于用户输入动态的推理出最优的候选政策以及生成相应的匹配依据和结果的报告。
技术实现思路
针对现有技术存在的不足,本专利技术的目的在于提供一种用于数字政务的智能政策匹配方法及系统,需要解决的问题包括:1、政策知识图谱——需要精确的表示出政策内容,包括政策条件、政策奖励以及之间的逻辑关系;2、政策解析——需要能够对政策文件进行自动解析得到知识图谱;3、信息匹配——企业信息一般与政策条件不是一一对应关系,需要能够基于企业信息得出政策条件匹配情况;4、信息补充——在企业输入的信息不足时,需要基于已有信息进行标签排序,动态补充信息,尽可能地减少企业填写次数;5、政策推理——需要基于知识图谱进行逻辑推理,得到政策匹配的准确结果,以及在当前输入的信息情况下最优的候选政策。本专利技术的上述技术目的是通过以下技术方案得以实现的:一种用于数字政务的智能政策匹配方法,包括以下内容:解析政策文件的内容生成知识图谱政策文件由政府发布,一般为PDF或doc格式,一个政策文件中可能有多个子政策,每个政策针对不同情况又会有不同的政策扶持。解析时,首先采用OCR和docx工具包进行内容读取,然后采用基于规则的命名实体识别技术进行逻辑解析,拆分出子政策并抽取出政策条件和政策奖励,最后通过关键字进行条件组合得到初步的知识图谱,后续再由人工进行审核确认即可。知识图谱本专利技术的知识图谱采用树形结构,形式为“子政策→政策奖励→政策条件”,其中一个子政策会对应多个政策奖励,一个政策奖励对应多个政策条件,政策条件之间存在“与/或”关系构成奖励路径;知识图谱采用xmind的形式进行存储。信息匹配处理企业信息与政策条件的匹配度,信息来源包括外部接入的第三方信息和企业补充填写的信息,信息形式为“标签:值”,标签通过梳理政策条件得到,标签与政策条件存在单选、多选和输入类型三种对应关系;针对单选、多选类型,信息匹配采用匹配表的形式计算匹配度,而输入类型则采用规则+语义表示模型(BERT)的分类模型的方法进行计算,最终得到每个政策条件的匹配度。信息补充在进行信息匹配时可接入外部的第三方信息,从而减少企业信息输入,但第三方信息可能只包括企业的基本信,此时需要让企业继续填写标签信息进行补充,需要填写的标签采用以下方法得到:遍历每个政策,过滤掉奖励路径不匹配的政策奖励,得到候选政策奖励所对应的政策条件;将政策条件关联到标签,得到候选标签及其值,而后计算每个标签对应的信息熵以及政策数量,综合排序后将权重最高的标签推荐给企业进行填写。政策推理基于信息匹配最终得到的政策条件匹配度,采用深度优先搜索的方法搜索知识图谱,处理与/或关系,给出企业最终不同政策奖励的匹配情况。给出匹配结果,即政策的匹配报告若结果不匹配,将给出哪些政策条件不满足;或有满足条件的政策,给出匹配的政策名称、政策奖励以及相关的政策条件;可以以PDF形式导出政策的匹配报告。文字识别工具包对政策文件进行内容读取,内容读取之后输送给政策解析引擎基于上述的
技术实现思路
,本专利技术的另外一个技术目的是提供一种用于数字政务的智能政策匹配系统,包括文字识别工具包、政策解析引擎和政策计算器,文字识别工具包对政策文件进行内容读取,内容读取之后输送给政策解析引擎,政策解析引擎基于规则+自然语言处理技术自动解析政策文件,得到初步的知识图谱;政策计算器包括:信息匹配模块,通过梳理政策条件得到多组标签,企业信息的信息形式为“标签:值”,标签与政策条件存在单选、多选和输入类型三种对应关系,计算匹配度最终得到每个政策条件的匹配度;信息补充模块,遍历每个政策,过滤掉奖励路径不匹配的政策奖励,得到候选政策奖励所对应的政策条件;将政策条件关联到标签,得到候选标签及其值,而后计算每个标签对应的信息熵以及政策数量,综合排序后将权重最高的标签推荐给企业进行填写,并反馈到信息匹配模块计算匹配度;政策推理模块,基于信息匹配得到的政策条件匹配度,搜索知识图谱并处理政策条件之间存在的与/或关系,给出企业最终不同政策奖励的匹配情况;匹配报告输出模块,根据政策推理模块给出的匹配情况,若结果不匹配,将给出哪些政策条件不满足;或有满足条件的政策,也可以给出匹配的政策名称、政策奖励以及相关的政策条件。综上所述,本专利技术对比于现有技术的有益效果为:本专利技术独创性的通过知识图谱的构建,将政策对应的推理逻辑用图谱表示出来,以表示政策、奖励和条件间复杂的逻辑关系;基于规则+自然语言处理技术的政策解析引擎能够自动解析政策文件,得到初步的知识图谱,减少知识图谱梳理需要的人力投入,并使得政策匹配和计算能广泛应用到政务场景成为可能;基于知识图谱的政策计算器能够计算出企业与政策的精准的匹配情况,并给出不满足或满足的条件或依据,降低政策申报和审核的人力投入;在企业信息不足需要补充信息时,会对候选政策标签进行排序,实现企业填写标签次数最少的目标并得到最优的匹配效果。附图说明图1为实施例的流程图;图2为实施例中知识图谱的结构图。具体实施方式以下结合附图对专利技术作进一步详细说明。下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。说明书中的“实施例”或“实施方式”既可表示一个实施例或一种实施方式,也本文档来自技高网
...

【技术保护点】
1.一种用于数字政务的智能政策匹配方法,其特征在于,包括以下步骤:/n步骤1,解析政策文件的内容生成知识图谱,首先采用文字识别工具包进行内容读取,通过逻辑解析拆分出子政策并抽取出政策条件和政策奖励,政策条件之间存在与/或关系构成奖励路径,最后通过关键字进行条件组合得到初步的知识图谱;/n步骤2,处理企业信息与政策条件的匹配度,通过梳理政策条件得到多组标签,企业信息的信息形式为“标签:值”,标签与政策条件存在单选、多选和输入类型三种对应关系,计算匹配度最终得到每个政策条件的匹配度;/n步骤3,企业信息补充,首先遍历每个政策,过滤掉奖励路径不匹配的政策奖励,得到候选政策奖励所对应的政策条件;将政策条件关联到标签,得到候选标签及其值,而后计算每个标签对应的信息熵以及政策数量,综合排序后将权重最高的标签推荐给企业进行填写;/n步骤4,政策推理,基于信息匹配最终得到的政策条件匹配度,采用深度优先搜索的方法搜索知识图谱,处理与/或关系,给出企业最终不同政策奖励的匹配情况;/n步骤5,给出政策的匹配报告,若结果不匹配,将给出哪些政策条件不满足;或有满足条件的政策,给出匹配的政策名称、政策奖励以及相关的政策条件。/n...

【技术特征摘要】
1.一种用于数字政务的智能政策匹配方法,其特征在于,包括以下步骤:
步骤1,解析政策文件的内容生成知识图谱,首先采用文字识别工具包进行内容读取,通过逻辑解析拆分出子政策并抽取出政策条件和政策奖励,政策条件之间存在与/或关系构成奖励路径,最后通过关键字进行条件组合得到初步的知识图谱;
步骤2,处理企业信息与政策条件的匹配度,通过梳理政策条件得到多组标签,企业信息的信息形式为“标签:值”,标签与政策条件存在单选、多选和输入类型三种对应关系,计算匹配度最终得到每个政策条件的匹配度;
步骤3,企业信息补充,首先遍历每个政策,过滤掉奖励路径不匹配的政策奖励,得到候选政策奖励所对应的政策条件;将政策条件关联到标签,得到候选标签及其值,而后计算每个标签对应的信息熵以及政策数量,综合排序后将权重最高的标签推荐给企业进行填写;
步骤4,政策推理,基于信息匹配最终得到的政策条件匹配度,采用深度优先搜索的方法搜索知识图谱,处理与/或关系,给出企业最终不同政策奖励的匹配情况;
步骤5,给出政策的匹配报告,若结果不匹配,将给出哪些政策条件不满足;或有满足条件的政策,给出匹配的政策名称、政策奖励以及相关的政策条件。


2.根据权利要求1所述的一种用于数字政务的智能政策匹配方法,其特征在于,所述步骤1中的文字识别工具包包含ocr和docx工具包,并通过采用基于规则的命名实体识别技术进行逻辑解析。


3.根据权利要求1所述的一种用于数字政务的智能政策匹配方法,其特征在于,所述知识图谱采用树形结果,形式为“子政策→政策奖励→政策条件”,其中一个子政策会对应多个政策奖励,一个政策奖励对应多个政策条件,政策条件之...

【专利技术属性】
技术研发人员:徐亮田垠高扬
申请(专利权)人:杭州实在智能科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1