政策匹配方法、装置、设备与计算机可读存储介质制造方法及图纸

技术编号:35590880 阅读:13 留言:0更新日期:2022-11-16 15:08
本发明专利技术公开了一种政策匹配方法、装置、设备与计算机可读存储介质,属于文本解析技术领域。本发明专利技术通过获取政策文件,结合政策分类算法,对不同类别的政策采用对应的知识框架进行解析,针对结构复杂的政府政策文件,能够较完整的抽取整个政策的内容并将其结构化存入数据库中,极大提高政策内容抽取的准确性,并提高根据用户信息在数据库进行政策匹配的精准度。解决企业针对政府扶持政策的人工筛选与阅读,资源消耗大,却难以识别到合适的政策等问题。题。题。

【技术实现步骤摘要】
政策匹配方法、装置、设备与计算机可读存储介质


[0001]本专利技术涉及文本解析
,尤其涉及政策匹配方法、装置、设备与计算机可读存储介质。

技术介绍

[0002]用户如果想要了解本产业领域的政策信息,往往要通过搜索大量的网站信息,同时还要对获取的政策信息进行分析,来判断自身是否符合申报条件,也即用户对相应扶持政策的获取与理解仍处于人工阶段,需要大量的时间与人力投入,且通常难以及时获取并识别到合适扶持政策,因而需要提出一种政策匹配方法。

技术实现思路

[0003]本专利技术的主要目的在于提供一种政策匹配方法、装置、设备与计算机可读存储介质,旨在解决现有技术用户难以找到合适的政策的问题。
[0004]为实现上述目的,本专利技术提供一种政策匹配方法,所述政策匹配方法包括以下步骤:
[0005]获取政策文件;
[0006]对所述政策文件进行分类,并匹配对应的知识框架;
[0007]根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中;
[0008]获取用户信息,根据所述用户信息从所述数据库中匹配得到目标政策。
[0009]可选地,所述政策要素包括:准入条件和补贴标准,所述根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中的步骤包括:
[0010]识别所述政策文件中的子政策;
[0011]定位所述子政策的准入条件文本和补贴标准文本;
[0012]根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中。
[0013]可选地,所述识别所述政策文件中的子政策的步骤包括:
[0014]对所述政策文件进行层级解析,得到所述政策文件的篇章结构;
[0015]基于所述篇章结构定位到包含政策项文本的父节点;
[0016]遍历所述父节点的所有子节点,并用文本分类的方式确认所述子节点是否包含具体的政策信息;
[0017]若是,则用句对分类的方式判断所述子节点描述的政策是否为同一个政策,并生成判断结果;
[0018]基于所述判断结果,得到所述子政策。
[0019]可选地,所述根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中的步骤包括:
[0020]抽取所述准入条件文本和所述补贴标准文本中的描述条件的值;
[0021]通过分类模型将所述值对应到键,形成结构化的政策要素数据,并存入数据库中。
[0022]可选地,所述根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中的步骤包括:
[0023]根据所述知识框架对所述准入条件文本进行键值抽取,得到准入条件键值数据;
[0024]并对所述准入条件键值进行逻辑关系分类,得到结构化的第一政策要素数据;
[0025]根据所述知识框架对所述补贴标准文本进行键值抽取,得到结构化的第二政策要素数据;
[0026]基于所述第一政策要素数据和所述第二政策要素数据,形成结构化的政策要素数据,并存入数据库中。
[0027]可选地,所述根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中的步骤包括:
[0028]识别所述政策文件中的表格;
[0029]判断是否存在所述知识框架对应的表格模板;
[0030]若否,则根据已有的标注语料生成表格模板;
[0031]基于所述表格模板,从所述表格中抽取结构化的政策要素数据,并存入数据库中。
[0032]可选地,所述对所述政策文件进行分类,并匹配对应的知识框架的步骤之前,所述方法还包括:
[0033]对所述政策文件进行层级解析,得到层级解析结果;
[0034]基于所述层级解析结果,构建所述知识框架,所述知识框架包括通用知识框架和特定类别独有部分。
[0035]可选地,所述根据所述用户信息从所述数据库中匹配得到目标政策的步骤包括:
[0036]根据所述用户信息在所述数据库中进行政策模糊匹配,得到模糊匹配结果;
[0037]获取所述模糊匹配政策结果中每一篇政策个性化匹配选项的选择结果,基于所述选择结果进行精确匹配,从所述数据库中匹配得到所述目标政策。
[0038]此外,为实现上述目的,本专利技术还提供一种政策匹配装置,所述装置包括:
[0039]获取模块,用于获取政策文件;
[0040]分类模块,用于对所述政策文件进行分类,并匹配对应的知识框架;
[0041]解析模块,用于根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中;
[0042]匹配模块,用于获取用户信息,根据所述用户信息从所述数据库中匹配得到目标政策。
[0043]可选地,所述解析模块还用于:
[0044]识别所述政策文件中的子政策;
[0045]定位所述子政策的准入条件文本和补贴标准文本;
[0046]根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中。
[0047]可选地,所述解析模块还用于:
[0048]对所述政策文件进行层级解析,得到所述政策文件的篇章结构;
[0049]基于所述篇章结构定位到包含政策项文本的父节点;
[0050]遍历所述父节点的所有子节点,并用文本分类的方式确认所述子节点是否包含具体的政策信息;
[0051]若是,则用句对分类的方式判断所述子节点描述的政策是否为同一个政策,并生成判断结果;
[0052]基于所述判断结果,得到所述子政策。
[0053]可选地,所述解析模块还用于:
[0054]抽取所述准入条件文本和所述补贴标准文本中的描述条件的值;
[0055]通过分类模型将所述值对应到键,形成结构化的政策要素数据,并存入数据库中。
[0056]可选地,所述解析模块还用于:
[0057]根据所述知识框架对所述准入条件文本进行键值抽取,得到准入条件键值数据;
[0058]并对所述准入条件键值进行逻辑关系分类,得到结构化的第一政策要素数据;
[0059]根据所述知识框架对所述补贴标准文本进行键值抽取,得到结构化的第二政策要素数据;
[0060]基于所述第一政策要素数据和所述第二政策要素数据,形成结构化的政策要素数据,并存入数据库中。
[0061]可选地,所述解析模块还用于:
[0062]识别所述政策文件中的表格;
[0063]判断是否存在所述知识框架对应的表格模板;
[0064]若否,则根据已有的标注语料生成表格模板;
[0065]基于所述表格模板,从所述表格中抽取结构化的政策要素数据,并存入数据库中。
[0066]可选地,所述解析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种政策匹配方法,其特征在于,所述政策匹配方法包括以下步骤:获取政策文件;对所述政策文件进行分类,并匹配对应的知识框架;根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中;获取用户信息,根据所述用户信息从所述数据库中匹配得到目标政策。2.如权利要求1所述的政策匹配方法,其特征在于,所述政策要素包括:准入条件和补贴标准,所述根据所述知识框架从所述政策文件中抽取结构化的政策要素数据,并存入数据库中的步骤包括:识别所述政策文件中的子政策;定位所述子政策的准入条件文本和补贴标准文本;根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中。3.如权利要求2所述的政策匹配方法,其特征在于,所述识别所述政策文件中的子政策的步骤包括:对所述政策文件进行层级解析,得到所述政策文件的篇章结构;基于所述篇章结构定位到包含政策项文本的父节点;遍历所述父节点的所有子节点,并用文本分类的方式确认所述子节点是否包含具体的政策信息;若是,则用句对分类的方式判断所述子节点描述的政策是否为同一个政策,并生成判断结果;基于所述判断结果,得到所述子政策。4.如权利要求2所述的政策匹配方法,其特征在于,所述根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中的步骤包括:抽取所述准入条件文本和所述补贴标准文本中的描述条件的值;通过分类模型将所述值对应到键,形成结构化的政策要素数据,并存入数据库中。5.如权利要求2所述的政策匹配方法,其特征在于,所述根据所述知识框架对所述准入条件文本和所述补贴标准文本分别进行键值抽取,形成结构化的政策要素数据,并存入数据库中的步骤包括:根据所述知识框架对所述准入条件文本进行键值抽取,得到准入条件键值数据;并对所述准入条件键值进行逻辑关系分类,得到结构化的第一政策要素数据;根据所述知识框架对所述补贴标准文本进行键值抽取,得到结构化的第二政策要素数据...

【专利技术属性】
技术研发人员:刘韦伯周耘立
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1