一种政策匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38708119 阅读:10 留言:0更新日期:2023-09-08 14:48
本申请实施例公开了一种政策匹配方法、装置、电子设备及存储介质。在本申请实施例中,能够对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息以及企业关键信息;将第一结构类型的政策关键信息与第一结构类型的企业关键信息进行精准匹配,得到精准匹配度;将第二结构类型的政策关键信息与第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度;根据精准匹配度和模糊匹配度确定出用户的企业申报信息与政策文件的政策匹配度。本申请提高了对政策的解析程度,帮助企业关联到更多的优惠政策,节省了人力搜集信息的成本的同时还使得整个政策匹配形成有效闭环优化。政策匹配形成有效闭环优化。政策匹配形成有效闭环优化。

【技术实现步骤摘要】
一种政策匹配方法、装置、电子设备及存储介质


[0001]本申请涉及信息处理
,具体涉及一种政策匹配方法、装置、电子设备及存储介质。

技术介绍

[0002]政策是政府根据社会发展的经济需要,结合实际情况而制定的一系列支持产业和企业发展的措施。为促进整个地区的经济发展,政府机关单位会在平台网站中发布具有奖励性质的政策文件,供企业和个人进行申报。政策文件中通常包含具体的奖励信息以及相对应的条件信息,奖励信息指企业可实际获取到的优惠如金额补贴、税收补贴等;条件信息则是申报时企业或个人所需满足的资质条件如经营地、年营收额等。政策匹配的主要目的和作用是为了让政策快速触达企业,让企业被动了解政策;辅助政府动态预测政策下发前、下发后可能触达的企业量级范围,对于部分政策的预算框定起到有效的数据样本支持。
[0003]然而,在实际使用过程中,现有政策匹配方法无法完善地匹配到文件中的所有条件信息,忽略了政策条件中存在的行为描述类语句,而且传统简单字符相似的匹配方式,其优化方式需依于人工根据新样本来更新规则,存在人力成本高、更新效率慢等问题。

技术实现思路

[0004]本申请实施例提供一种政策匹配方法、装置、电子设备及存储介质,可以完善地匹配到政策文件中所有条件信息,提高了对政策的解析程度,而且节省了人力成本,信息更新效率高。
[0005]第一方面,本申请实施例提供了一种政策匹配方法,包括:对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息;若干不同结构类型包括第一结构类型和第二结构类型;将第一结构类型的政策关键信息与第一结构类型的企业关键信息进行精准匹配,得到精准匹配度;将第二结构类型的政策关键信息与第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度;根据精准匹配度以及模糊匹配度确定出用户的企业申报信息与政策文件的政策匹配度。
[0006]在一些实施例中,对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息,包括:获取政策文件;对政策文件进行标签结构化抽取,得到标签类政策关键信息;对政策文件进行语料结构化抽取,得到语料类政策关键信息。
[0007]在一些实施例中,对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息,包括:获取用户的企业申报信息;对用户的企业申报信息进行标签结构化抽取,得到标签类企业关键信息;对用户的企业申报信息进行语料结构化抽取,得到语料类企业关键信息。
[0008]在一些实施例中,标签类政策关键信息以及标签类企业关键信息均以标签:标签
值的形式存入数据库中;语料类政策关键信息以及语料类企业关键信息均以类别:文本的形式存入数据库中。
[0009]在一些实施例中,将第一结构类型的政策关键信息与第一结构类型的企业关键信息进行精准匹配,得到精准匹配度,第一结构类型为标签类型,包括:将标签类政策关键信息与标签类企业关键信息进行精准匹配,得到精准匹配度。
[0010]在一些实施例中,将标签类政策关键信息与标签类企业关键信息进行精准匹配,得到精准匹配度,包括:当标签类型为第i种标签类型时,获取标签类型为第i种标签类型的标签类企业关键信息的对应的第一标签值,以及标签类型为第i种标签类型的标签类政策关键信息对应的第二标签值;当第一标签值与第二标签值之间满足第i阈值条件时,判定标签类型为第i种标签类型的标签类企业关键信息与标签类型为第i种标签类型的标签类政策关键信息之间精准匹配,其中,i大于等于1。
[0011]在一些实施例中,将第二结构类型的政策关键信息与第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度,第二结构类型为语料类型,包括:将语料类政策关键信息与语料类企业关键信息进行模糊匹配,得到模糊匹配度。
[0012]在一些实施例中,将语料类政策关键信息与语料类企业关键信息进行模糊匹配,得到模糊匹配度,包括:将语料类政策关键信息输入文本相似度双塔模型的第一BERT语义模型,第一BERT语义模型输出政策文本表示向量;将语料类企业关键信息输入文本相似度双塔模型的第二BERT语义模型,第二BERT语义模型输出企业文本表示向量;计算政策文本表示向量与企业文本表示向量之间的相似度,得到模糊匹配度。
[0013]在一些实施例中,政策匹配度包括用户的企业申报信息与政策文件之间的总匹配度,以及用户的企业申报信息与政策文件中每个条件项的匹配度;根据精准匹配度以及模糊匹配度确定出用户的企业申报信息与政策文件的政策匹配度之后,还包括:获取用户的企业申报信息与不同政策文件之间的总匹配度;将用户的企业申报信息与不同政策文件之间的总匹配度按照从高到底进行排序,得到总匹配度排序集合;根据总匹配度排序集合向用户展示推荐政策;根据用户的企业申报信息与政策文件中每个条件项的匹配度,在政策详情页面向用户展示用户的企业申报信息对政策文件中每个条件项的匹配情况。
[0014]在一些实施例中,根据用户的企业申报信息与政策文件中每个条件项的匹配度,在政策详情页面向用户展示用户的企业申报信息对政策文件中每个条件项的匹配情况,还包括:当检测到用户在政策详情页面查看政策文件中每个条件项的匹配情况,且用户通过政策详情页面点击第一按钮时,保存认可日志;认可日志为用户对政策文件每个条件项的匹配情况认可的日志,认可日志包括政策端语料与企业端语料相似的label日志;当检测到用户通过政策详情页面点击第二按钮时,更新用户的企业申报信息,并保存不认可日志,不认可日志为用户对政策文件每个条件项的匹配情况不认可的日志,不认可日志包括政策端语料与企业端语料不相似的label日志。
[0015]在一些实施例中,政策匹配方法还包括:将政策端语料与企业端语料相似的label日志以及政策端语料与企业端语料不相似的label日志作为训练集;利用训练集对文本相似度双塔模型进行训练,得到训练后的文本相似度双塔模型。
[0016]在一些实施例中,政策匹配方法还包括:当检测到用户浏览政策详情页面时,根据政策关键信息以及企业关键信息获取信息增益比;根据信息增益比生成用户调查问卷,信
息增益比表示用户调查问卷中各问题展示的优先级;通过用户调查问卷更新用户的企业申报信息。
[0017]第二方面,本申请实施例提供了一种政策匹配装置,包括:信息抽取模块,对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息;若干不同结构类型包括第一结构类型和第二结构类型;精准匹配模块,用于将第一结构类型的政策关键信息与第一结构类型的企业关键信息进行精准匹配,得到精准匹配度;模糊匹配模块,用于将第二结构类型的政策关键信息与第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度;匹配度确定模块,用于根据精准匹配度以及模糊匹配度确定出用户的企业申报信息与政策本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种政策匹配方法,其特征在于,包括:对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息;所述若干不同结构类型包括第一结构类型和第二结构类型;将所述第一结构类型的政策关键信息与所述第一结构类型的企业关键信息进行精准匹配,得到精准匹配度;将所述第二结构类型的政策关键信息与所述第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度;根据所述精准匹配度以及所述模糊匹配度确定出所述用户的企业申报信息与所述政策文件的政策匹配度。2.如权利要求1的政策匹配方法,其特征在于,所述对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息,包括:获取政策文件;对所述政策文件进行标签结构化抽取,得到标签类政策关键信息;对所述政策文件进行语料结构化抽取,得到语料类政策关键信息。3.如权利要求2的政策匹配方法,其特征在于,所述对政策文件以及用户的企业申报信息分别进行结构化抽取,得到若干不同结构类型的政策关键信息,以及若干不同结构类型的企业关键信息,包括:获取用户的企业申报信息;对所述用户的企业申报信息进行标签结构化抽取,得到标签类企业关键信息;对所述用户的企业申报信息进行语料结构化抽取,得到语料类企业关键信息。4.如权利要求3的政策匹配方法,其特征在于,所述标签类政策关键信息以及所述标签类企业关键信息均以标签:标签值的形式存入数据库中;所述语料类政策关键信息以及所述语料类企业关键信息均以类别:文本的形式存入所述数据库中。5.如权利要求4的政策匹配方法,其特征在于,所述将所述第一结构类型的政策关键信息与所述第一结构类型的企业关键信息进行精准匹配,得到精准匹配度,第一结构类型为标签类型,包括:将所述标签类政策关键信息与所述标签类企业关键信息进行精准匹配,得到精准匹配度。6.如权利要求5的政策匹配方法,其特征在于,所述将所述标签类政策关键信息与所述标签类企业关键信息进行精准匹配,得到精准匹配度,包括:当所述标签类型为第i种标签类型时,获取所述标签类型为第i种标签类型的标签类企业关键信息的对应的第一标签值,以及所述标签类型为第i种标签类型的标签类政策关键信息对应的第二标签值;当所述第一标签值与所述第二标签值之间满足第i阈值条件时,判定所述标签类型为第i种标签类型的标签类企业关键信息与所述标签类型为第i种标签类型的标签类政策关键信息之间精准匹配,其中,i大于等于1。7.如权利要求4或6的政策匹配方法,其特征在于,所述将所述第二结构类型的政策关
键信息与所述第二结构类型的企业关键信息进行模糊匹配,得到模糊匹配度,所述第二结构类型为语料类型,包括:将所述语料类政策关键信息与所述语料类企业关键信息进行模糊匹配,得到模糊匹配度。8.如权利要求7的政策匹配方法,其特征在于,所述将所述语料类政策关键信息与所述语料类企业关键信息进行模糊匹配,得到模糊匹配度,包括:将所述语料类政策关键信息输入文本相似度双塔模型的第一BERT语义模型,所述第一BERT语义模型输出政策文本表示向量;将所述语料类企业关键信息输入所述文本相似度双塔模型的第二BERT语义模型,所述第二BERT语义模型输出企业文本表示向量;...

【专利技术属性】
技术研发人员:程云辉高晓丽姚伟华蒋申为吴晓晴
申请(专利权)人:上海亿通国际股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1