一种基于深度学习的政策匹配方法组成比例

技术编号:39778241 阅读:5 留言:0更新日期:2023-12-22 02:24
本发明专利技术提供了一种基于深度学习的政策匹配方法,包括:

【技术实现步骤摘要】
一种基于深度学习的政策匹配方法


[0001]本专利技术涉及数据处理
,尤其是涉及一种基于深度学习的政策匹配方法


技术介绍

[0002]政府部门经常通过多种渠道发布多种企业相关的政策文件,但企业经常因为信息了解的不及时或对相应政策文件理解的不准确而错过了相应政策,导致企业利益受到损失,企业为了减少这方便的损失常见的做法是雇用相应的人员或相应的咨询公司帮助企业即时了解与分析相应政策,这增加企业的负担


技术实现思路

[0003]本专利技术提供了一种基于深度学习的政策匹配方法,以解决现有技术中企业无法及时了解政策文件,无法及时准确匹配政策条件的技术问题

[0004]本专利技术的一个方面在于提供一种基于深度学习的政策匹配方法,所述政策匹配方法包括如下方法步骤:
[0005]S1、
创建第一政策条件集,其中,第一政策条件集中包括多个第一政策条件;
[0006]S2、
收集不同行业

不同政府部门的政策文件
N
份,并对收集的
N
份政策文件进行语句提取,获取每一份政策文件的多个语句;
[0007]S3、
利用第一政策条件集,对
N
份政策文件进行多分类标注,以及对每一份政策文件的多个语句进行命名实体标注,以及对每一份政策文件的多个语句进行序列到序列标注;
[0008]S4、
利用标注好的
N
份政策文件,以及每一份政策文件命名实体标注的多个语句,以及每一份政策文件序列到序列标注的多个语句,训练
M
个政策分析模型;
[0009]S5、
对待分析的政策文件进行语句提取,获取待分析文件的多个语句,将待分析文件,以及待分析文件的多个语句输入
M
个政策分析模型,输出待分析文件,以及待分析文件的多个语句对应的第二政策条件;
[0010]S6、

M
个政策分析模型输出的待分析文件,以及待分析文件的多个语句对应的第二政策条件,合并成第二政策条件集,并对第二政策条件集进行数据标准化处理;
[0011]S7、
获取企业信息数据和第二政策条件集,将企业信息数据和第二政策条件集匹配,并计算每个第二政策条件的偏差值;
[0012]S8、
对每个第二政策条件的偏差值进行截取,利用截取后的每个第二政策条件的偏差值,计算企业信息数据与政策文件的符合度,并显示企业信息数据与政策文件的符合度

[0013]在一个优选的实施例中,在步骤
S2
中,对收集的
N
份政策文件进行语句提取包括:
[0014]S201、
去除每一份政策文件中不可见的字符

空格

空行
、emoji
等字符;
[0015]S202、
每一份政策文件中无句号分隔的段落

章节内容之间添加句号;
[0016]S203、
对每一份政策文件的内容按顺序合并为单行内容;
[0017]S204、
对单行内容切分为多个语句

[0018]在一个优选的实施例中,在步骤
S4
中,利用标注好的
N
份政策文件,通过
transformer

xl
类的长文本编码模型,训练政策分析模型

[0019]在一个优选的实施例中,在步骤
S4
中,利用每一份政策文件命名实体标注的多个语句,通过
BERT+BILSTM+CRF
类的模型,训练政策分析模型;
[0020]在一个优选的实施例中,在步骤
S4
中,利用每一份政策文件序列到序列标注的多个语句,通过
seq2seq
类的序列到序列的翻译模型,训练政策分析模型

[0021]在一个优选的实施例中,在步骤
S5
中,对待分析的政策文件进行语句提取包括:
[0022]S501、
去除待分析的政策文件中不可见的字符

空格

空行
、emoji
等字符;
[0023]S502、
待分析的政策文件中无句号分隔的段落

章节内容之间添加句号;
[0024]S503、
对待分析的政策文件的内容按顺序合并为单行内容;
[0025]S504、
对单行内容切分为多个待分析文件的语句

[0026]在一个优选的实施例中,在步骤
S7
中,每个第二政策条件的偏差值通过如下方法计算:
[0027]对于数值类第二政策条件,其条件偏差=
(Vkey

Vtarget)/Vtarget

[0028]对于文本类第二政策条件,
[0029]其中,
VECkey

VECtarget
表示经过
BERT
类的模型计算后的第二政策条件,与企业信息数据的语义向量

[0030]在一个优选的实施例中,在步骤
S8
中,每个第二政策条件的偏差值的截取规则为:
[0031]当第二政策条件的偏差值大于0,则第二政策条件的偏差值取0;
[0032]当第二政策条件的偏差值小于
‑1,则第二政策条件的偏差值取
‑1;
[0033]当第二政策条件的偏差值范围在
[
‑1,
0],则第二政策条件的偏差值不进行截取

[0034]在一个优选的实施例中,在步骤
S8
中,企业信息数据与政策文件的符合度通过如下方法计算:
[0035][0036]其中,
S
表示对第二政策条件集中第二政策条件的数量;
Ri
表示截取后的第二政策条件偏差值,
Wi
表示每个第二政策条件的权重

[0037]在一个优选的实施例中,企业信息数据与政策文件的符合度取值范围在
[0

100],当企业信息数据与政策文件的符合度=
100
时,则企业信息数据与政策文件完全符合

[0038]与现有技术相比,本专利技术具有以下有益效果:
[0039]本专利技术提供的一种基于深度学习的政策匹配方法,通过深度学习模型分析政策文件,计算信息数据与政策文件的符合程度,用于主动提醒或自动办理相关业务等场景,让相关企业即时享受到相应政策,帮助企业减少损失

减轻负担,帮助政务服务需求侧改革落地,提升政务主动服务的能力

附图说明...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习的政策匹配方法,其特征在于,所述政策匹配方法包括如下方法步骤;
S1、
创建第一政策条件集,其中,第一政策条件集中包括多个第一政策条件;
S2、
收集不同行业

不同政府部门的政策文件
N
份,并对收集的
N
份政策文件进行语句提取,获取每一份政策文件的多个语句;
S3、
利用第一政策条件集,对
N
份政策文件进行多分类标注,以及对每一份政策文件的多个语句进行命名实体标注,以及对每一份政策文件的多个语句进行序列到序列标注;
S4、
利用标注好的
N
份政策文件,以及每一份政策文件命名实体标注的多个语句,以及每一份政策文件序列到序列标注的多个语句,训练
M
个政策分析模型;
S5、
对待分析的政策文件进行语句提取,获取待分析文件的多个语句,将待分析文件,以及待分析文件的多个语句输入
M
个政策分析模型,输出待分析文件,以及待分析文件的多个语句对应的第二政策条件;
S6、

M
个政策分析模型输出的待分析文件,以及待分析文件的多个语句对应的第二政策条件,合并成第二政策条件集,并对第二政策条件集进行数据标准化处理;
S7、
获取企业信息数据和第二政策条件集,将企业信息数据和第二政策条件集匹配,并计算每个第二政策条件的偏差值;
S8、
对每个第二政策条件的偏差值进行截取,利用截取后的每个第二政策条件的偏差值,计算企业信息数据与政策文件的符合度,并显示企业信息数据与政策文件的符合度
。2.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S2
中,对收集的
N
份政策文件进行语句提取包括:
S201、
去除每一份政策文件中不可见的字符

空格

空行
、emoji
等字符;
S202、
每一份政策文件中无句号分隔的段落

章节内容之间添加句号;
S203、
对每一份政策文件的内容按顺序合并为单行内容;
S204、
对单行内容切分为多个语句
。3.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S4
中,利用标注好的
N
份政策文件,通过
transformer

xl
类的长文本编码模型,训练政策分析模型
。4.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S4
中,利用...

【专利技术属性】
技术研发人员:郭大勇兰永
申请(专利权)人:上海通办信息服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1