【技术实现步骤摘要】
一种基于深度学习的政策匹配方法
[0001]本专利技术涉及数据处理
,尤其是涉及一种基于深度学习的政策匹配方法
。
技术介绍
[0002]政府部门经常通过多种渠道发布多种企业相关的政策文件,但企业经常因为信息了解的不及时或对相应政策文件理解的不准确而错过了相应政策,导致企业利益受到损失,企业为了减少这方便的损失常见的做法是雇用相应的人员或相应的咨询公司帮助企业即时了解与分析相应政策,这增加企业的负担
。
技术实现思路
[0003]本专利技术提供了一种基于深度学习的政策匹配方法,以解决现有技术中企业无法及时了解政策文件,无法及时准确匹配政策条件的技术问题
。
[0004]本专利技术的一个方面在于提供一种基于深度学习的政策匹配方法,所述政策匹配方法包括如下方法步骤:
[0005]S1、
创建第一政策条件集,其中,第一政策条件集中包括多个第一政策条件;
[0006]S2、
收集不同行业
、
不同政府部门的政策文件
N
份,并对收集的
N
份政策文件进行语句提取,获取每一份政策文件的多个语句;
[0007]S3、
利用第一政策条件集,对
N
份政策文件进行多分类标注,以及对每一份政策文件的多个语句进行命名实体标注,以及对每一份政策文件的多个语句进行序列到序列标注;
[0008]S4、
利用标注好的
N
份政策文件,以及每一份政策文
【技术保护点】
【技术特征摘要】
1.
一种基于深度学习的政策匹配方法,其特征在于,所述政策匹配方法包括如下方法步骤;
S1、
创建第一政策条件集,其中,第一政策条件集中包括多个第一政策条件;
S2、
收集不同行业
、
不同政府部门的政策文件
N
份,并对收集的
N
份政策文件进行语句提取,获取每一份政策文件的多个语句;
S3、
利用第一政策条件集,对
N
份政策文件进行多分类标注,以及对每一份政策文件的多个语句进行命名实体标注,以及对每一份政策文件的多个语句进行序列到序列标注;
S4、
利用标注好的
N
份政策文件,以及每一份政策文件命名实体标注的多个语句,以及每一份政策文件序列到序列标注的多个语句,训练
M
个政策分析模型;
S5、
对待分析的政策文件进行语句提取,获取待分析文件的多个语句,将待分析文件,以及待分析文件的多个语句输入
M
个政策分析模型,输出待分析文件,以及待分析文件的多个语句对应的第二政策条件;
S6、
将
M
个政策分析模型输出的待分析文件,以及待分析文件的多个语句对应的第二政策条件,合并成第二政策条件集,并对第二政策条件集进行数据标准化处理;
S7、
获取企业信息数据和第二政策条件集,将企业信息数据和第二政策条件集匹配,并计算每个第二政策条件的偏差值;
S8、
对每个第二政策条件的偏差值进行截取,利用截取后的每个第二政策条件的偏差值,计算企业信息数据与政策文件的符合度,并显示企业信息数据与政策文件的符合度
。2.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S2
中,对收集的
N
份政策文件进行语句提取包括:
S201、
去除每一份政策文件中不可见的字符
、
空格
、
空行
、emoji
等字符;
S202、
每一份政策文件中无句号分隔的段落
、
章节内容之间添加句号;
S203、
对每一份政策文件的内容按顺序合并为单行内容;
S204、
对单行内容切分为多个语句
。3.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S4
中,利用标注好的
N
份政策文件,通过
transformer
‑
xl
类的长文本编码模型,训练政策分析模型
。4.
根据权利要求1所述的政策匹配方法,其特征在于,在步骤
S4
中,利用...
【专利技术属性】
技术研发人员:郭大勇,兰永,
申请(专利权)人:上海通办信息服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。