新能源政策文本处理方法、装置及设备和存储介质制造方法及图纸

技术编号:34147536 阅读:53 留言:0更新日期:2022-07-14 19:20
本申请实施例公开了一种新能源政策文本处理方法、装置及设备和存储介质,对新能源政策文本进行摘要句抽取,得到摘要文本;根据各个政策类型对应的关键词,获得摘要文本中的各个词的特征表示;将摘要文本中的各个词的特征表示输入预先训练好的类型识别模型,得到新能源政策文本对应的类型。本申请抽取新能源政策文本的摘要文本,基于各个政策类型对应的关键词获得摘要文本中的各个词的特征表示,基于摘要文本中的各个词的特征表示获得新能源政策文本的政策类型,实现了政策工具的类型的自动识别,提高了政策工具类型识别的效率。提高了政策工具类型识别的效率。提高了政策工具类型识别的效率。

New energy policy text processing methods, devices, equipment and storage media

【技术实现步骤摘要】
新能源政策文本处理方法、装置及设备和存储介质


[0001]本申请涉及信息处理
,更具体地说,涉及一种新能源政策文本处理方法、装置及设备和存储介质。

技术介绍

[0002]政策是各级政府部门为完成一定历史时期的任务而定制的具体行动准则,而政策工具(即政策文本)作为政策推动与实施的重要手段、政策内在特征挖掘的重要角度,在政策分析中具有重要地位。
[0003]政策分析的一个重要环节就是政策工具的类型识别,而目前政策工具的类型识别是由人工进行的,不仅费事费力,还极大的限制了政策工具在政策分析中的广泛应用。

技术实现思路

[0004]本申请提供一种新能源政策文本处理方法、装置及设备和存储介质,以至少部分的克服现有技术中存在的技术问题。
[0005]为实现上述目的,本申请提供了如下技术方案:
[0006]一种新能源政策文本处理方法,所述方法包括:
[0007]对所述新能源政策文本进行摘要句抽取,得到摘要文本;
[0008]根据各个政策类型对应的关键词,获得所述摘要文本中的各个词的特征表示;
[0009]将所述摘要文本中的各个词的特征表示输入预先训练好的类型识别模型,得到所述新能源政策文本对应的政策类型。
[0010]上述方法,优选的,所述根据各个政策类型对应的关键词,获得所述摘要文本的特征表示,包括:
[0011]对于所述摘要文本中的每个句子,分别利用各个政策类型对应的关键词计算该句子与各个政策类型的关联度;
[0012]在计算得到的多个关联度中确定最大关联度;
[0013]对于该句子中的每个词,将该词的向量表示与所述最大关联度拼接,得到所述摘要文本中的各个词的特征表示。
[0014]上述方法,优选的,所述对于所述摘要文本中的每个句子,分别利用各个政策类型对应的关键词计算该句子与各个政策类型的关联度,包括:
[0015]对于每一个关键词,计算该句子中的各个词与该关键词的距离和,作为该句子与该关键词的关联度;
[0016]对应每个政策类型,将该句子与该政策类型对应的各个关键词的关联度求和,得到该句子与该政策类型的关联度。
[0017]上述方法,优选的,所述对所述新能源政策文本进行摘要句抽取,包括:
[0018]确定所述新能源政策文本的预设数量的主题;
[0019]按照各个主题,将所述新能源政策文本中的句子划分为所述预设数量的句子类
簇;其中,不同的句子类簇对应不同的主题;
[0020]从每个句子类簇中分别抽取满足条件的句子作为摘要句。
[0021]上述方法,优选的,所述从每个句子类簇中分别抽取满足条件的句子作为摘要句,包括:
[0022]对于每个句子类簇,计算该句子类簇中的各个句子的熵信息;
[0023]按照熵信息的大小选择目标句子作为摘要句;其中,目标句子的熵信息大于非目标句子的熵信息。
[0024]上述方法,优选的,所述各个政策类型包括:
[0025]导向项政策,用于行业起步阶段的引导扶持;
[0026]激励性政策,用于行业发展阶段的效率提升;
[0027]监管型政策,用于行业成熟阶段的规范约束。
[0028]上述方法,优选的,还包括:
[0029]获得所述新能源政策文本的相关信息,所述相关信息至少包括:摘要文本、主题、发展目标、发布部门和接收部门;
[0030]获得预设历史时长内,与所述新能源政策文本具有相同主题的历史新能源政策文本的历史信息;所述历史信息至少包括:历史新能源政策的政策类型、发布部门和标题;
[0031]展示所述新能源政策文本的基本信息,以及所述历史信息。
[0032]一种新能源政策文本处理装置,所述装置包括:
[0033]抽取模块,用于对所述新能源政策文本进行摘要句抽取,得到摘要文本;
[0034]特征提取模块,用于根据各个政策类型对应的关键词,获得所述摘要文本中的各个词的特征表示;
[0035]识别模块,用于将所述摘要文本中的各个词的特征表示输入预先训练好的类型识别模型,得到所述新能源政策文本对应的政策类型。
[0036]一种电子设备,包括存储器和处理器;
[0037]所述存储器用于存储程序;
[0038]所述处理器用于执行所述存储器中存储的程序,以实现如上任意一项所述的新能源政策文本处理方法的各个步骤。
[0039]一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时,实现如上任意一项所述的新能源政策文本处理方法的各个步骤。
[0040]本申请提供的新能源政策文本处理方法、装置及设备和存储介质,对新能源政策文本进行摘要句抽取,得到摘要文本;根据各个政策类型对应的关键词,获得摘要文本中的各个词的特征表示;将摘要文本中的各个词的特征表示输入预先训练好的类型识别模型,得到新能源政策文本对应的类型。本申请抽取新能源政策文本的摘要文本,基于各个政策类型对应的关键词获得摘要文本中的各个词的特征表示,基于摘要文本中的各个词的特征表示获得新能源政策文本的政策类型,实现了政策工具的类型的自动识别,提高了政策工具类型识别的效率。
附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1本申请实施例提供的新能源政策文本处理方法的一种实现流程图;
[0043]图2为本申请实施例提供的新能源政策类型划分的一种示例图;
[0044]图3为本申请实施例提供的根据各个政策类型对应的关键词,获得摘要文本特征的一种实现流程图;
[0045]图4为本申请实施例提供的对于摘要文本中的每个句子,分别利用各个政策类型对应的关键词计算该句子与各个政策类型的关联度的一种实现流程图;
[0046]图5为本申请实施例提供的对新能源政策文本进行摘要句抽取的一种实现流程图;
[0047]图6为本申请实施例提供的从每个句子类簇中分别抽取满足条件的句子作为摘要句的一种实现流程图;
[0048]图7为本申请实施例提供的新能源政策文本处理装置的一种结构示意图;
[0049]图8为本申请实施例提供的电子设备的硬件结构框图。
[0050]说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。
具体实施方式
[0051]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种新能源政策文本处理方法,其特征在于,所述方法包括:对所述新能源政策文本进行摘要句抽取,得到摘要文本;根据各个政策类型对应的关键词,获得所述摘要文本中的各个词的特征表示;将所述摘要文本中的各个词的特征表示输入预先训练好的类型识别模型,得到所述新能源政策文本对应的政策类型。2.根据权利要求1所述的方法,其特征在于,所述根据各个政策类型对应的关键词,获得所述摘要文本的特征表示,包括:对于所述摘要文本中的每个句子,分别利用各个政策类型对应的关键词计算该句子与各个政策类型的关联度;在计算得到的多个关联度中确定最大关联度;对于该句子中的每个词,将该词的向量表示与所述最大关联度拼接,得到所述摘要文本中的各个词的特征表示。3.根据权利要求2所述的方法,其特征在于,所述对于所述摘要文本中的每个句子,分别利用各个政策类型对应的关键词计算该句子与各个政策类型的关联度,包括:对于每一个关键词,计算该句子中的各个词与该关键词的距离和,作为该句子与该关键词的关联度;对应每个政策类型,将该句子与该政策类型对应的各个关键词的关联度求和,得到该句子与该政策类型的关联度。4.根据权利要求1所述的方法,其特征在于,所述对所述新能源政策文本进行摘要句抽取,包括:确定所述新能源政策文本的预设数量的主题;按照各个主题,将所述新能源政策文本中的句子划分为所述预设数量的句子类簇;其中,不同的句子类簇对应不同的主题;从每个句子类簇中分别抽取满足条件的句子作为摘要句。5.根据权利要求4所述的方法,其特征在于,所述从每个句子类簇中分别抽取满足条件的句子作为摘要句,包括:对于每个句子类簇,计算该句子类簇中的各个句子的熵信息...

【专利技术属性】
技术研发人员:谢国辉马晓光隋佳音单雨葛乐矣
申请(专利权)人:国网数字科技控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1