一种面向综合治理的关键词生成方法、装置、设备及介质制造方法及图纸

技术编号:36956400 阅读:12 留言:0更新日期:2023-03-22 19:16
本发明专利技术公开了一种面向综合治理的关键词生成方法、装置、设备及介质,该方法包括:获取输入文本中包含的每一个词汇对应的第一词向量、预设关键词库中包含的每一个候选关键词对应的第二词向量;基于每一个词汇对应的第一词向量和每一个候选关键词对应的第二词向量,确定与输入文本中包含的每一个词汇分别对应的第一隐向量;基于每一个第一隐向量、在当前时刻之前获取的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符;当决策字符为终止字符时,停止生成目标关键词的操作,并获取生成的所有目标关键词;通过上述方法提高了目标关键词的准确性和代表性。表性。表性。

【技术实现步骤摘要】
一种面向综合治理的关键词生成方法、装置、设备及介质


[0001]本专利技术涉及自然语言处理领域,具体涉及一种面向综合治理的关键词生成方法、装置、设备及介质。

技术介绍

[0002]关键词生成旨在通过对给定的文本进行分析,并依据其主要内容,生成包含关键信息的关键词。特别的,对于综合治理领域,其中的文本往往较长,对这些文本生成关键词,可以快速提取文本中的重要信息,帮助人快速理解文本内容,有助于提升社会综合治理的智能化、信息化。
[0003]然而,现有的关键词生成模型大多针对通用开放领域,如果把这些方法直接应用于综合治理领域,虽然能生成关键词,但其结果可能难以结合领域特点,从而使生成的关键词无法准确贴切的表达输入文本所表达的含义。

技术实现思路

[0004]因此,本专利技术要解决的技术问题在于克服现有技术中生成的关键词无法准确贴切的表达输入文本含义的缺陷,从而提供一种面向综合治理的关键词生成方法、装置、设备及介质。
[0005]第一方面,本专利技术提供了一种面向综合治理的关键词生成方法,包括:
[0006]获取输入文本中包含的每一个词汇对应的第一词向量、预设关键词库中包含的每一个候选关键词对应的第二词向量;基于每一个词汇对应的第一词向量和每一个候选关键词对应的第二词向量,确定与输入文本中包含的每一个词汇分别对应的第一隐向量;基于每一个第一隐向量、在当前时刻之前获取的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符;当决策字符为终止字符时,停止生成目标关键词的操作,并获取生成的所有目标关键词。
[0007]本专利技术中首先通过输入文本中包含的每一个词汇对应的第一词向量和预设的关键词库中包含的每一个候选关键词对应的第二词向量生成的第一隐向量,由于预设关键词库中的候选关键词均为综合治理领域常见的且具有行业特性的词,所以,使得生成的第一隐向量不仅结合了与之对应的词汇在输入文本中的位置信息,还结合了语义信息以及综合治理领域的特性。在此基础之上,根据所有的第一隐向量和在当前时刻之前获取的所有预设目标关键词,生成目标关键词,由于目标关键词是融合了所有第一隐向量特征信息的词,因此,通过此方法生成的目标关键词会与输入文本的保持较大的关联度,也是具有输入文本较强代表性的词。本专利技术通过上述方式解决了现有技术中生成的关键词不够准确的缺陷,通过经过语义增强的第一隐向量和预设的目标关键词,生成了结合领域特征和语义信息的目标关键词,从而提高了目标关键词的准确性和代表性。
[0008]根据输入文本中每一个词汇对应的第一隐向量和在当前时刻之前获取的目标关键词生成当前时刻的目标关键词和决策字符
[0009]结合第一方面,在第一方面的第一实施例中,基于每一个词汇对应的第一词向量和每一个候选关键词对应的第二词向量,确定与输入文本中包含的每一个词汇分别对应的第一隐向量,包括:
[0010]对每一个词汇的第一词向量进行编码,生成与每一个词汇对应的第三词向量,第三词向量为包含每一个词汇的位置信息的词向量,位置信息为每一个词汇在输入文本中的位置信息;基于第一词汇的第三词向量和每一个候选关键词对应的第二词向量,确定与第一词汇对应的加权平均向量,第一词汇为输入文本中包含的多个词汇中的任一个;获取预设的第一重置矩阵、预设的第二重置矩阵和预设的重置偏移向量;基于每一个第一词汇的第三词向量、加权平均向量、第一重置矩阵、第二重置矩阵和重置偏移向量,确定与每一个第一词汇对应的第一隐向量。
[0011]结合第一方面,在第一方面的第二实施例中,基于每一个第一隐向量、在当前时刻之前获取的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符,包括:
[0012]当在当前时刻之前,未生成目标关键词时,则获取初始关键词,并将初始关键词作为预设目标关键词;基于每一个第一隐向量、预设目标关键词以及关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符;或者,当在当前时刻之前,已生成至少一个目标关键词时,则获取已生成的至少一个目标关键词;基于每一个第一隐向量、已生成的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符。
[0013]结合第一方面,在第一方面的第三实施例中,基于每一个第一隐向量、已生成的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符,包括:
[0014]基于每一个第一隐向量和已生成的至少一个目标关键词,生成与所有目标关键词中的每一个目标关键词分别对应的解码向量;从所有的解码向量中筛选出与上一时刻的目标关键词对应的解码向量作为目标解码向量;对目标解码向量作归一化处理;基于归一化处理的结果,从关键词库中筛选出一个候选关键词作为当前时刻的目标关键词;基于已生成的所有目标关键词和输入文本中包含的每一个词汇对应的第一隐向量,生成决策字符。
[0015]结合第一方面,在第一方面的第四实施例中,基于归一化处理的结果,从关键词库中筛选出一个候选关键词作为当前时刻的目标关键词,包括:
[0016]基于归一化处理的结果,获取目标解码向量中包含的每一个元素分别对应的概率值;从所有的概率值中筛选出最大概率值;将关键词库中与最大概率值对应的候选关键词作为当前时刻的目标关键词。
[0017]结合第一方面,在第一方面的第五实施例中,基于已生成的所有目标关键词和输入文本中包含的每一个词汇对应的第一隐向量,生成决策字符,包括:
[0018]基于输入文本中包含的每一个词汇对应的第一隐向量,生成与输入文本对应的第一语义向量;基于已生成的所有目标关键词生成第二语义向量;基于第一语义向量和第二语义向量,确定输入文本与已生成的所有目标关键词的语义相似度;基于语义相似度生成决策字符。
[0019]结合第一方面,在第一方面的第六实施例中,在当决策字符为终止字符时,停止生
成目标关键词的操作,并获取生成的所有目标关键词之后,还包括:
[0020]基于至少一个目标关键词生成与输入文本对应的关键句,关键句用以概括输入文本的含义。
[0021]第二方面,本专利技术提供了一种面向综合治理的关键词生成装置,包括:
[0022]获取模块,用于获取输入文本中包含的每一个词汇对应的第一词向量、预设关键词库中包含的每一个候选关键词对应的第二词向量;确定模块,用于基于每一个词汇对应的第一词向量和每一个候选关键词对应的第二词向量,确定与输入文本中包含的每一个词汇分别对应的第一隐向量;第一生成模块,用于基于每一个第一隐向量、在当前时刻之前获取的至少一个目标关键词以及关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符;控制模块,用于当决策字符为终止字符时,停止生成目标关键词的操作,并获取生成的所有目标关键词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向综合治理的关键词生成方法,其特征在于,包括:获取输入文本中包含的每一个词汇对应的第一词向量、预设关键词库中包含的每一个候选关键词对应的第二词向量;基于所述每一个词汇对应的第一词向量和所述每一个候选关键词对应的第二词向量,确定与所述输入文本中包含的每一个词汇分别对应的第一隐向量;基于每一个所述第一隐向量、在当前时刻之前获取的至少一个目标关键词以及所述关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符;当所述决策字符为终止字符时,停止生成目标关键词的操作,并获取生成的所有目标关键词。2.根据权利要求1所述的面向综合治理的关键词生成方法,其特征在于,所述基于所述每一个词汇对应的第一词向量和所述每一个候选关键词对应的第二词向量,确定与所述输入文本中包含的每一个词汇分别对应的第一隐向量,包括:对所述每一个词汇的第一词向量进行编码,生成与所述每一个词汇对应的第三词向量,所述第三词向量为包含所述每一个词汇的位置信息的词向量,所述位置信息为所述每一个词汇在所述输入文本中的位置信息;基于第一词汇的第三词向量和所述每一个候选关键词对应的第二词向量,确定与所述第一词汇对应的加权平均向量,所述第一词汇为所述输入文本中包含的多个词汇中的任一个;获取预设的第一重置矩阵、预设的第二重置矩阵和预设的重置偏移向量;基于每一个所述第一词汇的第三词向量、所述加权平均向量、所述第一重置矩阵、所述第二重置矩阵和所述重置偏移向量,确定与每一个所述第一词汇对应的第一隐向量。3.根据权利要求1或2所述的面向综合治理的关键词生成方法,其特征在于,所述基于每一个所述第一隐向量、在当前时刻之前获取的至少一个目标关键词以及所述关键词库中包含的每一个候选关键词,生成与当前时刻对应的目标关键词,以及与当前时刻对应的决策字符,包括:当在当前时刻之前,未生成目标关键词时,则获取初始关键词,并将所述初始关键词作为预设目标关键词;基于每一个所述第一隐向量、预设目标关键词以及所述关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符;或者,当在当前时刻之前,已生成至少一个目标关键词时,则获取已生成的至少一个目标关键词;基于所述每一个所述第一隐向量、所述已生成的至少一个目标关键词以及所述关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符。4.根据权利要求3所述的面向综合治理的关键词生成方法,其特征在于,所述基于所述每一个所述第一隐向量、所述已生成的至少一个目标关键词以及所述关键词库中包含的每一个候选关键词,生成当前时刻对应的目标关键词,以及当前时刻对应的决策字符,包括:基于每一个所述第一隐向量和已生成的至少一个目标关键词,生成与所有目标关键词
中的每一个目标关键词分别对应的解...

【专利技术属性】
技术研发人员:肖刚宋彦吴振刚田元贺胡博孔凡尘姜国晨
申请(专利权)人:江西高创保安服务技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1