文本主旨的提取方法、装置、设备及存储介质制造方法及图纸

技术编号:34141772 阅读:54 留言:0更新日期:2022-07-14 17:59
本申请提供一种文本主旨的提取方法、装置、设备及计算机可读存储介质,该方法包括:获取文本信息;基于文本主旨提取模型的向量化网络,对文本信息进行分词及编码处理,得到多个关键词向量;基于向量计算网络,根据各关键词向量确定各关键词向量对应的目标隐藏态向量;基于注意力网络,根据关键词向量对应的目标隐藏态向量确定关键词向量的权重值;基于文本主旨提取模型的主旨确定网络,根据关键词向量和关键词向量的权重值确定文本主旨信息,本申请通过获取关键词向量的隐藏态向量进行主旨的确定,提高了对文本信息的识别精度,从而提升对文本信息主旨提取的准确度。本申请还涉及区块链技术,文本主旨信息可以存储在区块链中。文本主旨信息可以存储在区块链中。文本主旨信息可以存储在区块链中。

【技术实现步骤摘要】
文本主旨的提取方法、装置、设备及存储介质


[0001]本申请涉及自然语言处理的
,尤其涉及一种文本主旨的提取方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]目前人工智能的应用广泛,在金融领域中,可以通过自然语言处理技术对客户提供的语音以及文本进行分析,较为重要的一项是对语音以及文本进行主旨的提取,从而使服务人员能够通过提取到的主旨快速提炼到客户想要表达的信息,并能够过滤掉无关的信息,但在用户提供的语音时间较长或文本字数较多、篇幅较长的情况下,现有的处理方式无法很好的提取出文本主旨,且在提取的过程中容易产生重复的词组和不连贯的词组。

技术实现思路

[0003]本申请的主要目的在于提供一种文本主旨的提取方法、装置、设备及计算机可读存储介质,旨在提高对文本信息的主旨提取的准确性。
[0004]第一方面,本申请提供一种文本主旨的提取方法,所述文本主旨的提取方法包括以下步骤:
[0005]获取文本信息;
[0006]基于训练好的文本主旨提取模型的向量化网络,对所述文本信息进行分词及编码处理,得到多个关键词向量;
[0007]基于所述文本主旨提取模型的向量计算网络,根据各所述关键词向量确定各所述关键词向量对应的目标隐藏态向量;
[0008]基于所述文本主旨提取模型的注意力网络,根据所述关键词向量对应的目标隐藏态向量确定所述关键词向量的权重值;
[0009]基于所述文本主旨提取模型的主旨确定网络,根据所述关键词向量和所述关键词向量的权重值确定文本主旨信息。
[0010]第二方面,本申请还提供一种文本主旨的提取装置,所述文本主旨的提取装置包括:
[0011]信息获取模块,用于获取文本信息;
[0012]向量化处理模块,用于基于训练好的文本主旨提取模型的向量化网络,对所述文本信息进行分词及编码处理,得到多个关键词向量;
[0013]向量计算模块,用于文本主旨提取模型的向量计算网络,根据各所述关键词向量确定各所述关键词向量对应的目标隐藏态向量;
[0014]权重值计算模块,用于基于所述文本主旨提取模型的注意力网络,根据所述关键词向量对应的目标隐藏态向量确定所述关键词向量的权重值;
[0015]文本主旨确定模块,用于基于所述文本主旨提取模型的主旨确定网络,根据所述关键词向量和所述关键词向量的权重值确定文本主旨信息。
[0016]第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的文本主旨的提取方法的步骤。
[0017]第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的文本主旨的提取方法的步骤。
[0018]本申请提供一种文本主旨的提取方法、装置、设备及计算机可读存储介质,本申请通过获取文本信息;基于训练好的文本主旨提取模型的向量化网络,对所述文本信息进行分词及编码处理,得到多个关键词向量;基于所述文本主旨提取模型的向量计算网络,根据各所述关键词向量确定各所述关键词向量对应的目标隐藏态向量;基于所述文本主旨提取模型的注意力网络,根据所述关键词向量对应的目标隐藏态向量确定所述关键词向量的权重值;基于所述文本主旨提取模型的主旨确定网络,根据所述关键词向量和所述关键词向量的权重值确定文本主旨信息,可以通过获取关键词向量的隐藏态向量进行主旨的确定,对于较长的文本信息能够提高提取信息的准确性,从而避免重复提取到同样的词组导致提取的主旨信息可读性不足的问题。
附图说明
[0019]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本申请实施例提供的一种文本主旨的提取方法的流程示意图;
[0021]图2为本申请实施例提供的一种文本主旨的提取方法的场景示意图;
[0022]图3为本申请实施例提供的一种文本主旨的提取装置的示意性框图;
[0023]图4为本申请一实施例涉及的计算机设备的结构示意框图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0026]本申请实施例提供一种文本主旨的提取方法、装置、计算机设备及计算机可读存储介质。其中,该文本主旨的提取方法可应用于终端设备中,该终端设备可以是平板电脑、笔记本电脑、台式电脑等电子设备。也可以应用于服务器中,该服务器可以是单独的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0027]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
[0028]请参照图1,图1为本申请的实施例提供的一种文本主旨的提取方法的流程示意图。
[0029]如图1所示,该文本主旨的提取方法包括步骤S101至步骤S104。
[0030]步骤S101、获取文本信息。
[0031]示例性的,文本信息可以是用户输入的文本信息,文本信息较长的情况下,通过提取文本信息的文本主旨信息能够提升后续的信息获取效率。
[0032]可以理解的,可以获取用户语音,并将用户语音进行文本转化处理,以得到文本信息,具体的,文本转化处理可以通过语音识别技术实现,或其他能够将语音转化为文本的技术实现,在此不予限定。
[0033]可以理解的,还可以通过拍摄图像,并在图像中获取文本信息。
[0034]示例性的,通过获取文本信息,并对文本信息进行文本主旨的提取,能够对文本信息中较为重要的信息进行提取,可以提高他人或其他终端对文本信息获取的效率。
[0035]步骤S102、基于训练好的文本主旨提取模型的向量化网络,对所述文本信息进行分词及编码处理,得到多个关键词向量。
[0036]示例性的,将文本信息输入至文本主旨提取模型中,以使文本主旨提取模型对文本信息的主旨进行提取,以得到文本信息对应的文本主旨信息。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本主旨的提取方法,其特征在于,包括:获取文本信息;基于训练好的文本主旨提取模型的向量化网络,对所述文本信息进行分词及编码处理,得到多个关键词向量;基于所述文本主旨提取模型的向量计算网络,根据各所述关键词向量确定各所述关键词向量对应的目标隐藏态向量;基于所述文本主旨提取模型的注意力网络,根据所述关键词向量对应的目标隐藏态向量确定所述关键词向量的权重值;基于所述文本主旨提取模型的主旨确定网络,根据所述关键词向量和所述关键词向量的权重值确定文本主旨信息。2.如权利要求1所述的文本主旨的提取方法,其特征在于,所述基于所述文本主旨提取模型的主旨确定网络,根据所述关键词向量和所述关键词向量的权重值确定文本主旨信息,包括:基于所述主旨确定网络的主旨向量确定层,根据所述关键词向量和所述关键词向量的权重值确定多个文本主旨词向量;基于所述主旨确定网络的解码层,对所述文本主旨词向量进行解码处理得到文本主旨信息。3.如权利要求2所述的文本主旨的提取方法,其特征在于,所述基于所述文本主旨提取模型的向量计算网络,根据各所述关键词向量确定各所述关键词向量对应的目标隐藏态向量,包括:基于所述向量计算网络的第一隐藏态向量计算层,从多个所述关键词向量的前向方向确定第一向量,从多个所述关键词向量的后向方向确定第二向量,并根据所述第一向量和所述第二向量确定各所述关键词向量的第一隐藏态向量;基于所述向量计算网络的第二隐藏态向量计算层,从多个所述文本主旨词向量的前向方向确定第三向量,从多个所述文本主旨词向量的后向方向确定第四向量,并根据文本主旨词向量与所述关键词向量的关系,所述第三向量和所述第四向量确定各所述关键词向量的第二隐藏态向量;根据所述第一隐藏态向量和所述第二隐藏态向量确定目标隐藏态向量。4.如权利要求2所述的文本主旨的提取方法,其特征在于,所述基于所述主旨确定网络的主旨向量确定层,根据所述关键词向量和所述关键词向量的权重值确定多个文本主旨词向量,包括:基于所述主旨向量确定层,根据所述关键词向量和所述关键词向量的权重值进行预测处理,得到多个文本主旨词向量;所述基于所述主旨确定网络的解码层,对所述文本主旨词向量进行解码处理得到文本主旨信息,包括:基于所述解码层,对所述文本主旨词向量进行线性插值和归一化处理,得到所述文本主旨词向量对应的第二目标权重值;根据所述文本主旨词向量和所述第二目标权重值生成文本主旨向量序列;对所述文本主旨向量序列进行译码处理,得到所述文本主旨信息。
5.如权利要求1

4任一项所述的文本主旨的提取方法,其特征在于,所述基于所...

【专利技术属性】
技术研发人员:袁留君
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1