关键信息提取模型的训练方法、提取方法、设备及介质技术

技术编号:30140584 阅读:11 留言:0更新日期:2021-09-23 15:02
本申请适用于数据处理技术领域,提供了一种关键信息提取模型的训练方法、提取方法、设备及介质,该训练方法包括:获取训练文本,确定训练文本中的关系词在训练文本中的第一位置;基于第一位置,确定训练文本中的实施词的第一信息,基于第一位置和第一信息,得到交叉熵损失函数,基于交叉熵损失函数更新关键信息提取模型中的参数,得到训练后的关键信息提取模型;本申请利用多个参数确定交叉熵损失函数可以使得到的训练后的关键信息提取模型更准确,使关键信息提取模型提取的关键信息更准确。使关键信息提取模型提取的关键信息更准确。使关键信息提取模型提取的关键信息更准确。

【技术实现步骤摘要】
关键信息提取模型的训练方法、提取方法、设备及介质


[0001]本申请属于数据处理
,尤其涉及一种关键信息提取模型的训练方法、关键信息的提取方法、终端设备及计算机可读存储介质。

技术介绍

[0002]文本的关键信息可以反映文本的主要内容,准确查找文本的关键信息可以准确反映文本的内容。
[0003]目前,提取文本的关键信息多采用深度学习模型,通过深度学习模型提取文本的关键信息。但是目前使用深度学习模型提取的关键信息存在不够准确的缺点,因此,如何提高深度学习模型的准确度是目前需要解决的问题。

技术实现思路

[0004]本申请实施例提供了一种关键信息提取模型的训练方法、关键信息的提取方法、终端设备及计算机可读存储介质,可以解决深度学习模型提取的关键信息不准确的问题。
[0005]第一方面,本申请实施例提供了一种关键信息提取模型的训练方法,包括:
[0006]获取训练文本;
[0007]确定所述训练文本中的关系词在所述训练文本中的第一位置;
[0008]基于所述第一位置,确定所述训练文本中的实施词的第一信息,其中,所述实施词为与所述关系词存在第一预设关系的词和/或与所述关系词存在第二预设关系的词,所述第一信息包括所述实施词在所述训练文本中的位置及所述实施词与所述关系词的关系;
[0009]基于所述第一位置和所述第一信息,得到交叉熵损失函数;
[0010]基于所述交叉熵损失函数更新所述关键信息提取模型中的参数,得到训练后的关键信息提取模型。
[0011]第二方面,本申请实施例提供了一种关键信息的提取方法,应用于上述第一方面所述关键信息提取模型的训练方法得到的训练后的关键信息提取模型,包括:
[0012]获取待处理文本;
[0013]基于所述训练后的关键信息提取模型,得到所述待处理文本的关键信息。
[0014]第三方面,本申请实施例提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述的关键信息提取模型的训练方法,和/或实现上述第二方面中任一项所述的关键信息的提取方法。
[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的关键信息提取模型的训练方法,和/或实现上述第二方面中任一项所述的关键信息的提取方法。
[0016]第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端
设备上运行时,使得终端设备执行上述第一方面中任一项所述的关键信息提取模型的训练方法,和/或实现上述第二方面中任一项所述的关键信息的提取方法。
[0017]可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
[0018]本申请实施例与现有技术相比存在的有益效果是:本申请首先获取训练文本,并确定训练文本中关系词在训练文本中的第一位置,基于第一位置,确定训练文本中的实施词的第一信息,其中,实施词为与关系词存在第一预设关系的词和/或与关系词存在第二预设关系的词,第一信息包括实施词在训练文本中的位置及实施词与关系词的关系,基于第一位置和第一信息,得到交叉熵损失函数,基于交叉熵损失函数更新关键信息提取模型中的参数,得到训练后的关键信息提取模型,本申请利用关系词的第一位置、实施词的第二位置和实施词与关系词的关系确定交叉熵损失函数,利用交叉熵损失函数更新待训练的关键信息提取模型中的参数,得到训练后的关键信息提取模型,本申请利用多个参数确定交叉熵损失函数可以使得到的训练后的关键信息提取模型更准确,使关键信息提取模型提取的关键信息更准确。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请一实施例提供的关键信息提取模型的训练方法的应用场景示意图;
[0021]图2是本申请一实施例提供的关键信息提取模型的训练方法的流程示意图;
[0022]图3是本申请一实施例提供的实施词的第一信息的确定方法的流程示意图;
[0023]图4是本申请一实施例提供的关系结果张量的示意图;
[0024]图5是本申请一实施例提供的交叉熵损失函数的确定方法的流程示意图;
[0025]图6是本申请一实施例提供的关键信息的提取方法的流程示意图;
[0026]图7是本申请一实施例提供的终端设备的结构示意图。
具体实施方式
[0027]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0028]应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0029]还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0030]如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下
文被解释为“当
……
时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0031]另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0032]在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0033]图1为本申请实施例提供的关键信息提取模型的训练方法的应用场景示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关键信息提取模型的训练方法,其特征在于,包括:获取训练文本;确定所述训练文本中的关系词在所述训练文本中的第一位置;基于所述第一位置,确定所述训练文本中的实施词的第一信息,其中,所述实施词为与所述关系词存在第一预设关系的词和/或与所述关系词存在第二预设关系的词,所述第一信息包括所述实施词在所述训练文本中的第二位置及所述实施词与所述关系词的关系;基于所述第一位置和所述第一信息,得到交叉熵损失函数;基于所述交叉熵损失函数更新关键信息提取模型中的参数,得到训练后的关键信息提取模型。2.如权利要求1所述的关键信息提取模型的训练方法,其特征在于,所述确定所述训练文本中的关系词在所述训练文本中的第一位置,包括:确定所述关系词在所述训练文本中的头位置和尾位置,所述第一位置包括所述头位置和所述尾位置,其中,所述关系词为词性为动词的词。3.如权利要求2所述的关键信息提取模型的训练方法,其特征在于,所述确定所述关系词在所述训练文本中的头位置和尾位置,包括:确定所述关系词的头位置的向量和尾位置的向量。4.如权利要求3所述的关键信息提取模型的训练方法,其特征在于,所述基于所述第一位置,确定所述训练文本中的实施词的第一信息,包括:计算所述头位置的向量和所述尾位置的向量的平均向量;基于所述平均向量,确定所述实施词的第一信息,其中,所述第一预设关系为主谓关系,和/或与所述第二预设关系为动宾关系。5.如权利要求4所述的关键信息提取模型的训练方法,其特征在于,在所述基于所述平均向量,确定所述实施词的第一信息之后,包括:基于所述实施词的第一信息,得到所述实施词的关系结果张量。6.如权利要求5所述的关键信息提取模型...

【专利技术属性】
技术研发人员:陈凯徐冰汪伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1