文本处理方法及装置、智能设备、存储介质、产品制造方法及图纸

技术编号:39280197 阅读:7 留言:0更新日期:2023-11-07 10:54
本申请提供文本处理方法及装置、智能设备、存储介质、产品,该方法包括:获取待处理文本,待处理文本是由目标实体对构成的语句;提取待处理文本的待处理关系特征向量,将待处理关系特征向量输入目标关系识别模型中进行关系识别处理,得到待处理文本中的目标实体对所属的预测关系类别;其中,目标关系识别模型是根据目标损失参数对初始关系识别模型进行参数调整得到;目标损失参数是根据训练特征向量集包括的各个关系特征向量对应的关系标签和关系概率确定的;训练特征向量集包括伪关系特征向量和样本文本的样本关系特征向量,伪关系特征向量是根据至少两个以上的样本文本的样本关系特征向量构造得到。采用上述方法可提升实体关系识别的准确性。实体关系识别的准确性。实体关系识别的准确性。

【技术实现步骤摘要】
文本处理方法及装置、智能设备、存储介质、产品


[0001]本申请涉及人工智能应用
,尤其涉及一种文本处理方法、一种文本处理装置、一种智能设备、一种计算机可读存储介质、一种计算机程序产品。

技术介绍

[0002]实体关系识别,即实体关系抽取,旨在从大规模非结构或半结构的自然语言语句中抽取结构化信息,以确定自然语言语句中的各实体之间的语义关系,可以解决自然语言语句中实体之间分类的问题,也是构建复杂知识库系统的重要基础,如文本摘要、自动问答、机器翻译、搜索引擎、知识图谱等。
[0003]现有业务中的实体关系识别方法只能识别出预定义关系集合中的关系类别,然而随着时间的变化,新的关系类别往往会不断出现,例如,“小月隶属于机构1”中的“隶属于”属于一种未包含在预定义关系集合中的新出现的未知关系类别,现有方法往往会将这种新的未知关系类别错误地识别为预定义关系集合中的已知关系类别,导致实体关系识别的准确率较低。

技术实现思路

[0004]本申请实施例提供了一种文本处理方法及装置、智能设备、存储介质、产品,可提升实体关系识别的准确性。
[0005]一方面,本申请实施例提供了一种文本处理方法,所述方法包括:
[0006]获取待处理文本,所述待处理文本是由目标实体对构成的语句;
[0007]提取所述待处理文本的待处理关系特征向量,并将所述待处理关系特征向量输入目标关系识别模型中进行关系识别处理,得到所述待处理文本中的所述目标实体对所属的预测关系类别;
[0008]其中,所述目标关系识别模型是根据目标损失参数对初始关系识别模型进行参数调整得到;所述目标损失参数是根据训练特征向量集包括的各个关系特征向量对应的关系标签和关系概率确定的,所述关系概率包括所述关系特征向量在各个关系类别上的预测概率,所述关系概率是所述初始关系识别模型对所述关系特征向量进行关系识别处理得到,所述各个关系类别包括已知关系类别和未知关系类别;所述训练特征向量集包括伪关系特征向量和样本文本的样本关系特征向量,所述样本文本是由样本实体对构成的语句,所述样本实体对所属的关系类别为已知关系类别,所述伪关系特征向量是根据两个或两个以上的样本文本的样本关系特征向量构造得到。
[0009]一方面,本申请实施例提供了一种文本处理装置,所述装置包括:
[0010]获取单元,用于获取待处理文本,所述待处理文本是由目标实体对构成的语句;
[0011]处理单元,用于提取所述待处理文本的待处理关系特征向量,并将所述待处理关系特征向量输入目标关系识别模型中进行关系识别处理,得到所述待处理文本中的所述目标实体对所属的预测关系类别;
[0012]其中,所述目标关系识别模型是根据目标损失参数对初始关系识别模型进行参数调整得到;所述目标损失参数是根据训练特征向量集包括的各个关系特征向量对应的关系标签和关系概率确定的,所述关系概率包括所述关系特征向量在各个关系类别上的预测概率,所述关系概率是所述初始关系识别模型对所述关系特征向量进行关系识别处理得到,所述各个关系类别包括已知关系类别和未知关系类别;所述训练特征向量集包括伪关系特征向量和样本文本的样本关系特征向量,所述样本文本是由样本实体对构成的语句,所述样本实体对所属的关系类别为已知关系类别,所述伪关系特征向量是根据两个或两个以上的样本文本的样本关系特征向量构造得到。
[0013]一方面,本申请实施例提供了一种智能设备,该智能设备包括处理器、通信接口和存储器,该处理器、通信接口和存储器相互连接,其中,该存储器存储有计算机程序,该处理器用于调用该计算机程序,执行上述任一可能实现方式的文本处理方法。
[0014]一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现该任一可能实现方式的文本处理方法。
[0015]一方面,本申请实施例还提供了一种计算机程序产品,上述计算机程序产品包括计算机程序或计算机指令,上述计算机程序或计算机指令被处理器执行实现本申请实施例提供的文本处理方法的步骤。
[0016]一方面,本申请实施例还提供了一种计算机程序,上述计算机程序包括计算机指令,上述计算机指令存储在计算机可读存储介质中,智能设备的处理器从上述计算机可读存储介质读取上述计算机指令,上述处理器执行上述计算机指令,实现本申请实施例提供的文本处理方法。
[0017]在本申请实施例中,利用已知关系类别的样本文本的关系特征向量(即样本关系特征向量),来构造伪的未知关系类别的关系特征向量(即伪关系特征向量),并通过样本关系特征向量和伪关系特征向量训练初始关系识别模型,使得目标关系识别模型不仅能正确识别已知关系类别,而且能正确识别新的未知关系类别,在一定程度上能够避免将新关系类别错误地识别为已知关系类别,提升实体关系识别的准确率。
附图说明
[0018]为了更清楚地说明本申请实施例技术方法,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例提供的一种文本处理系统的架构示意图;
[0020]图2为本申请实施例提供的一种模型训练方法的流程示意图;
[0021]图3为本申请实施例提供的另一种模型训练方法的流程示意图;
[0022]图4为本申请实施例提供的一种文本处理方法的流程示意图;
[0023]图5为本申请实施例提供的一种训练效果的效果对比示意图;
[0024]图6为本申请实施例提供的另一种训练效果的效果对比示意图;
[0025]图7为本申请实施例提供的一种文本处理装置的结构示意图;
[0026]图8为本申请实施例提供的一种智能设备的结构示意图。
具体实施方式
[0027]下面将结合本申请实施例中的附图,对本申请实施例中的技术方法进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]本申请中的未知关系类别与现有关系识别任务中的“无关系”类别或“其他关系”类别是不同的,现有关系识别任务中的“无关系”类别或“其他关系”类别在开发阶段是已知的,且它们拥有相应的训练数据,即样本文本对应的关系类别为“无关系”类别或“其他关系”。然而,本申请涉及的未知关系类别表示语句中的实体对属于新的未知的关系,其在开发阶段是未知的,因此,未知关系类别在训练阶段没有对应的训练数据。同时,本申请发现具有未知关系类别的语句与具有已知关系类别的语句可能有相似的表面信息,例如,给定两个样本文本“《甲戌年》提名最佳电视连续剧奖”和“《甲戌年》导演是小兰”,假设“提名”是一个未知关系类别,它对应的样本文本和“导演”(一种已知关系类别)对应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:获取待处理文本,所述待处理文本是由目标实体对构成的语句;提取所述待处理文本的待处理关系特征向量,并将所述待处理关系特征向量输入目标关系识别模型中进行关系识别处理,得到所述待处理文本中的所述目标实体对所属的预测关系类别;其中,所述目标关系识别模型是根据目标损失参数对初始关系识别模型进行参数调整得到;所述目标损失参数是根据训练特征向量集包括的各个关系特征向量对应的关系标签和关系概率确定的,所述关系概率包括所述关系特征向量在各个关系类别上的预测概率,所述关系概率是所述初始关系识别模型对所述关系特征向量进行关系识别处理得到,所述各个关系类别包括已知关系类别和未知关系类别;所述训练特征向量集包括伪关系特征向量和样本文本的样本关系特征向量,所述样本文本是由样本实体对构成的语句,所述样本实体对所属的关系类别为已知关系类别,所述伪关系特征向量是根据两个或两个以上的样本文本的样本关系特征向量构造得到。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取多个样本文本以及每个样本文本对应的已知关系类别,并提取所述每个样本文本的样本关系特征向量;根据所述每个样本文本对应的已知关系类别,确定所述每个样本文本的样本关系特征向量对应的关系标签;在构造所述训练特征向量集中的任一伪关系特征向量时,从所述多个样本文本的样本关系特征向量中选取两个或两个以上的样本关系特征向量,对选取的两个或两个以上的样本关系特征向量进行构造处理,得到伪关系特征向量;根据未知关系类别确定所述伪关系特征向量对应的关系标签。3.根据权利要求2所述的方法,其特征在于,选取的样本关系特征向量为两个,包括第一样本关系特征向量和第二样本关系特征向量;所述对选取的两个或两个以上的样本关系特征向量进行构造处理,得到伪关系特征向量,包括:从第一数值区间中选取第一系数,并根据设定参数与所述第一系数之间的差值确定第二系数;采用所述第一系数对所述第一样本关系特征向量进行变换处理,以及采用所述第二系数对所述第二样本关系特征向量进行变换处理;将变换处理后的第一样本关系特征向量和变换处理后的第二样本关系特征向量进行融合处理,生成伪关系特征向量。4.根据权利要求2所述的方法,其特征在于,选取的样本关系特征向量为两个,包括第一样本关系特征向量和第二样本关系特征向量,所述第一样本关系特征向量和所述第二样本关系特征向量的维度信息相同;所述对选取的两个或两个以上的样本关系特征向量进行构造处理,得到伪关系特征向量,包括:从第二数值区间中选取第三系数,并根据所述第三系数和所述维度信息确定目标参数,所述目标参数用于指示替换长度或者替换维度数;
根据所述目标参数从所述第一样本关系特征向量中确定替换位置;将所述第一样本关系特征向量中所述替换位置对应的原始向量元素替换为目标向量元素,得到伪关系特征向量,所述目标向量元素为所述第二样本关系特征向量中的向量元素,且所述目标向量元素在所述第二样本关系特征向量中的位置与所述替换位置相匹配。5.根据权利要求4所述的方法,其特征在于...

【专利技术属性】
技术研发人员:刘庆斌郝彦超陈曦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1