【技术实现步骤摘要】
一种自然语言处理方法、装置、设备及可读存储介质
[0001]本申请涉及计算机
,特别涉及一种自然语言处理方法、装置、设备及可读存储介质。
技术介绍
[0002]目前可以为BERT模型的输入数据扩充相关信息,但扩充的信息会影响模型对输入数据的判别,导致处理结果精度下降。当前以各种策略来提高扩充信息的选择精度,但这样仍不能有效降低扩充信息对原输入数据的消极影响。
[0003]因此,如何有效降低扩充信息对原输入数据的消极影响,是本领域技术人员需要解决的问题。
技术实现思路
[0004]有鉴于此,本申请的目的在于提供一种自然语言处理方法、装置、设备及可读存储介质,以有效降低扩充信息对原输入数据的消极影响。其具体方案如下:第一方面,本申请提供了一种自然语言处理方法,包括:获取待处理的目标语句,并确定所述目标语句中的各实体;针对所述目标语句中的每个实体,若该实体存在于预设实体集中,则为该实体确定扩充信息,并将所确定的扩充信息添加至该实体在所述目标语句中所处位置之后,得到更新后的目标语句;将所述更新后的目标语 ...
【技术保护点】
【技术特征摘要】
1.一种自然语言处理方法,其特征在于,包括:获取待处理的目标语句,并确定所述目标语句中的各实体;针对所述目标语句中的每个实体,若该实体存在于预设实体集中,则为该实体确定扩充信息,并将所确定的扩充信息添加至该实体在所述目标语句中所处位置之后,得到更新后的目标语句;将所述更新后的目标语句输入BERT模型,以使所述BERT模型执行自然语言处理任务;其中,在所述BERT模型执行自然语言处理任务的过程中,将所述目标语句中的任一实体的扩充信息与所述目标语句中的其他实体的注意力得分调整为零。2.根据权利要求1所述的方法,其特征在于,所述为该实体确定扩充信息,包括:将该实体作为目标对象,并在所述预设实体集中确定与所述目标对象存在关系的实体组;在所述实体组中选择关系概率值大于第一阈值的实体,并基于所选择的实体生成所述目标对象的扩充信息。3.根据权利要求2所述的方法,其特征在于,所述在所述预设实体集中确定与所述目标对象存在关系的实体组,包括:生成用于表示所述预设实体集中各实体间关系及关系概率值的N
×
N
×
M维张量;N为所述预设实体集包括的实体个数,M为所述预设实体集中不同实体间的关系个数;基于所述N
×
N
×
M维张量生成知识图谱,并在所述知识图谱中查询与所述目标对象存在关系的实体组。4.根据权利要求3所述的方法,其特征在于,所述生成用于表示所述预设实体集中各实体间关系及关系概率值的N
×
N
×
M维张量,包括:生成由N
×
N
×
M维全0构成的初始张量;获取用于生成所述预设实体集的语句库,并遍历所述语句库中的每个句子,将遍历到的句子作为待识别句子;将所述待识别句子中相邻的两个实体作为实体组,得到多个实体组;利用关系识别模型识别每个实体组中的两个实体间的关系,得到多个M维关系向量;针对每个M维关系向量,若任一M维关系向量中的最大数值大于第二阈值,则将所述最大数值在所述初始张量中对应位置的元素由0更新为1,以更新所述初始张量;遍历所述语句库中的下一个句子,并继续更新当前张量,直至所述语句库中的每个句子均已被遍历,则输出并优化当前得到的张量,以得到所述N
×
N
×
M维张量。5.根据权利要求4所述的方法,其特征在于,所述利用关系识别模型识别每个实体组中的两个实体间的关系,得到多个M维关系向量,包括:针对任一实体组中的两个实体,将所述待识别句子中的这两个实体用不同标识符进行替换,将替换得到的新句子输入所述关系识别模型,以使所述关系识别模型输出这两个实体对应的M维关系向量。6.根据权利要求4所述的方法,其特征在于,所述优化当前得到的张量,以得到所述N
×
N
×
M维张量,包括:将当前得到的张量作为初始三维矩阵,将所述初始三维矩阵分解为M个N
×
N维的矩阵X
i
;i=1,2,
……
,M;
将初始化得到的d
×
d
×
M维张量O分解为M个d
×
d维的矩阵O
i
;d为可调超参数;初始化得到N
×
d维的矩阵A,并基于X
i
=AO
i
A
T
【专利技术属性】
技术研发人员:王立,赵雅倩,范宝余,李仁刚,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。