【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种实体关系识别的方法和装置。
技术介绍
1、现有的基于自然语言处理的实体关系识别场景中,在进行数据标注时,通常会先对原始数据进行清洗后,根据特定领域的关系和实体对数据集进行标注,以作为后续神经网络模型训练的训练集数据和测试集数据。但是在现有的实体关系识别场景中,通常只标注出实体和关系,在后续的神经网络模型训练中,若出现了同名实体,则会导致在神经网络的损失函数计算过程中产生偏差,影响神经网络的准确率和收敛速度,从而导致实体关系识别结果不够准确。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种实体关系识别的方法和装置,能够在对文本序列实体关系进行标注时,将实体标注与位置标注结合起来一起标注,从而大幅简化实体标注过程,为神经网络的学习提供位置编码信息,提高实体关系识别的准确率和神经网络的收敛速度。
2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种实体关系识别的方法,包括:
3、结合实体在文本序列中的位置对所述文本序列中的
...【技术保护点】
1.一种实体关系识别的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,结合实体在文本序列中的位置对所述文本序列中的实体关系进行标注,包括:
3.根据权利要求2所述的方法,其特征在于,所述位置编码信息为所述同名实体在所述文本序列中出现的次数序号。
4.根据权利要求2或3所述的方法,其特征在于,基于所述特征向量进行模型训练,得到实体关系识别模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述模型为深度学习神经网络模型。
6.根据权利要求1所述的方法,其特征在于,对标注后的文本序列进行特
...【技术特征摘要】
1.一种实体关系识别的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,结合实体在文本序列中的位置对所述文本序列中的实体关系进行标注,包括:
3.根据权利要求2所述的方法,其特征在于,所述位置编码信息为所述同名实体在所述文本序列中出现的次数序号。
4.根据权利要求2或3所述的方法,其特征在于,基于所述特征向量进行模型训练,得到实体关系识别模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述模型为深度学习神经网络模型。
【专利技术属性】
技术研发人员:张雷,赵新宇,邱小霞,
申请(专利权)人:中国人民银行数字货币研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。