候选实体生成模型训练方法及装置制造方法及图纸

技术编号:32186431 阅读:48 留言:0更新日期:2022-02-08 15:50
本申请提供候选实体生成模型训练方法及装置,其中所述候选实体生成模型训练方法包括:接收训练样本,训练样本包括实体样本和实体描述文本样本;将实体样本和实体描述文本样本分别输入至特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;将实体特征向量和文本特征向量分别输入至池化层进行池化处理,获得实体嵌入向量和文本嵌入向量;确定实体嵌入向量和文本嵌入向量之间的相似度,根据相似度计算损失值;根据损失值调整候选实体生成模型的参数,继续训练候选实体生成模型,直至达到训练停止条件,得到完成训练的候选实体生成模型。节省了大量的人力物力,能够有效解决未登录词的问题,操作简单高效,提高了候选实体生成的准确率。选实体生成的准确率。选实体生成的准确率。

【技术实现步骤摘要】
候选实体生成模型训练方法及装置


[0001]本申请涉及计算机
的人工智能领域,特别涉及一种候选实体生成模型训练方法。本申请同时涉及一种候选实体生成模型训练装置、一种候选实体生成方法、一种候选实体生成装置、一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]人工智能(artificial intelligence;AI)是指已工程化(即设计并制造)的系统感知环境的能力,以及获取、处理、应用和表示知识的能力。人工智能领域关键技术的发展状况,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。随着计算机技术的发展,自然语言处理(Natural Language Processing)领域和知识图谱领域也得到了快速发展。自然语言处理研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在对自然语言进行处理时,为了更好地理解文本,需要对文本对应的知识图谱进行确定,即对文本中的实体进行识别,并将文本中的实体名称与知识库中的实体相对应,即需要进行实体链接工作。实体链接通常包含两个模块:候选实体生成和候选实体排序。候选实体生成,作为实体链接任务中的第一道门槛,对实体链接的重要性不言而喻。
[0003]现有技术中,一般先人工构建同义词典、别名词典和缩写全称映射词典等维护词典,再根据文本中的实体名称直接匹配到候选实体;或者人工设计规则,通过启发式模式匹配候选实体。但是基于词典匹配的方法,需要人工查找同义词、别名、缩写等国家词典,浪费人力物力,且无法处理未登录词问题;基于规则启发的方法,需要专心设计大量规则,且构建成本较大、费时费力。因此,亟需一种有效的方案以解决上述问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种候选实体生成模型训练方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种候选实体生成模型训练装置、一种候选实体生成方法、一种候选实体生成装置、一种计算设备,以及一种计算机可读存储介质。
[0005]根据本申请实施例的第一方面,提供了一种候选实体生成模型训练方法,所述候选实体生成模型包括特征提取层和池化层,所述方法包括:
[0006]接收训练样本,所述训练样本包括实体样本和实体描述文本样本;
[0007]将所述实体样本和所述实体描述文本样本分别输入至所述特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;
[0008]将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,
获得实体嵌入向量和文本嵌入向量;
[0009]确定所述实体嵌入向量和所述文本嵌入向量之间的相似度,根据所述相似度计算损失值;
[0010]根据本申请实施例的第二方面,提供了一种候选实体生成方法,包括:
[0011]获取至少一个实体描述文本和实体库,所述实体库中包含多个实体;
[0012]将所述至少一个实体描述文本和所述实体库分别输入至候选实体生成模型,获得所述至少一个实体描述文本分别与各实体的相似度,所述候选实体生成模型是通过所述候选实体生成模型训练方法训练得到的;
[0013]将与各实体描述文本的相似度高于相似度阈值的实体分别确定为各实体描述文本的候选实体。
[0014]根据本申请实施例的第三方面,提供了一种候选实体生成模型训练装置,所述候选实体生成模型包括特征提取层和池化层,所述候选实体生成模型训练装置包括:
[0015]接收模块,被配置为接收训练样本,所述训练样本包括实体样本和实体描述文本样本;
[0016]特征提取模块,被配置为将所述实体样本和所述实体描述文本样本分别输入至所述特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;
[0017]池化模块,被配置为将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,获得实体嵌入向量和文本嵌入向量;
[0018]计算模块,被配置为确定所述实体嵌入向量和所述文本嵌入向量之间的相似度,根据所述相似度计算损失值;
[0019]训练模块,被配置为根据所述损失值调整所述候选实体生成模型的参数,返回执行所述将所述实体样本和所述描述文本样本分别输入至所述特征提取层进行特征提取处理的步骤,直至达到训练停止条件,得到完成训练的候选实体生成模型。
[0020]根据本申请实施例的第四方面,提供了一种候选实体生成装置,包括:
[0021]获取模块,被配置为获取至少一个实体描述文本和实体库,所述实体库中包含多个实体;
[0022]输入模块,被配置为将所述至少一个实体描述文本和所述实体库分别输入至候选实体生成模型,获得所述至少一个实体描述文本分别与各实体的相似度,所述候选实体生成模型是通过所述候选实体生成模型训练方法训练得到的;
[0023]确定模块,被配置为将与各实体描述文本的相似度高于相似度阈值的实体分别确定为各实体描述文本的候选实体。
[0024]根据本申请实施例的第五方面,提供了一种,包括:
[0025]存储器和处理器;
[0026]所述存储器用于存储计算机可执行指令,所述处理器执行所述计算机可执行指令时实现所述候选实体生成模型训练方法或者所述候选实体生成方法的步骤。
[0027]根据本申请实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述候选实体生成模型训练方法或者所述候选实体生成方法的步骤。
[0028]根据本申请实施例的第七方面,提供了一种芯片,其存储有计算机指令,该计算机
指令被芯片执行时实现所述候选实体生成模型训练方法或者所述候选实体生成方法的步骤。
[0029]本申请提供的候选实体生成模型训练方法,通过接收训练样本,所述训练样本包括实体样本和实体描述文本样本;将所述实体样本和所述实体描述文本样本分别输入至所述特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,获得实体嵌入向量和文本嵌入向量;确定所述实体嵌入向量和所述文本嵌入向量之间的相似度,根据所述相似度计算损失值;根据所述损失值调整所述候选实体生成模型的参数,返回执行所述将所述实体样本和所述描述文本样本分别输入至所述特征提取层进行特征提取处理的步骤,直至达到训练停止条件,得到完成训练的候选实体生成模型。该候选实体生成模型训练方法,避免了人工构建词典、设计规则的过程,节省了大量的人力物力,能够有效解决未登录词的问题,同时方便快捷,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种候选实体生成模型训练方法,其特征在于,所述候选实体生成模型包括特征提取层和池化层,所述方法包括:接收训练样本,所述训练样本包括实体样本和实体描述文本样本;将所述实体样本和所述实体描述文本样本分别输入至所述特征提取层进行特征提取处理,获得实体特征向量和文本特征向量;将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,获得实体嵌入向量和文本嵌入向量;确定所述实体嵌入向量和所述文本嵌入向量之间的相似度,根据所述相似度计算损失值;根据所述损失值调整所述候选实体生成模型的参数,返回执行所述将所述实体样本和所述描述文本样本分别输入至所述特征提取层进行特征提取处理的步骤,直至达到训练停止条件,得到完成训练的候选实体生成模型。2.根据权利要求1所述的方法,其特征在于,所述特征提取层包括结构、参数类型与参数数量均相同的第一子特征提取层和第二子特征提取层;所述将所述实体样本和所述实体描述文本样本分别输入至所述特征提取层进行特征提取处理,获得实体特征向量和文本特征向量,包括:将所述实体样本输入至所述第一子特征提取层进行特征提取处理,获得所述实体特征向量;将所述实体描述文本样本输入至所述第二子特征提取层进行特征提取处理,获得所述文本特征向量。3.根据权利要求1或2所述的方法,其特征在于,所述池化层包括结构、参数类型与参数数量均相同的第一子池化层和第二子池化层;所述将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,获得实体嵌入向量和文本嵌入向量,包括:将所述实体特征向量输入至所述第一子池化层进行池化处理,获得所述实体嵌入向量;将所述文本特征向量输入至所述第二子池化层进行池化处理,获得所述文本嵌入向量。4.根据权利要求1所述的方法,其特征在于,所述将所述实体特征向量和所述文本特征向量分别输入至所述池化层进行池化处理,获得实体嵌入向量和文本嵌入向量,包括:将所述实体特征向量和所述文本特征向量分别输入至所述池化层,利用所述池化层的平均池化策略,获得平均池化处理后的实体嵌入向量和文本嵌入向量;相应地,所述确定所述实体嵌入向量和所述文本嵌入向量之间的相似度,包括:利用余弦相似度计算方法,计算所述实体嵌入向量和所述文本嵌入向量之间的相似度。5.根据权利要求1所述的方法,其特征在于,所述根据所述相似度计算损失值,包括:将所述相似度与预设的目标值进行绝对值误差计算,得到所述相似度的损失值。6.根据权利要求5所述的方法,其特征在于,所述训练样本包括正样本和负样本,所述正样本包括实体样本和所述实体样本对应的实体描述文本样本,所述负样本包括实体样本
和所述实体样本非对应的实体描述文本样本;所述将所述相似度与预设的目标值进行绝对值误差计算,得到所述相似度的损失值,包括:在所述训练样本为正样本的情况下,将所述相似度与...

【专利技术属性】
技术研发人员:王得贤李长亮
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1