知识表示模型训练及知识表示方法、装置及设备和介质制造方法及图纸

技术编号：39004115 阅读：10 留言：0更新日期：2023-10-07 10:35

本发明专利技术提供知识表示模型训练及知识表示方法、装置及设备和介质，包括：获取初始知识表示模型及训练数据集；将训练数据集输入初始知识表示模型，得到第一预测结果及第一预测结果对应的标签向量；将第一预测结果输入初始知识表示模型，得到第二预测结果；基于第一预测结果及其对应的标签向量以及第二预测结果，计算得到损失函数值；基于损失函数值，对初始知识表示模型进行更新，并返回将训练数据集输入初始知识表示模型，得到第一预测结果及第一预测结果对应的标签向量的步骤，直至损失函数值满足预设损失函数值要求，得到目标知识表示模型。在不引入复杂的老师模型的前提下实现知识蒸馏，减少计算资源消耗和运存占用。减少计算资源消耗和运存占用。减少计算资源消耗和运存占用。

全部详细技术资料下载

【技术实现步骤摘要】
知识表示模型训练及知识表示方法、装置及设备和介质

[0001]本专利技术涉及人工智能领域，具体涉及知识表示模型训练及知识表示方法、装置及设备和介质。

技术介绍

[0002]知识图谱是人工智能的重要分支技术，是结构化的语义知识库，以符号形式描述物理世界中的概念及其相互关系，其基本组成单位是“实体—关系—实体”三元组，以及实体及其相关属性—值对，实体间通过关系相互联结，构成网状的知识结构。人工或者半自动构建的知识图谱大多是不完整的、稀疏的，存在很多没有被挖掘出来的隐含信息。知识表示模型能够挖掘知识图谱中的隐含信息，其关键思想是学习知识库中的实体和关系的向量化表示，将实体和关系转化到连续的向量空间中，同时保留知识图谱中的结构信息。这些实体和关系的向量化表示能进一步应用于各种任务中。
[0003]相关技术中，知识表示模型会通过增加实体和关系向量化的维度来获得更好的模型表现，但是随着维度的提高，模型的参数量也会提高，同时增加了训练时间，模型的性能提升越来越不明显，模型训练的资源消耗水涨船高，提升性能所带来的代价也越来越大。

技术实现思路

[0004]因此，本专利技术要解决的技术问题在于克服现有技术中的知识表示模型训练资源消耗过高的缺陷，从而提供知识表示模型训练及知识表示方法、装置及设备和介质。
[0005]结合第一方面，本专利技术提供一种知识表示模型训练方法，所述方法包括：
[0006]获取初始知识表示模型及训练数据集，所述训练数据集包括：若干三元组样本；
[0007]将所述训练...

【技术保护点】

【技术特征摘要】
1.一种知识表示模型训练方法，其特征在于，所述方法包括：获取初始知识表示模型及训练数据集，所述训练数据集包括：若干三元组样本；将所述训练数据集输入所述初始知识表示模型，得到第一预测结果及第一预测结果对应的标签向量，所述标签向量用于表征第一预测结果中训练数据集中每个三元组样本对应预测结果的有效性，所述预测结果包括正确的三元组数据集，正确的三元组的得分及排名；将所述第一预测结果输入所述初始知识表示模型，得到第二预测结果；基于所述第一预测结果及其对应的标签向量以及所述第二预测结果，计算得到损失函数值；基于所述损失函数值，对所述初始知识表示模型进行更新，并返回将所述训练数据集输入所述初始知识表示模型，得到第一预测结果及第一预测结果对应的标签向量的步骤，直至所述损失函数值满足预设损失函数值要求，得到目标知识表示模型。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一预测结果及其对应的标签向量以及所述第二预测结果，计算得到损失函数值，包括：基于所述第一预测结果及其对应的标签向量，计算得到第一损失；基于所述第一预测结果及所述第二预测结果，计算得到第二损失；基于所述第一损失及所述第二损失，计算得到损失函数值。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一预测结果及其对应的标签向量，计算得到第一损失，包括：设置第一蒸馏温度为1，基于所述第一蒸馏温度，对所述第一预测结果及其对应的标签向量进行交叉熵计算，得到所述第一损失；所述第一损失的计算公式如下：所述第一损失的计算公式如下：其中，为所述第一预测结果，y
i
为所述第一预测结果对应的标签向量，L
Hard
为所述第一损失，τ为所述第一蒸馏温度。4.根据权利要求2所述的方法，其特征在于，所述基于所述第一预测结果及所述第二预测结果，计算得到第二损失，包括：设置第二蒸馏温度为大于1的正整数，基于所述第二蒸馏温度，对所述第一预测结果及所述第二预测结果进行相对熵计算，得到第二损失；所述第二损失的计算公式如下：其中，为所述第一预测结果，为所述第二预测结果，L
Soft
为所述第二损失，τ
为所述第二蒸馏温度。5.根据权利要求2所述的方法，其特征在于，所述基于所述第一损失及所述第二损失，计算得到损失函数值，包括：设置平衡系数，基于所述第一损失、所述第二损失及所述平衡系数，计算得到损失函数值；所述损失函数值的计算公式如下：L＝L
Hard
+*
...

【专利技术属性】
技术研发人员：陶建华，徐浩天，杨国花，张大伟，
申请(专利权)人：启元实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人