【技术实现步骤摘要】
一种面向知识图谱表示学习训练的局部训练方法
本专利技术属于计算机知识图谱
,涉及一种面向知识图谱表示学习训练的局部训练方法,具体涉及一种考虑到知识图谱持续变化的动态表示学习训练方法。
技术介绍
知识图谱是一种由实体作为点,实体与实体之间的关系作为边而组成的图。自从2012年Google推出自己第一版知识图谱以来,知识图谱快速发展。知识图谱可以向外提供查询能力和推理能力,在社交网络、金融、医疗、反欺诈、企业关系分系等众多领域都得到了应用。而由于图搜索算法的高复杂性,当图谱中的数据量不断增大到一定程度后,图谱中的计算效率就会降低,同时数据稀疏问题也为图算法带来了困难。表示学习旨在将研究对象的语义信息表示为稠密低维实值向量,知识表示学习则面向知识库中的实体和关系进行表示学习。知识表示学习的出现很好地避免了图搜索算法的高复杂度问题,可以在低维空间中高效计算实体和关系的语义联系,有效解决数据稀疏问题,使知识获取、融合和推理的性能得到显著提升。然而,知识图谱并不是一成不变的。随着新的知识不断加入到知识图谱,以及对于 ...
【技术保护点】
1.一种面向知识图谱表示学习训练的局部训练方法,其特征在于所述方法包括如下步骤:/n步骤S1、获取知识图谱训练数据:/n读取系统中存储的知识图谱数据,并以训练所需的特定数据格式存储;/n步骤S2、计算训练所应使用的向量空间维度:/n获取知识图谱中实体数量,利用知识图谱规模与所应使用向量空间维度的关系的数学表达式计算出本次训练所应使用的向量空间维度;/n步骤S3、判断是否可以通过调整原有模型得到新模型:/n判断此次训练是否可以在原有模型的基础上进行训练,还是需要重新训练得到模型;/n步骤S4、模型训练:/n通过训练得到变化后知识图谱的表示学习模型;/n步骤S5、模型与数据存储 ...
【技术特征摘要】
1.一种面向知识图谱表示学习训练的局部训练方法,其特征在于所述方法包括如下步骤:
步骤S1、获取知识图谱训练数据:
读取系统中存储的知识图谱数据,并以训练所需的特定数据格式存储;
步骤S2、计算训练所应使用的向量空间维度:
获取知识图谱中实体数量,利用知识图谱规模与所应使用向量空间维度的关系的数学表达式计算出本次训练所应使用的向量空间维度;
步骤S3、判断是否可以通过调整原有模型得到新模型:
判断此次训练是否可以在原有模型的基础上进行训练,还是需要重新训练得到模型;
步骤S4、模型训练:
通过训练得到变化后知识图谱的表示学习模型;
步骤S5、模型与数据存储:
将训练得到的模型和训练数据进行存储。
2.根据权利要求1所述的面向知识图谱表示学习训练的局部训练方法,其特征在于所述步骤S1的具体步骤如下:
知识图谱以三元组的形式在Neo4j图数据库中存储,首先读取Neo4j数据库中的知识图谱数据,将知识图谱数据以训练所需的特定格式存储为文件,共包含以下几个文件:1)实体与实体id映射文件;2)关系与关系id映射文件;3)以id表示的三元组训练集;4)以id表示的三元组验证集;5)以id表示的三元组测试集。
3.根据权利要求1所述的面向知识图谱表示学习训练的局部训练方法,其特征在于所述步骤S3的具体步骤如下:
(1)判断此次训练是否是在该数据上进行的第一次训练,若此次训练是在该数据上进行的第一次训练,则需要从零开始训练得到表示学习模型,否则进入步骤S3(2)判断;
(2)判断该数据是否可以在原有模型所使用的向量空间维度中进行训练,...
【专利技术属性】
技术研发人员:涂志莹,万博,刘明义,王忠杰,徐晓飞,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙江;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。