一种融合超平面和持续时间建模的时间感知知识表示学习方法技术

技术编号：23315212 阅读：27 留言：0更新日期：2020-02-11 17:50

本发明专利技术克服了现有时间感知的知识图谱嵌入方法不能学习同类知识的持续时长分布规律的问题，提出了一种融合超平面和持续时间建模的时间感知知识表示学习方法。该方法通过对知识图谱中每种关系事件进行分类和对持续型知识持续时间建模，计算知识的有效可信度，然后将有效可信度作为训练权重，改进知识图谱嵌入表示学习过程，得到知识图谱的嵌入模型。通过有效可信度的计算和在嵌入表示学习中的加权训练，使得到的模型可以学习同类知识的持续时长分布规律，从而提升知识图谱实体和关系链接预测任务的准确率。此方法可以用于改进时间感知的知识图谱嵌入表示效果，提升知识图谱链接预测的准确率。

A time aware knowledge representation learning method based on hyperplane and duration modeling

全部详细技术资料下载

【技术实现步骤摘要】
一种融合超平面和持续时间建模的时间感知知识表示学习方法
本专利技术涉及一种知识图谱，特别是涉及知识图谱的嵌入表示方法，主要适用于时间感知的知识图谱链接预测，通过改进知识图谱的嵌入表示方法，提升时间感知的知识图谱链接预测准确度。
技术介绍
知识图谱是将人类知识结构化存储的知识系统，其本质是具有有向图结构的知识库，是一种通用的语义知识的形式化描述框架。知识表示学习[1]是知识获取与应用的基础，是贯穿知识图谱构建与应用全过程的重要问题。传统的结构化三元组表示形式虽具有很强的表达能力，但是难以直接利用计算机做语义计算。而嵌入表示方法将知识图谱中的离散符号(实体、属性、关系、值等)用连续型数值表示，直接体现语义信息，可以高效的计算实体、关系及其复杂的语义关联，极大地提高知识图谱语义计算的效率。目前知识的嵌入表示方法大致可以分为：基于张量、基于翻译等。基于张量的方法：该类方法利用张量表示知识，使用张量分解或张量乘法进行知识表示学习，优点是在编码实体和关系的过程中综合了整个知识图谱的信息，具有较强的表达能力。由于张量分解重...

【技术保护点】
1.融合超平面和持续时间建模的时间感知知识表示学习方法，其特征在于：/n1)基于知识图谱的嵌入表示方法，时间以超平面的法向量表示；/n2)按照持续时长定义了瞬时型关系和持续型关系；/n3)定义了知识的有效可信度，持续时间建模计算知识的有效可信度；/n4)对时间感知的知识表示学习算法进行了优化。/n

【技术特征摘要】
1.融合超平面和持续时间建模的时间感知知识表示学习方法，其特征在于：
1)基于知识图谱的嵌入表示方法，时间以超平面的法向量表示；
2)按照持续时长定义了瞬时型关系和持续型关系；
3)定义了知识的有效可信度，持续时间建模计算知识的有效可信度；
4)对时间感知的知识表示学习算法进行了优化。

2.如权利要求1所述的融合超平面和持续时间建模的时间感知知识表示学习方法，其特征在于基于知识图谱的嵌入表示方法，时间以超平面形式表示，在训练模型之前，首先按照知识的持续时长定义了瞬时型关系和持续型关系，并将所有知识按照关系的持续时长分类，然后定义知识的有效可信度，对于持续型关系的知识进行持续时间建模，计算知识的有效可信度，最后将知识的有效可信度作为训练权重，用于优化知识图谱嵌入表示模型的训练算法。相比于其他的知识图谱嵌入表示学习方法，该算法能够优化模型训练过程，提高模型的实体链接预测精度、关系预测精度和时间预测精度。

3.如权利要求1所述的融合超平面和持续时间建模的时间感知知识表示学习方法，其特征在于定义持续型知识和瞬时型知识。知识图谱中的一个包含时间标签的元事实四元组(h，r，t，[τs，τe])记录一个元事实(h，r，t)在时间维度上从无效到有效再到无效(invalid→valid→invalid)的过程，其中(h，r，t，[τs，τe])表示(头主语实体，谓语关系，尾宾语实体，[开始时间，结束时间])，是知识图谱的一条记录。持续型关系与瞬时型关系的划分标准为：

持续型知识是指在某一时间段内持续有效的知识，这类知识的特点是持续时间不为零；瞬时型知识是指发生在某一时刻，并且不会持续的知识。

4.如权利要求1所述的融合超平面和持续时间建模的时间感知知识表示学习方法，其特征在于定义知识的有效可信度。有效可信度是指含时间标签的某个知识图谱中一个四元组(h，r，t，[τs，τe])，自开始时间(τs)经过t时间后，知识仍然有效的概率称为有效可信度(ValidReliability)，记作VR。根据持续型关系的持续时长分布，对每种持续型知识进行持续时间建模，计算知识的有效可信度。为方便大型知识图谱中大量知识的持续时间建模，采用能够快速模拟有效持续时长分布的高斯函数的持续时间建模方法。因此，知识的概率密度函数f可以表示为：

其中σr指包含关系r的所有知识持续时长的标准差。对于一个四元组(h，r，t，[τs，，τe])...

【专利技术属性】
技术研发人员：崔员宁，李静，施举鹏，王文亮，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人