基于知识图谱补全模型的文物安防风险要素识别方法技术

技术编号:35032852 阅读:13 留言:0更新日期:2022-09-24 23:07
本发明专利技术公开了一种基于知识图谱补全模型的文物安防风险要素识别方法,包括:获取文物的文本描述,将与该文物的文本描述对应的、该文物的所有相关特征整合成该文物的特征序列(p1,p2,...,p

【技术实现步骤摘要】
基于知识图谱补全模型的文物安防风险要素识别方法


[0001]本专利技术属于属于文物安防风险评估领域,更具体地,涉及一种基于知识图谱补全模型的文物安防风险要素识别方法。

技术介绍

[0002]我国不可移动文物资源总量大、地域广、分布散,价值丰富,因此为了维护文物本体及其环境的真实性和完整性,对文物的安全防范系统进行风险评估至关重要,风险评估的结果将指导我们对该文物的安防系统进行优化,以避免其受到入侵对象的损坏。根据标准《GBT 27921风险管理

风险评估技术》,风险识别是发现、列举和描述风险要素的过程,是风险评估的基础工作。而在文物安防领域,确定文物的风险要素,并用指标项来描述,进而建立指标体系,才能为之后的风险分析和风险评估做好基础工作。因此构建适用于文物的风险评估指标体系尤为重要。
[0003]对文物进行风险要素识别,构建文物安防风险评估指标体系,需要文物安防专家在对文物的风险源和风险因素进行识别和分析后,建立层次化的递阶式的指标体系。
[0004]然而,现有的文物安防风险要素识别方法均具有一些不可忽略的缺陷:第一,由于文物种类多地域分布广,现有的文物安防风险要素识别和构造风险评估指标体系的过程往往需要耗费不少的人力、物力,需要邀请文物专家对文物单位进行非常详细的了解,极大地增加了专家的工作量;第二,现有的指标体系针对差异较大的不同的文物种类时,重合度较高且不够全面,这是因为专家在对新的文物单位进行评估时,往往只考虑当前的文物单位,而之前已有的典型的文物安防风险评估指标体系的相关资源和知识无法充分利用,这会使得新构建的指标体系不全面、不精确,从而使得风险要素识别的结果不精确,从而影响之后的风险评估结果。

技术实现思路

[0005]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于知识图谱补全模型的文物安防风险要素识别方法,其目的在于,解决现有风险要素识别和构建风险评估指标体系过程中,专家工作量大的技术问题,以及由于无法充分利用之前已有的文物安防风险评估指标体系的相关资源和知识,使得新构建的指标体系不全面、不精确,从而使得风险要素识别的结果不精确,从而影响之后的风险评估结果的技术问题。
[0006]为实现上述目的,按照本专利技术的一个方面,提供了一种基于知识图谱补全模型的文物安防风险要素识别方法,包括以下步骤:
[0007](1)获取文物的文本描述,将与该文物的文本描述对应的、该文物的所有相关特征整合成该文物的特征序列(p1,p2,...,p
n
),其中p
i
表示与该文物的文本描述对应的、该文物的第i个特征,且有i∈[1,n],n表示与该文物的文本描述对应的、该文物的所有相关特征的总数;
[0008](2)将步骤(1)得到的文物的特征序列输入训练好的知识图谱补全模型中,以得到
该文物的嵌入向量表示l;
[0009](3)基于步骤(2)得到的该文物的嵌入向量表示l获取链接预测的结果。
[0010](4)将步骤(3)得到的链接预测的结果作为该文物安防风险评估的指标项,并将该指标项作为识别到的该文物的安防风险要素。
[0011]优选地,步骤(1)中的文本描述是从与该文物相关的各种资料获取,该文物的文本描述对应的相关特征包括文物的种类、朝代、以及地理位置等。
[0012]优选地,知识图谱补全模型是通过以下步骤构建的:
[0013](2

1)获取多个文物的安防风险评估指标体系,每一个安防风险评估指标体系中均包括文物及其对应的多个指标项;
[0014](2

2)根据步骤(2

1)得到的每个安防风险评估指标体系确定对应的头实体、关系和尾实体,并根据这些头实体、关系和尾实体生成该安防风险评估指标体系对应的多个三元组{(hi1,ti1,ri1),(hi2,ti2,ri2),...,(hin, tin,rin)},其中i∈[1,安防风险评估指标体系总数],n表示第i个安防风险评估指标体系对应的三元组总数,him表示第i个安防风险评估指标体系对应的第m个三元组中的头实体,tim表示第i个安防风险评估指标体系对应的第m个三元中组的尾实体,rim表示第i个安防风险评估指标体系对应的第m个三元组中的关系,m∈[1,n];
[0015](2

3)将步骤(2

2)得到的所有文物的所有安防风险评估指标体系对应的所有三元组中的所有头实体和尾实体组合成实体集E,将所有文物的所有安防风险评估指标体系对应的所有三元组中的所有关系组合成关系集R,将所有文物的所有安防风险评估指标体系对应的所有三元组组合成三元组集T,将实体集E、关系集R和三元组集T组合成第一数据集,将所有文物的文本描述构成的文本描述矩阵作为第二数据集;
[0016](2

4)将步骤(2

3)构建的第一数据集划分为第一训练集、第一验证集和第一测试集;
[0017](2

5)将步骤(2

4)得到的第一训练集输入基于翻译的TransH模型,以得到该第一训练集中实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵;
[0018](2

6)将步骤(2

3)构建的第二数据集划分为第二训练集、第二验证集和第二测试集;
[0019](2

7)将步骤(2

6)中的第二训练集输入自然语言处理模型Word2Vec 中,以得到与第二训练集中每个文物的文本描述对应的、该文物的每个特征i对应的嵌入向量v
wi
,第二训练集中每个文物的所有特征对应的所有嵌入向量构成该文物对应的嵌入矩阵V
w
=(v
w1
,v
w2
,...,v
wn
),其中i∈[1,n], n表示与第二训练集中每个文物的文本描述对应的、该文物的所有特征的总数;
[0020](2

8)针对步骤(2

7)获得的每个文物对应的嵌入矩阵而言,对该嵌入矩阵做平均,以获得该文物对应的单个代表嵌入向量v;
[0021](2

9)将步骤(2

5)获得的实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵、以及步骤(2

8)获得的每个文物对应的单个代表嵌入向量 V
h
输入转换函数Ψmap中,并使用批量随机梯度下降最小化损失函数来训练转换函数Ψmap,使得其损失值最小,从而得到每个文物在同一个向量空间的嵌入向量表示,并得到训练好的知识图谱补全模型。
[0022]优选地,步骤(2

1)中的文物的安防风险评估指标体系是从已经被专家做过风险
评估的文物单位的风险评估报告中获取的;
[0023]每个安防风险评估指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱补全模型的文物安防风险要素识别方法,其特征在于,包括以下步骤:(1)获取文物的文本描述,将与该文物的文本描述对应的、该文物的所有相关特征整合成该文物的特征序列(p1,p2,...,p
n
),其中p
i
表示与该文物的文本描述对应的、该文物的第i个特征,且有i∈[1,n],n表示与该文物的文本描述对应的、该文物的所有相关特征的总数;(2)将步骤(1)得到的文物的特征序列输入训练好的知识图谱补全模型中,以得到该文物的嵌入向量表示l;(3)基于步骤(2)得到的该文物的嵌入向量表示l获取链接预测的结果。(4)将步骤(3)得到的链接预测的结果作为该文物安防风险评估的指标项,并将该指标项作为识别到的该文物的安防风险要素。2.根据权利要求1所述的基于知识图谱补全模型的文物安防风险要素识别方法,其特征在于,步骤(1)中的文本描述是从与该文物相关的各种资料获取,该文物的文本描述对应的相关特征包括文物的种类、朝代、以及地理位置等。3.根据权利要求1或2所述的基于知识图谱补全模型的文物安防风险要素识别方法,其特征在于,知识图谱补全模型是通过以下步骤构建的:(2

1)获取多个文物的安防风险评估指标体系,每一个安防风险评估指标体系中均包括文物及其对应的多个指标项;(2

2)根据步骤(2

1)得到的每个安防风险评估指标体系确定对应的头实体、关系和尾实体,并根据这些头实体、关系和尾实体生成该安防风险评估指标体系对应的多个三元组{(hi1,ti1,ri1),(hi2,ti2,ri2),...,(hin,tin,rin)},其中i∈[1,安防风险评估指标体系总数],n表示第i个安防风险评估指标体系对应的三元组总数,him表示第i个安防风险评估指标体系对应的第m个三元组中的头实体,tim表示第i个安防风险评估指标体系对应的第m个三元中组的尾实体,rim表示第i个安防风险评估指标体系对应的第m个三元组中的关系,m∈[1,n];(2

3)将步骤(2

2)得到的所有文物的所有安防风险评估指标体系对应的所有三元组中的所有头实体和尾实体组合成实体集E,将所有文物的所有安防风险评估指标体系对应的所有三元组中的所有关系组合成关系集R,将所有文物的所有安防风险评估指标体系对应的所有三元组组合成三元组集T,将实体集E、关系集R和三元组集T组合成第一数据集,将所有文物的文本描述构成的文本描述矩阵作为第二数据集;(2

4)将步骤(2

3)构建的第一数据集划分为第一训练集、第一验证集和第一测试集;(2

5)将步骤(2

4)得到的第一训练集输入基于翻译的TransH模型,以得到该第一训练集中实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵;(2

6)将步骤(2

3)构建的第二数据集划分为第二训练集、第二验证集和第二测试集;(2

7)将步骤(2

6)中的第二训练集输入自然语言处理模型Word2Vec中,以得到与第二训练集中每个文物的文本描述对应的、该文物的每个特征i对应的嵌入向量v
wi
,第二训练集中每个文物的所有特征对应的所有嵌入向量构成该文物对应的嵌入矩阵V
w
=(v
w1
,v
w2
,...,v
wn
),其中i∈[1,n],n表示与第二训练集中每个文物的文本描述对应的、该文物的所有特征
的总数;(2

8)针对步骤(2

7)获得的每个文物对应的嵌入矩阵而言,对该嵌入矩阵做平均,以获得该文物对应的单个代表嵌入向量v;(2

9)将步骤(2

5)获得的实体集E的向量嵌入矩阵和关系集R的向量嵌入矩阵、以及步骤(2

8)获得的每个文物对应的单个代表嵌入向量V
h
输入转换函数Ψmap中,并使用批量随机梯度下降最小化损失函数来训练转换函数Ψmap,使得其损失值最小,从而得到每个文物在同一个向量空间的嵌入向量表示,并得到训练好的知识图谱补全模型。4.根据权利要求1至3中任意一项所述的基于知识图谱补全模型的文物安防风险要素识别方法,其特征在于...

【专利技术属性】
技术研发人员:江小平王雅琦王奎卢治勇李成华石鸿凌丁昊
申请(专利权)人:中电科技集团重庆声光电有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1