线性文化遗产知识图谱构建方法、系统、计算设备和介质技术方案

技术编号：27741953 阅读：31 留言：0更新日期：2021-03-19 13:35

本发明专利技术的实施例公开了一种线性文化遗产知识图谱构建方法、系统、计算设备和存储介质。所述方法包括：S20、获取线性文化遗产的原始数据，其中所述原始数据包括图像数据、语音数据和文本数据；S22、对所述图像数据、语音数据和文本数据分别采用不同的网络模型进行实体和关系抽取；S24、通过知识表示将得到的实体和关系进行表示，建立基于语义网的知识标识框架；S26、基于所述知识标识框架，构建线性文化遗产可视化知识图谱展示单元。通过本发明专利技术的知识图谱构建方法、知识图谱系统，大大减少了考古工作人员的工作量，提高了工作效率，降低了工作难度。

全部详细技术资料下载

【技术实现步骤摘要】
线性文化遗产知识图谱构建方法、系统、计算设备和介质
本专利技术涉及线性文化遗产研究领域，更具体地，涉及一种线性文化遗产知识图谱构建方法、系统、计算设备和存储介质。
技术介绍
从文化遗产的视角，对古代交通遗产进行研究和保护，是近几年的发展趋势。线性文化遗产是一类具有显著形态分布特征的文化遗产类型，是由人工营造的线状遗迹串联起来，或沿自然形成的线形边界排列起来的点状遗产所组成。对于线性文化遗产本体进行文献阅读、田野踏查，并基于田野踏查数据，全面系统地对古道进行分级以及对古道相关遗存进行分类，是进行线性文化遗产的保护与研究的先决条件。线性文化遗产包含的遗存本体种类多、数量大，田野踏查获得的数据相应地也种类多、数量大，传统方法高度依赖专业技术人员的人工作业，难以快速、批量地对于古道进行分级以及对于其它相关遗存进行分类。随着现代化进程的推进和人类活动对于地形地貌的改变，线性文化遗产面临的威胁也日益增大，古道路面和相关遗存不断消失。尽快进行研究和保护变得更为迫切。
技术实现思路
本专利技术第一方面提供一种线性文化遗产知识图谱构建方法，包括：获取线性文化遗产的原始数据，其中所述原始数据包括图像数据、语音数据和文本数据；对所述图像数据、语音数据和文本数据分别采用不同的网络模型进行实体和关系抽取；通过知识表示将得到的实体和关系进行表示，建立基于语义网的知识标识框架；基于所述知识标识框架，构建线性文化遗产可视化知识图谱展示单元。在一个具体实施例中，对所述图像数据进行实体...

【技术保护点】
1.一种线性文化遗产知识图谱构建方法，其特征在于，包括：/nS20、获取线性文化遗产的原始数据，其中所述原始数据包括图像数据、语音数据和文本数据；/nS22、对所述图像数据、语音数据和文本数据分别采用不同的网络模型进行实体和关系抽取；/nS24、通过知识表示将得到的实体和关系进行表示，建立基于语义网的知识标识框架；/nS26、基于所述知识标识框架，构建线性文化遗产可视化知识图谱展示单元。/n

【技术特征摘要】
1.一种线性文化遗产知识图谱构建方法，其特征在于，包括：
S20、获取线性文化遗产的原始数据，其中所述原始数据包括图像数据、语音数据和文本数据；
S22、对所述图像数据、语音数据和文本数据分别采用不同的网络模型进行实体和关系抽取；
S24、通过知识表示将得到的实体和关系进行表示，建立基于语义网的知识标识框架；
S26、基于所述知识标识框架，构建线性文化遗产可视化知识图谱展示单元。

2.根据权利要求1所述的方法，其特征在于，对所述图像数据进行实体和关系抽取包括：
第一卷积层将图像数据进行第一卷积操作，得到第一特征提取数据；
第二卷积层将所述第一特征提取数据进行第二卷积操作，得到第二特征提取数据；
最大池化层将所述第二特征提取数据进行下采样操作，得到下采样数据；
注意力机制单元对所述下采样数据进行图谱特征挖掘，得到图谱特征数据；
第三卷积层将所述图谱特征数据进行第三卷积操作，得到第三特征提取数据；
第四卷积层将所述第三特征提取数据进行第四卷积操作，得到第四特征提取数据；
全连接层接收所述四特征提取数据并由第一分类器输出识别结果。

3.根据权利要求1所述的方法，其特征在于，对所述语音数据进行实体和关系抽取包括：
语音特征提取单元提取语音数据的语音特征向量；
语音知识提取单元根据所述特征向量，提取语音数据的实体和关系，
其中，所述语音知识提取单元根据所述特征向量，提取语音数据的实体和关系包括：
GRU神经网络接收所述特征向量，输出第一识别结果；
BiLSTM神经网络接收所述特征向量，输出第二识别结果；
深度神经网络接收所述特征向量，输出第三识别结果；
融合单元对第一至第三识别结果的优劣进行排序从而输出最优识别结果。

4.根据权利要求1所述的方法，其特征在于，对所述文本数据进行实体和关系抽取包括：
Seq2seq翻译单元将文本数据向量化，对输入文本的词语进行映射，将词语转换为相应的词向量并将向量化的词进行拼接，得到输入向量；
由循环神经网络构成的编码器将所述输入向量编码为一个定长的语义向量；
由循环神经网络构成的解码器利用所述语义向量初始化解码器，使用特定的开始符，作为第一时刻的输入，开始解码直至输出停止符。

5.一种性文化遗产知识图谱系统，其特征在于，包括：
数据获取模块，用于获取线性文化遗产相关数据，包括图像数据、语音数据和文本数据；
知识抽取模块，用于对所述相关数据进行实体和关系抽取；
知识表示模块，用于对通过知识表示将得到的实体和关系进行表示，建立语义网框架表示；
存储模块，用于对语义网框架的三元组数据进行存储；
知识图谱展示模块，用于可视化展示三元组数据对应的知识图谱。

6.根据权利要求5所述的系统，其特征在于，所述知识抽取模块还包括：
图像知识提取模型，包括：
第一卷积层，用于将图像数据进行第一卷积操作，得到第一特征提取数据；
第二卷积层，...

【专利技术属性】
技术研发人员：王雨晨，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人