System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文化遗产保护,具体为一种基于多源异构数据融合的非遗知识图谱构建方法。
技术介绍
1、在非遗知识图谱的构建过程中,多源异构数据融合是关键步骤之一,通过融合不同来源、不同格式的数据,可以丰富知识图谱的内容,提高其完整性和准确性,然而现有的非遗知识谱图在构建的过程中并不能自动识别不同数据源之间的关联关系,多源异构数据并不能有效融合,存在一定的缺陷。
2、现有的非遗知识图谱构建方法存在的缺陷是:
3、1、在专利文件cn111813963b中,主要考虑如何降低知识图谱构建的门槛,并没有考虑到现有的在构建非遗知识图谱时存在数据融合效果差的问题;
4、2、在专利文件cn106168965b中,主要考虑如何实现整个知识图谱构建系统的稳定架构设计,并没有考虑到现有的在构建非遗知识图谱时大多使用统一的模型进行训练,数据输出结果的准确性较低;
5、3、在专利文件cn112347265b中,主要考虑如何提高实体关系预测的准确性,并没有考虑到现有的在构建非遗知识图谱时并不能根据属性的不同来分析不同数据子集内各实体之间的关系,分析结果的误差较大;
6、4、在专利文件cn113177124b中,主要考虑如何提高知识图谱构建方法的专业性、准确性和高效性,并没有考虑到现有的在构建非遗知识图谱时数据来源较为单一的问题。
技术实现思路
1、本专利技术的目的在于提供一种基于多源异构数据融合的非遗知识图谱构建方法,以解决上述
技术介绍
中提出的问题。 ...
【技术保护点】
1.一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:包括数据收集单元、数据清洗预处理单元、数据融合单元、特征提取单元、知识图谱构建单元与知识图谱存储和可视化单元,所述数据收集单元用于从多个来源收集非遗相关的数据,所述数据清洗预处理单元用于对数据收集单元收集到的数据进行清洗和预处理操作,所述数据融合单元用于融合经过清洗和预处理操作后的非遗相关的数据,所述特征提取单元使用深度学习技术对融合后的数据进行特征提取,所述知识图谱构建单元使用图谱构建算法构建非遗知识图谱,所述知识图谱存储和可视化单元用于将构建好的非遗知识图谱存储在数据库或知识库中,并使用可视化技术进行展示;
2.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S1中,还包括如下步骤:多种收集方式包括关键词、修饰词、中心词、否定词、时间、起源地和流传地中的其中一种或多种;
3.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S2中,还包括如下步骤:
4.根据权利要求3所述的一种基于多源异构数据融合的非遗知识图谱构
5.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S3中,还包括如下步骤:在融合收集到的非遗数据后,使用自然语言处理技术初步分析融合后的非遗数据集中各实体的关系和属性,并根据非遗数据属性的不同将非遗数据集划分成不同的非遗数据子集。
6.根据权利要求5所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S4中,还包括如下步骤:
7.根据权利要求5所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:非遗数据集中各实体的关系包括传承关系、保护单位与非遗项目的关系、非遗项目与相关文化、历史和地理方面的关系;
8.根据权利要求6所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S5中,还包括如下步骤:将提取的不同属性非遗数据子集中的特征输入到S41中构建的机器学习模型中,根据属性的不同训练不同的模型,从而输出不同属性非遗数据子集中各实体名称以及各实体之间的关系。
9.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S6中,还包括如下步骤:在生成非遗知识图谱后,使用SQL查询语言进行非遗知识图谱的查询和检索。
10.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在S7中,还包括如下步骤:利用算法识别技术和摄影测量技术,将数据库中相应实体对应的相片或者视频进行处理,从而获取相片中实体的形状、大小、位置、特性及其相互关系,并借助3D数字化扫描技术将二维图片合成三维模型。
...【技术特征摘要】
1.一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:包括数据收集单元、数据清洗预处理单元、数据融合单元、特征提取单元、知识图谱构建单元与知识图谱存储和可视化单元,所述数据收集单元用于从多个来源收集非遗相关的数据,所述数据清洗预处理单元用于对数据收集单元收集到的数据进行清洗和预处理操作,所述数据融合单元用于融合经过清洗和预处理操作后的非遗相关的数据,所述特征提取单元使用深度学习技术对融合后的数据进行特征提取,所述知识图谱构建单元使用图谱构建算法构建非遗知识图谱,所述知识图谱存储和可视化单元用于将构建好的非遗知识图谱存储在数据库或知识库中,并使用可视化技术进行展示;
2.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在s1中,还包括如下步骤:多种收集方式包括关键词、修饰词、中心词、否定词、时间、起源地和流传地中的其中一种或多种;
3.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在s2中,还包括如下步骤:
4.根据权利要求3所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在衡量好非遗实体之间的相似度后,使用基于文本分类以及文本中的词与词、句与句上下文关系模型方法来搜寻数据库,并判断各相同实体之间是否代表不同含义或相同含义。
5.根据权利要求1所述的一种基于多源异构数据融合的非遗知识图谱构建方法,其特征在于:在s3中,还包括如...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。