基于区块链的知识图谱多人协同构建方法与系统技术方案

技术编号:38570645 阅读:14 留言:0更新日期:2023-08-22 21:06
本发明专利技术公开了一种基于区块链的知识图谱多人协同构建方法与系统,上述方法包括:创建知识图谱的本体数据并存储至IPFS,生成知识图谱总结记录并上传至区块链发布链;从IPFS中获取知识图谱本体数据进行设计;通过语义融合算法将本周期内所有的Cypher更新语句融合成知识图谱本体数据融合设计信息,生成数据融合记录上传至区块链设计链;从区块链设计链获取数据融合记录,并进行一致性校验,将校验通过的数据上传到区块链发布链。数据上传到区块链发布链。数据上传到区块链发布链。

【技术实现步骤摘要】
基于区块链的知识图谱多人协同构建方法与系统


[0001]本专利技术涉及区块链
,尤其涉及一种基于区块链的知识图谱多人协同构建方法与系统。

技术介绍

[0002]“知识图谱”这一概念在2012年被Google正式提出。2013年之后,随着智能信息服务和应用的不断发展,知识图谱、大数据和深度学习一并成为推动互联网和人工智能发展的核心动力。在生产过程中,知识图谱的构建问题往往需要多个部门、多重角色间的协同处理。传统协同方式单一,协同用户之间存在信息沟通壁垒,易导致用户之间数据信息交互不畅,影响多用户协同构建知识图谱的效率。如果将数据直接存储到区块链上,会对区块链网络的存储性能带来极大挑战;同时,又因区块链交互性能较差,会对多人协同之间信息交流产生较大影响。现有技术设计了相应的链上链下协同存储方案和属性加密方案来解决上述问题,但由于它们普遍采用单一区块链进行数据管理,区块链的吞吐量性能难以满足知识图谱多人协同场景的并发处理需求;此外,现有技术在利用现有方式存储知识数据时,极易出现重复数据和冲突数据,加大了区块链存储压力,影响了系统的协同能力。
[0003]同时,多用户间协同的并发事物难以监控,容易导致用户间的数据冲突、数据冗余的情况,导致协同进程进展缓慢,并且系统管理机制不够完善,没有统一的校验版本,无法合理约束各协同用户的工作进度以及工作责任。据此,如何提出一种系统及方法,能够有效的打通各协同用户间的数据私有壁垒、保证各协作用户协同事务的高效运作,已经成为迫切需要解决的问题。
[0004]针对上述问题,HuajunChen基于区块链提出了OpenKG链的概念,利用ONTID和OpenKG令牌机制解决了传统知识图谱众包平台中用户间信任问题和数据价值溯源问题。Timotej Knez提出使用区块链记录多人协同创作过程中每次创作后的知识图谱的更新数据信息,利用区块链防篡改和可追溯的性质,可以保证多人协同创作时数据的安全性和共享性。然而,在上述研究中,未能实现有效的管理并发数据,易造成链上链下数据不一致,用户信息不对等,数据冗余的问题。

技术实现思路

[0005]本专利技术针对上述的现有技术中存在的链上链下数据不一致,多人协同版本冲突,数据冗余的技术问题,提出一种基于区块链的知识图谱多人协同构建方法与系统。
[0006]第一方面,本申请实施例提供了一种基于区块链的知识图谱多人协同构建方法,包括:
[0007]初始数据上传步骤:协同任务发布方创建以供图谱设计师参照的知识图谱本体数据,将知识图谱的本体数据存储至IPFS,根据返回的哈希存储地址与所述知识图谱的本体数据的哈希值生成知识图谱总结记录,并上传至区块链发布链;
[0008]任务发布步骤:协同任务发布方创建知识图谱协同任务信息,并选择需要协同的
知识图谱版本,从区块链发布链中获取其对应的知识图谱总结记录,通过知识图谱总结记录获取知识图谱对应的哈希存储地址及知识图谱本体数据的哈希值,根据所述哈希地址与所述任务信息及知识图谱本体数据的哈希值生成知识图谱协同任务信息上传至区块链设计链,用作图谱更新周期时的多人协同初始数据和一致性检查的标准数据;
[0009]数据设计步骤:图谱设计师从区块链设计链获取知识图谱协同任务信息,根据知识图谱协同任务信息中的哈希存储地址从IPFS中获取知识图谱本体数据,结合本地数据库中的知识图谱三元组数据进行知识图谱设计,并将知识图谱设计时的Cypher语句形成个人更新数据;
[0010]协同数据上传步骤:多名图谱设计师向区块链协同链上传数据前,只需要利用本体推理机检查知识图谱协同任务信息中的标准数据与本地数据库中的个人更新数据是否一致,若是,将本地数据库中的个人更新数据及对应的哈希值生成知识图谱设计记录并上传到区块链协同链;若不是,放弃上传。
[0011]更新数据融合上传步骤:图谱更新周期结束时,智能合约自动收集本周期内上传到区块链协同链的知识图谱设计记录,并调用语义融合算法将本周期内所有涉及的Cypher更新语句合并为Cypher语句融合信息,根据所述Cypher语句融合信息及对应的哈希值生成数据融合记录,并上传至区块链设计链;
[0012]数据发布步骤:协同任务发布方从区块链设计链获取所述数据融合记录,应用到本地数据库形成完整知识图谱数据,并采用本体推理机进行一致性校验,将校验通过的完整知识图谱数据上传到区块链发布链。
[0013]第二方面,本申请实施例提供了一种基于区块链的知识图谱多人协同构建系统,用于实现上述第一方面所述的知识图谱多人协同构建方法,其特征在于,包括:
[0014]环境部署单元:部署区块链多链网络环境和IPFS环境,调用多链划分规则划分区块链网络,并构建IPFS;其中,划分区块链发布链为主链,划分区块链设计链、区块链协同链为支链;
[0015]初始数据上传单元:协同任务发布方创建以供图谱设计师参照的知识图谱本体数据,将知识图谱的本体数据存储至IPFS,根据返回的哈希存储地址与所述知识图谱的本体数据的哈希值生成知识图谱总结记录,并上传至区块链发布链;
[0016]任务发布单元:协同任务发布方创建知识图谱协同任务信息,并选择需要协同的知识图谱版本,从区块链发布链中获取其对应的知识图谱总结记录,通过知识图谱总结记录获取知识图谱对应的哈希存储地址及知识图谱本体数据的哈希值,根据所述哈希地址与所述任务信息及知识图谱本体数据的哈希值生成知识图谱协同任务信息上传至区块链设计链,用作图谱更新周期时的多人协同初始数据和一致性检查的标准数据;
[0017]数据设计单元:图谱设计师从区块链设计链获取知识图谱协同任务信息,根据知识图谱协同任务信息中的哈希存储地址从IPFS中获取知识图谱本体数据,根据本体数据的架构结合本地数据库中的知识图谱三元组数据进行知识图谱设计,并将知识图谱设计时的Cypher语句形成个人更新数据;
[0018]协同数据上传单元:多名图谱设计师向区块链协同链上传数据前,只需要利用本体推理机检查知识图谱协同任务信息中的标准数据与本地数据库中的个人更新数据是否一致,若是,将本地数据库中的个人更新数据及对应的哈希值生成知识图谱设计记录并上
传到区块链协同链;若不是,放弃上传;
[0019]更新数据融合上传单元:图谱更新周期结束时,智能合约自动收集本周期内上传到区块链协同链的知识图谱设计记录,并调用语义融合算法将本周期内所有涉及的Cypher更新语句合并为Cypher语句融合信息,根据所述Cypher语句融合信息及对应的哈希值生成数据融合记录,并上传至区块链设计链;
[0020]数据发布单元:协同任务发布方从区块链设计链获取所述数据融合记录,应用到本地数据库形成完整知识图谱数据,并采用本体推理机进行一致性校验,将校验通过的完整知识图谱数据上传到区块链发布链。
[0021]与现有技术相比,本专利技术的优点和积极效果在于:
[0022]1、针对于现有基于区块链的知识图谱多人协同构建系统及方法面临的时间顺序执行限本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的知识图谱多人协同构建方法,其特征在于,包括:初始数据上传步骤:协同任务发布方创建以供图谱设计师参照的知识图谱本体数据,将知识图谱的本体数据存储至IPFS,根据返回的哈希存储地址与所述知识图谱的本体数据的哈希值生成知识图谱总结记录,并上传至区块链发布链;任务发布步骤:协同任务发布方创建知识图谱协同任务信息,并选择需要协同的知识图谱版本,从区块链发布链中获取其对应的知识图谱总结记录,通过知识图谱总结记录与所述任务信息及知识图谱本体数据的哈希值生成知识图谱协同任务信息上传至区块链设计链,用作图谱更新周期时的多人协同初始数据和一致性检查的标准数据;数据设计步骤:图谱设计师从区块链设计链获取知识图谱协同任务信息,根据知识图谱协同任务信息中的哈希存储地址从IPFS中获取知识图谱本体数据,根据本体数据的架构结合本地数据库中的知识图谱三元组数据进行知识图谱设计,并将知识图谱设计时的Cypher语句形成个人更新数据;协同数据上传步骤:多名图谱设计师向区块链协同链上传数据前,只需要利用本体推理机检查知识图谱协同任务信息中的标准数据与本地数据库中的个人更新数据是否一致,若是,将本地数据库中的个人更新数据及对应的哈希值生成知识图谱设计记录并上传到区块链协同链;若不是,放弃上传。更新数据融合上传步骤:图谱更新周期结束时,智能合约自动收集本周期内上传到区块链协同链的知识图谱设计记录,并调用语义融合算法将本周期内所有涉及的Cypher更新语句合并为Cypher语句融合信息,根据所述Cypher语句融合信息及对应的哈希值生成数据融合记录,并上传至区块链设计链;数据发布步骤:协同任务发布方从区块链设计链获取所述数据融合记录,应用到本地数据库形成完整知识图谱数据,并采用本体推理机进行一致性校验,将校验通过的完整知识图谱数据上传到区块链发布链。2.根据权利要求1所述的知识图谱多人协同构建方法,其特征在于,所述初始数据上传步骤包括:图谱本体数据创建步骤:在本体上传周期,协同任务发布方创建知识图谱的本体数据,并使用本体推理机进行一致性检查,一致性检查通过后将所述知识图谱的本体数据存储至IPFS,获取返回的哈希存储地址;图谱本体数据上传步骤:通过Hash算法计算知识图谱的本体数据的哈希值,根据所述本体数据的哈希存储地址与哈希值生成知识图谱总结记录,并通过汇总链码上传至区块链发布链;标准数据获取步骤:从区块链发布链获取需要协同的知识图谱总结记录,获取知识图谱对应的哈希存储地址及知识图谱的本体数据的哈希值,并创建任务信息,根据所述哈希地址与所述任务信息及知识图谱的本体数据的哈希值生成知识图谱协同任务信息上传至区块链设计链作为标准数据。3.根据权利要求1所述的知识图谱多人协同构建方法,其特征在于,所述任务发布步骤包括:协同任务发布方创建知识图谱协同任务信息,并选择需要协同的知识图谱版本,从区块链发布链中获取其对应的知识图谱总结记录,通过知识图谱总结记录获取知识图谱对应的哈希存储地址及知识图谱本体数据的哈希值,根据所述哈希地址与所述任务信息及知识
图谱本体数据的哈希值生成知识图谱协同任务信息上传至区块链设计链,用作图谱更新周期时的多人协同初始数据和一致性检查的标准数据。4.根据权利要求1所述的知识图谱多人协同构建方法,其特征在于,所述数据设计步骤包括:在图谱更新周期,图谱设计师从区块链设计链获取最新的知识图谱协同任务信息,判断所述知识图谱协同任务信息中的知识图谱的本体数据哈希值与本地保存的哈希值是否一致;若是,则在本地进行知识图谱数据的设计与更新;若否,则通过知识图谱协同任务信息中获取知识图谱对应的哈希存储地址,根据所述哈希存储地址从IPFS中获取最新的知识图谱本体数据至本地知识图谱数据库,在本地进行知识图谱数据的设计与更新形成个人更新数据。5.根据权利要求1所述的知识图谱多人协同构建方法,其特征在于,所述更新数据融合上传步骤包括:哈希值验证步骤:图谱更新周期结束后,通过知识设计下载链码获取本周期内所有的知识图谱设计记录,验证哈希值是否被篡改;语义融合步骤:若未被篡改,利用语义融合算法将本周期内区块链协同链中所有涉及的Cypher更新语句融合成Cypher语句融合信息,并计算哈希值;融合数据上传步骤:根据所述Cypher语句融合信息及对应的哈希值生成数据融合记录,通过调用合并上传链码将数据融合记录上传到区块链设计链。6.根据权利要求5所述的知识图谱多人协同构建方法,其特征在于,所述语义融合步骤包括:第一差值计算步骤:将本周期内所有涉及的Cypher更新语句进行初始化,计算初始化后的Cypher更新语句的交集,并计算初始化后的Cypher更新语句与所述交集的差值为第一差值;数据筛选步骤:筛选出所述第一差值中存在的冲突数据与不一致...

【专利技术属性】
技术研发人员:王金龙谢镇玺李朋骏熊晓芸张媛媛
申请(专利权)人:青岛理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1