基于区块链和机器学习的跨系统数据共享方法技术方案

技术编号:27620288 阅读:19 留言:0更新日期:2021-03-10 10:59
属于区块链网络技术领域,具体涉及一种基于区块链和机器学习的跨系统数据共享方法,包括语义网数据库建立步骤、标准属性值库建立步骤和智能合约数据共享步骤,利用区块链、机器学习来解决跨系统的数据共享问题,区块链技术能保证数据不可篡改和数据的安全,并利用自动化脚本代码组成的智能合约实现数据处理和相关业务的操作,是一种利用机器学习技术、通过机器学习学习标准数据特征,用于识别具有相同语义的文本,从而实现通过区块链网络去第三方的进行多数据库安全共享的方法。的进行多数据库安全共享的方法。的进行多数据库安全共享的方法。

【技术实现步骤摘要】
基于区块链和机器学习的跨系统数据共享方法


[0001]本专利技术属于区块链网络
,具体涉及一种基于区块链和机器学习的跨系统数据共享方法。

技术介绍

[0002]数据库系统(Data Base System,简称DBS),是由数据库及其管理软件组成的系统。数据库系统是为适应数据处理的需要而发展起来的一种较为理想的数据处理系统,也是一个为实际可运行的存储、维护和应用系统提供数据的软件系统,是存储介质 、处理对象和管理系统的集合体。
[0003]数据库系统通常由软件、数据库和数据管理员组成。其软件主要包括操作系统、各种宿主语言、实用程序以及数据库管理系统。数据库由数据库管理系统统一管理,数据的插入、修改和检索均要通过数据库管理系统进行。数据管理员负责创建、监控和维护整个数据库,使数据能被任何有权使用的人有效使用。数据库管理员一般是由业务水平较高、资历较深的人员担任。
[0004]数据库系统的个体含义是指一个具体的数据库管理系统软件和用它建立起来的数据库;它的学科含义是指研究、开发、建立、维护和应用数据库系统所涉及的理论、方法、技术所构成的学科,是为适应数据处理的需要而发展起来的一种较为理想的数据处理的核心机构,为计算机的高速处理能力和大容量存储器提供了实现数据管理自动化的条件。
[0005]数据库研究跨越于计算机应用、系统软件和理论三个领域,其中应用促进新系统的研制开发,新系统带来新的理论研究,而理论研究又对前两个领域起着指导作用。由于对数据库的操作都由数据库管理系统完成,所以数据库就可以独立于具体的应用程序而存在,从而数据库又可以为多个用户所共享,因此,数据的独立性和共享性是数据库系统的重要特征。但是,由于技术指标、运用场景、运行要求等环境因素的差异,不同组织都有着属于自己的独立的数据库系统,而各个数据库系统也都独立进行使用与维护。在当下很多应用场景都需要不同的组织共享各自的数据库,跨组织协作完成任务,传统的处理方法是设置第三方数据中心对来自各个组织的数据库数据进行专门的管理和维护,但是这样的数据中心缺少信任,数据存在被篡改和丢失的风险。
[0006]而现在新兴的区块链技术,由于其保密和不可逆以及去第三方的特性,能够消除现有数据库共享所存在的这些风险。共享数据库首先需要解决一个问题是,不同的组织对自己的数据库内容有着自己的命名规则和风格,同样含义的字段在不同数据库中可能有着不同的命名规则,比如某一个数据库中对其一张表的某一个属性命名是“姓名”,而在另一个数据库中对这个属性的命名却是“name”,要实现不同数据库共享彼此数据,就需要解决命名差异带来的冲突,消除上述对同一数据的属性命名歧义。
[0007]机器学习技术是对数据进行分析,获得规律,然后利用规律在对未知数据进行预测和分类,机器学习技术是现行的、用于自动化智能化对数据进行识别、处理、矫正、归集的技术,用机器学习的技术则可以很好的解决上述对同一数据的属性命名歧义进行自动、智
能矫正统一的工作,机器学习技术是对数据进行分析,获得规律,比如可以通过机器学习学习标准数据特征,用于识别具有相同语义的文本,实现具有相同含义但命名不同的数据的融合、共享,然后利用规律在对未知数据进行预测和分类。
[0008]但是,在现有技术中,还没有一种技术方案能够将机器学习的技术运用在区块链数据共享的体系中。

技术实现思路

[0009]本专利技术针对上述的不同数据库在共享数据时,因为数据库表的属性命名不同而产生的命名冲突问题、已经传统数据中心管理数据时,数据存在被篡改和丢失风险的问题,提供了一种利用机器学习技术、通过机器学习学习标准数据特征,用于识别具有相同语义的文本,从而实现通过区块链网络去第三方的进行多数据库安全共享的方法。
[0010]基于区块链和机器学习的跨系统数据共享方法,包括语义网数据库建立步骤、标准属性值库建立步骤和智能合约数据共享步骤;语义网数据库建立步骤,一般来说区块链中每一个区块为了保存交易记录,都建立了一个Merkle树的结构,其中区块头保存的是Merkle树的树根,区块体保存下面相应的树根以下的部分,可以采用类似的Merkle树结构来构建一个语义网数据库,在区块链中建立了一个用于记录所有参与共享的数据库中各类数据的属性名以及该属性名下的子属性名的Merkle树结构作为语义网数据库;所述Merkle树结构中的所有叶节点代表属性名下的子属性名,通过自底向上进行哈希递归,最终返回一个根哈希值作为语义网数据库的树根。
[0011]所述属性名下的子属性名中均包含它们各自属于哪张表的信息,比如有一个属性名为“姓名”的分支,则该分支下面子属性名的分支,如“name”、“名字”等,同时子属性名的分支“name”中还应包含该属性名原本属于的数据库名字,方便对其进行数据库的一些操作,该语义网结构存放在区块中。
[0012]标准属性值库建立步骤,标准属性值库,用于通过机器学习进行差异对比以及分类,通过已有的标准属性值数据训练机器学习模型,比如神经网络,设定好各种初始化参数后,将标准属性值库的数据输入神经网络,训练模型,将所述语义网数据库建立步骤中得到的用于共享数据的语义网数据库输入至训练好的机器学习模型中进行机器学习,得到标准语义网数据库;所述标准属性值库建立步骤中,通过已有的标准属性值数据训练机器学习模型,具体的,语义网数据库需要共享数据:首先,将所述语义网数据库建立步骤中得到的用于共享数据的语义网数据库中每列数据输入至训练好的机器学习模型中进行机器学习;然后,选择机器学习模型的输出结果中输出概率最高的属性名作为语义网数据库中每列数据的属性名。
[0013]进一步的,得到机器学习模型的输出结果中输出概率最高的属性名后,还要首先查找当前作为语义网数据库的Merkle树结构中对应列的属性名是否与机器学习模型的输出结果中输出概率最高的属性名相同,若不相同则用机器学习模型的输出结果中输出概率最高的属性名作为对应列的属性名入到Merkle树结构中。
[0014]若用于共享数据的语义网数据库中的某一列数据经过机器学习模型机器学习后输出的结果中所有属性名的输出概率值都很低,低于设定阈值,则判断该列为新属性,则在当前作为语义网数据库的Merkle树结构下新增一个属性分支,并将该列数据加入标准语义网数据库中,作为新属性的标准值。
[0015]即通过该机器学习模型,将每列数据库数据作为输入,然后选择输出概率最高的属性名,作为该列的属性名。
[0016]智能合约数据共享步骤,上述区块中新构建的树结构也就是使用机器学习将分好类的属性组织成语义网的结构,将标准语义网数据库存放到区块链中,用户通过查看区块链中的标准语义网数据库,找到目标数据的属性名在其存储位置的数据库中的命名,然后进行访问,这样区块链中某个用户想要访问其他数据库中的数据,就查看当前区块链中最新构建的语义网,从里面可以查看到当前操作指令中的属性名在目标数据库中的命名,从而实现跨系统数据访问。
[0017]所述智能合约数据共享步骤中,当用户访问数据库时要加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于区块链和机器学习的跨系统数据共享方法,其特征在于:包括语义网数据库建立步骤、标准属性值库建立步骤和智能合约数据共享步骤;所述语义网数据库建立步骤,在区块链中建立了一个用于记录所有参与共享的数据库中各类数据的属性名以及该属性名下的子属性名的Merkle树结构作为语义网数据库;所述标准属性值库建立步骤,通过已有的标准属性值数据训练机器学习模型,将所述语义网数据库建立步骤中得到的用于共享数据的语义网数据库输入至训练好的机器学习模型中进行机器学习,得到标准语义网数据库;所述智能合约数据共享步骤,将标准语义网数据库存放到区块链中,用户通过查看区块链中的标准语义网数据库,找到目标数据的属性名在其存储位置的数据库中的命名,然后进行访问1。2.如权利要求1所述的基于区块链和机器学习的跨系统数据共享方法,其特征在于:包括所述Merkle树结构中的所有叶节点代表属性名下的子属性名,通过自底向上进行哈希递归,最终返回一个根哈希值作为语义网数据库的树根。3.如权利要求1或2所述的基于区块链和机器学习的跨系统数据共享方法,其特征在于:包括所述属性名下的子属性名中均包含它们各自属于哪张表的信息。4.如权利要求1所述的基于区块链和机器学习的跨系统数据共享方法,其特征包括,所述标准属性值库建立步骤中,通过已有的标准属性值数据训练机器学习模型,具体的:首先,将所述语义网数据库建立步骤中得到的用于共享数据的语义网数据库中每列数据输入至训练好的机器学习模型中进行机器学习;然后,选择机器学习模型的输出结果中输出概率最高的属性名作为语义网数据库中每列数据的属性名。5.如权利要求4所述的基于区块...

【专利技术属性】
技术研发人员:杨挺陈嘉曼汪文勇
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1