基于区块链的实体对齐方法及系统、存储介质、电子设备技术方案

技术编号:32430173 阅读:18 留言:0更新日期:2022-02-24 18:40
本发明专利技术涉及一种基于区块链的实体对齐方法及系统、存储介质、电子设备,还方法包括步骤:接收用户输入的实体主体的自有信息,并基于区块链中的ID生成算法,生成一个或多个第一ID,并存储于区块链中;接收用户输入的各个数据持有方自有的实体主体数据,并基于区块链中的所述ID生成算法生成对应的第二ID;比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体。本发明专利技术实体对齐方案中,通过实体主体自身发布的ID来对齐各方持有的不同ID的身份,实现了实体信息的对齐,并且由于区块链技术的安全性,保证了整个过程中隐私或者敏感信息的不被泄露。证了整个过程中隐私或者敏感信息的不被泄露。证了整个过程中隐私或者敏感信息的不被泄露。

【技术实现步骤摘要】
基于区块链的实体对齐方法及系统、存储介质、电子设备


[0001]本专利技术涉及自然语言处理
,特别涉及一种基于区块链的实体对齐方法及系统、存储介质、电子设备。

技术介绍

[0002]自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。在自然语言处理中,实体可以简单理解为人名、地名、机构名等。在大数据技术背景下,多个数据持有方可能拿到的信息不对称,对于主体信息(比如个人信息、企业信息),有些机构有比如历史name或id,而有些可能只有最新的数据。不同数据持有方持有数据不对称的情况下,即便是事实上的同一主体,在不确定数据是同一个主体的情况下不能对相关的数据进行合并,即不能进行有效的数据融合和使用。实体对齐就是识别出不同表示下的同一个实体,以便于进行数据融合。
[0003]现有技术中的实体对齐,一般是将待处理数据与标准数据进行多次相似度计算,或者是将数据转换为向量矩阵后再进行相似度计算,运算量大,效率低。例如,公开号为CN110928894A的中国专利技术公开了一种实体对齐方法,该方法就是将待处理数据与候选数据集中的每条标准数据进行相似度计算,基于相似度值选出目标标准数据作为对齐结果,效率低下。

技术实现思路

[0004]本专利技术的目的在于改善现有技术中所存在的上述不足,提供一种基于区块链的实体对齐方法及系统,不仅可以提高实体对齐的处理效率,而且可以保障对齐结果的准确性。
[0005]本专利技术的第一目的是解决如何提高实体对齐的处理效率的技术问题,为此,本专利技术实施例提供了以下技术方案:
[0006]一种基于区块链的实体对齐方法,包括步骤:
[0007]接收用户输入的实体主体的自有信息,并基于区块链中的ID生成算法,生成一个或多个第一ID,并存储于区块链中;
[0008]接收用户输入的各个数据持有方自有的实体主体数据,并基于区块链中的所述ID生成算法生成对应的第二ID;
[0009]比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体。
[0010]上述方案中,实体主体主动认领ID,数据持有方基于相同的ID生成算法生成ID,使得在实体对齐判断时,可以通过比较两个ID是否相同来进行对齐判断,操作非常简便,无需进行多次的相似度计算,进而可以极大地降低运算量,提高处理效率。传统的方法中几乎都需要进行相似度计算,本专利技术方法突破了传统思维,结合区块链技术,通过实体主体主动参与,即可以非常简单地实现实体对齐。另外,ID是由实体主体自身提供的身份信息而生成的,因此根据ID进行对齐判断,相比于相似度计算,可以保障对齐结果的准确性。
[0011]本专利技术的第二目的是解决在提高处理效率的情况下如何丰富对齐手段,为此,本专利技术提供了以下技术方案:
[0012]所述的基于区块链的实体对齐方法,还包括步骤:建立所述第一ID与用户区块链地址的关联关系,并存储于区块链中。
[0013]所述的基于区块链的实体对齐方法,所述比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体的步骤,包括:比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体;若不同,则根据输入的多个第二ID,分别在区块链中查找各第二ID相关联的区块链地址,若各第二ID相关联的区块链地址相同,则判定为所述多个第二ID所对应的多个实体主体为同一实体。
[0014]上述方案中,由于同一实体主体的多个ID都与同一个区块链地址相关联,因此当ID不相同时,可以根据相关联的区块链地址是否相同来进行实体对齐,不仅丰富了实体对齐的手段,而且同样的操作简单,且准确性高。
[0015]本专利技术的第三目的是如何保障数据的存储安全,为此,提供了以下技术方案:
[0016]所述自有信息或所述实体主体数据,为实体主体的身份信息。在本方案中,只是将实体主体的身份信息上传至区块链,而其他数据不上传,分别保留在各个机构,因此可以保障数据的安全性。
[0017]所述的基于区块链的实体对齐方法,所述身份信息包括实体名称、实体id和日期。其中,实体id可以是身份证、护照、社保、港澳通行证、统一社会代码、注册号等政府官方发的id。
[0018]所述的基于区块链的实体对齐方法,所述ID生成算法为hash算法。hash算法可以优选md5、sha-125、sha-256等。
[0019]本专利技术的第四目的是如何保障数据的使用安全,解决现有数据授权过程容易被伪造、授权过程不安全的问题,为此,提供了以下技术方案:
[0020]所述的基于区块链的实体对齐方法,还包括步骤:接收用户输入的实体主体在区块链上对授权信息的数字签名。
[0021]所述的基于区块链的实体对齐方法,还包括步骤:接收区块链反馈的公钥,并基于所述公钥解密所述授权信息。
[0022]上述方案中,实体主体在区块链上通过签名方式来授权各种信息的合法使用,既保障了数据的安全,也保障了授权过程的安全。即本方案解决了现有数据授权过程容易被伪造、授权过程不安全的问题。
[0023]另一方面,基于相同的专利技术构思,本专利技术实施例提供了一种基于区块链的实体对齐系统,包括:
[0024]第一数据处理模块,被配置为接收用户输入的实体主体的自有信息,并基于区块链中的ID生成算法,生成一个或多个第一ID,并存储于区块链中;
[0025]第二数据处理模块,被配置为接收用户输入的各个数据持有方自有的实体主体数据,并基于区块链中的所述ID生成算法生成对应的第二ID;
[0026]对齐模块,被配置为比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体。
[0027]所述的基于区块链的实体对齐系统,所述第一数据处理模块还被配置为建立所述第一ID与用户区块链地址的关联关系,并存储于区块链中。
[0028]所述的基于区块链的实体对齐系统,所述对齐模块还被配置为:当输入的多个第二ID不同时,分别在区块链中查找所述多个第二ID分别相关联的区块链地址,若各第二ID相关联的区块链地址相同,则判定为所述多个第二ID所对应的多个实体主体为同一实体。
[0029]所述的基于区块链的实体对齐系统,所述自有信息或所述实体主体数据为实体主体的身份信息,所述身份信息包括实体名称、实体id和日期。
[0030]所述的基于区块链的实体对齐系统,还包括授权模块,被配置为接收用户输入的实体主体在区块链上对授权信息的数字签名。
[0031]第三方面,本专利技术实施例提供了一种包括计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时,使处理器执行本专利技术实施例中任一实施方式所述的基于区块链的实体对齐方法中的操作。
[0032]第四方面,本专利技术实施例提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本专利技术实施例中任一实施方式所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的实体对齐方法,其特征在于,包括步骤:接收用户输入的实体主体的自有信息,并基于区块链中的ID生成算法,生成一个或多个第一ID,并存储于区块链中;接收用户输入的各个数据持有方自有的实体主体数据,并基于区块链中的所述ID生成算法生成对应的第二ID;比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体。2.根据权利要求1所述的基于区块链的实体对齐方法,其特征在于,还包括步骤:建立所述第一ID与用户区块链地址的关联关系,并存储区块链中。3.根据权利要求2所述的基于区块链的实体对齐方法,其特征在于,所述比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体的步骤,包括:比较输入的多个第二ID是否相同,若相同则判定为所述多个第二ID所对应的多个实体主体为同一实体;若不同,则根据输入的多个第二ID,分别在区块链中查找各第二ID相关联的区块链地址,若各第二ID相关联的区块链地址相同,则判定为所述多个第二ID所对应的多个实体主体为同一实体。4.根据权利要求1所述的基于区块链的实体对齐方法,其特征在于,所述自有信息或所述实体主体数据,为实体主体的身份信息。5.根据权利要求4所述的基于区块链的实体对齐方法,其特征在于,所述身份信息包括实体名称、实体id和日期。6.根据权利要求5所述的基于区块链的实体对齐方法,其特征在于,所述ID生成算法为hash算法。7.根据权利要求1-6任一所述的基于区块链的实体对齐方法,其特征在于,还包括步骤:接收用户输入的实体主体在区块链上对授权信息的数字签名。8.根据权利要求7所述的基于区块链的实体对齐方法,其特征在于,还包括步骤:接收区块链反馈的公钥,并基于所述公钥解...

【专利技术属性】
技术研发人员:刘世林吴桐杨李伟曾途尹康韩远
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1