一种基于随机抽样检测的大数据可信性验证方法及系统技术方案

技术编号:11309117 阅读:136 留言:0更新日期:2015-04-16 05:14
本发明专利技术提供一种基于随机抽样检测的大数据可信性验证方法及系统,首先对大数据进行分块并为数据块生成认证标签;再进行质询,根据质询抽取数据块,并生成该轮可信性验证请求所对应的示证;最后根据示证来验证抽样的数据块的可信性。通过采用基于聚合的广播加密算法的数据签名方案,能够支持数据使用者验证大数据的可信性,无需数据属主实时在线,同时还能够避免哈希函数方案中存在的替换攻击,和散列消息认证码方案中数据属主自己验证数据的可信性,或者需要实时在线将其私钥共享给数据使用者的局限性。同时采用随机抽样检测方法和线性聚合方法,使数据使用者可在不下载数据的情况下,以高置信率验证数据的可信性,且降低了示证验证的计算开销。

【技术实现步骤摘要】
一种基于随机抽样检测的大数据可信性验证方法及系统
本专利技术涉及计算机信息安全
,具体涉及一种基于随机抽样检测的大数据可信性验证方法及系统。
技术介绍
由于大数据包含了大量的原始信息,通过对大数据进行分析,能够有效地分析掌握个性化特征,获得知识与推测趋势。但是,若数据本身不可信,分析的结果就难以得出真实有用的信息。大数据可信性的威胁在于伪造或刻意制造的数据,而错误的数据往往会导致错误的结论。如果数据的应用场景明确,就可能有人刻意制造数据、营造出假象,诱导分析者得出对其有利的结论。而且,虚假的信息往往隐藏在大量信息中,使得人们无法鉴别真伪,从而做出错误的判断。由于当前网络社区中虚假信息的产生和传播变得越来越容易,其所产生的影响不可低估。因此,应当设计大数据的可信性验证方法来验证大数据的可信性,包括大数据的来源可信性、内容可信性,使得数据使用者能够对数据的可信性做出评估,防止使用不可信的数据分析得出无意义或者错误的结果。
技术实现思路
有鉴于此,有必要提供一种能够以高置信率有效地对大数据的来源可信性、内容可信性进行验证的基于随机抽样检测的大数据可信性验证方法及系统。一种基于随机抽样检测的大数据可信性验证方法,包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样检测的大数据可信性验证方法包括如下步骤:S1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证书;S2、数据的处理:数据属主Owner对大数据进行分块,并生成认证标签;S3、质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的质询;S4、示证的生成:大数据发布平台BDDP根据质询、大数据和认证标签生成该轮可信性验证请求所对应的示证;S5、示证的验证:根据大数据发布平台BDDP返回的示证验证抽样的数据块的可信性,如果示证能通过验证,则当前抽样的大数据处于可信状态;反之则表示大数据不可信。一种基于随机抽样检测的大数据可信性验证系统,所述基于随机抽样检测的大数据可信性验证系统包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,所述签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User依次连接,且所述签证机构CA还与大数据发布平台BDDP相连,所述数据属主Owner还与数据使用者User相连。本专利技术实施例提供一种基于随机抽样检测的大数据可信性验证方法及系统,通过采用基于聚合的广播加密算法的数据签名方案,属于一种公钥签名方案,能够支持第三方即数据使用者User验证大数据的可信性,无需数据属主Owner实时在线,既能避免哈希函数方案中存在的替换攻击,又能避免散列消息认证码方案中数据属主Owner自己验证数据的可信性,或者需要实时在线将其私钥共享给数据使用者User的局限性。同时对需要验证可信性的大数据采用随机抽样检测方法和线性聚合方法,使数据使用者User可在不下载数据的情况下,以高置信率验证数据的可信性,且大大降低了示证验证的计算开销。总之,本专利技术利用基于聚合的广播加密算法的数据签名方案和随机抽样检测方法,能够以高置信率有效地验证大数据的可信性,包括数据来源的可信性和数据内容的可信性。附图说明图1为本专利技术所述的基于随机抽样检测的大数据可信性验证方法的传递关系图;图2是本专利技术一较佳实施例的一种基于随机抽样检测的大数据可信性验证方法的流程图;图3是图2中步骤S1的子流程图;图4是图2中步骤S2的子流程图;图5是图2中步骤S3的子流程图;图6是图2中步骤S4的子流程图;图7是本专利技术实施例中基于随机抽样检测的大数据可信性验证方法的工作流程示意图;图8是本专利技术一较佳实施例的一种基于随机抽样检测的大数据可信性验证系统的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明,应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1和图2所示,本专利技术实施例提供一种基于随机抽样检测的大数据可信性验证方法,包括签证机构cA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样检测的大数据可信性验证方法包括如下步骤:s1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证书。可选地,如图3所示,所述步骤S1包括以下子步骤:Sll、数据属主Owner根据安全参数κ生成公开参数pk和秘密参数sk;S12、根据其身份信息及公开参数pk自签证机构cA获得证书;S13、签证机构CA将自己的证书上传到大数据发布平台BDDP。具体的,所述获取证书的计算方法如下:(1)数据属主Owner选取两个具有相同素数阶p的乘法循环群G和GT,一个可计算的双线性映射e:G×G→GT,以及安全哈希函数h(·):{0,1}*→G,将字符串与G中的元素一一映射;(2)数据属主Owner生成公私钥。随机选择两个元素x∈G\{1},并计算R=g-r,A=e(x,g),A1=e(x,gr)。公钥为pk=(R,A,A1)私钥为sk=(r,X),公开参数为(g,h,p,G,GT,e,R,A,A1);(3)数据属主Owner将其身份信息及公开参数pk发送给签证机构CA,获得证书。本专利技术实施例采用广播加密技术,是一种公钥签名方案,能够支持第三方即数据使用者User验证大数据的可信性,无需数据属主Owner实时在线,通过采用上述方案,使数据使用者User在接收数据时,既能避免哈希函数方案中存在的替换攻击,又能避免散列消息认证码方案中数据属主Owner自己验证数据的可信性,或者需要实时在线将其私钥共享给数据使用者User的局限性。S2、数据的处理:数据属主Owner对大数据进行分块,并生成认证标签;可选地,如图4所示,所述步骤S2包括以下子步骤:S21、数据属主Owner对大数据F进行分块;S22、数据属主Owner根据秘密参数sk为数据块生成认证标签φ;S23、数据属主Owner将大数据、数据块的认证标签φ以及公开参数pk一起上传给大数据发布平台BDDP。具体的,所述数据处理的计算方法如下:(1)对大数据进行分块。给定一个数据文件F,数据属主Owner为其生成一个标识符并将其等分为n个数据块,也即F=(m1,m2,…,mn),并且(2)为数据块生成认证标签。对于每一个数据块mi(1≤i≤n),数据属主Owner为mi计算一个标签其中,Hi=h(fid||i),i为mi的索引。将所有数据块的标签集合表示为φ={σi}1≤i≤n;(3)数据属主Owner将大数据F、认证标签φ、数据属主Owner的证书上传给大数据发布平台BDDP。通过对需要验证可信性的大数据采用随机抽样检测方法和线性聚合方法,使数据使用者User可在不下载数据的情况下,以高置信率验证数据的可信性,且大大降低了示证验证的计算开销。S3、质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的质询;可选地,如图5所示,所述步骤S3包括以下子步骤:S31、数据使用者User从大数据发布平台BDDP处获取数据属主Owner的证书及签证机构本文档来自技高网...
一种基于随机抽样检测的大数据可信性验证方法及系统

【技术保护点】
一种基于随机抽样检测的大数据可信性验证方法,其特征在于:包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样检测的大数据可信性验证方法包括如下步骤:S1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证书;S2、数据的处理:数据属主Owner对大数据进行分块,并生成认证标签;S3、质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的质询;S4、示证的生成:大数据发布平台BDDP根据质询、大数据和认证标签生成该轮可信性验证请求所对应的示证;S5、示证的验证:根据大数据发布平台BDDP返回的示证验证抽样的数据块的可信性,如果示证能通过验证,则当前抽样的大数据处于可信状态;反之则不可信。

【技术特征摘要】
1.一种基于随机抽样检测的大数据可信性验证方法,其特征在于:包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样检测的大数据可信性验证方法包括如下步骤:S1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证书;具体的,所述获得证书的计算方法如下:数据属主Owner选取两个具有相同素数阶p的乘法循环群G和GT,一个可计算的双线性映射e:G×G→GT,以及安全哈希函数h(·):{0,1}*→G,将字符串与G中的元素一一映射;数据属主Owner生成公私钥,随机选择两个元素X∈G\{1},并计算R=g-r,A=e(X,g),A1=e(X,gr),公钥为pk=(R,A,A1),私钥为sk=(r,X),公开参数为(g,h,p,G,GT,e,R,A,A1);数据属主Owner将其身份信息及公开参数pk发送给签证机构CA,获得证书;S2、数据的处理:数据属主Owner对大数据进行分块,并生成认证标签;具体的,所述数据处理的计算方法如下:对大数据进行分块,给定一个数据文件F,数据属主Owner为其生成一个标识符并将其等分为n个数据块,也即F=(m1,m2,...,mn),并且为数据块生成认证标签,对于每一个数据块mi(1≤i≤n),数据属主Owner为mi计算一个标签其中,Hi=h(fid||i),i为mi的索引,将所有数据块的标签集合表示为φ={σi}1≤i≤n;数据属主Owner将大数据F、认证标签φ、数据属主Owner的证书上传给大数据发布平台BDDP;S3、质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的质询;具体的,所述质询chal生成的计算方法如下:(1)在每次验证中,数据使用者User首先随机选取一个元素并计算c1=gt,(2)数据使用者User选取一个随机元素m∈GT,计算c2=Rt;(3)数据使用者User从数据块的集合{1,...,n}中随机选取c个元素I={s1,...,sc},为保证一般性,数据使用者...

【专利技术属性】
技术研发人员:任正伟徐明迪明瑞扬沈楚楚
申请(专利权)人:中国船舶重工集团公司第七零九研究所
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1