当前位置: 首页 > 专利查询>暨南大学专利>正文

基于隐私保护交集计算协议的致病基因检测方法技术

技术编号:24092279 阅读:59 留言:0更新日期:2020-05-09 08:37
本发明专利技术公开了一种基于隐私保护交集计算协议的致病基因检测方法,首先采用布隆过滤器过滤掉不存在于服务器和客户端两方所持有集合的交集中的元素;然后通过简单哈希映射将服务器的元素映射到哈希桶,通过布谷鸟哈希映射将客户端的元素映射到二维哈希表;接着对每个桶中的元素执行N选一ROT扩展协议,将服务器生成的加密序列发送给客户端,将客户端的输出与服务器的加密序列进行交集计算,将经过过滤和哈希映射的客户端集合与计算结果进行比对,最终得出两方的交集元素且不泄露任意方除交集之外的信息。本发明专利技术能够保证基因检测的安全性,减少运行时间和通信开销。

Detection of pathogenic genes based on privacy preserving intersection computing protocol

【技术实现步骤摘要】
基于隐私保护交集计算协议的致病基因检测方法
本专利技术涉及安全多方计算
,特别涉及一种基于隐私保护交集计算协议的致病基因检测方法。
技术介绍
随着现代医学的进步,人类全基因组测序技术变得越来越高效、精确且低价,获取个人的基因组数据越来越容易。由于包含个人的重要敏感信息,如遗传、疾病、亲属、身份等,基因组数据被广泛用作生物学系列测试,如遗传相容性测试、个性化医疗、疾病检测、亲子鉴定等。此外,现阶段关于基因数据使用环境尚不完善,基因测序市场混乱不堪,使得基因数据共享过程中的隐私安全存在极大的隐患。在现有的基因测序研究中,Baldi等人[P.Baldi,R.Baronio,E.DeCristofaro,P.Gasti,andG.Tsudik,“CounteringGATTACA:Efficientandsecuretestingoffully-sequencedhumangenomes,”inProceedingsofthe18thACMconferenceonComputerandcommunicationssecurity,2011本文档来自技高网...

【技术保护点】
1.一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,包括步骤:/nS1、将持有致病基因组序列集合的检测机构作为服务器S,所持有的集合用X表示,集合大小用n

【技术特征摘要】
1.一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,包括步骤:
S1、将持有致病基因组序列集合的检测机构作为服务器S,所持有的集合用X表示,集合大小用n1表示;将持有全基因组序列集合的被检测者作为客户端C,所持有的集合用Y表示,集合大小用n2表示;
服务器S对集合X中所有元素编码后采用若干个不同的哈希函数映射到一维位向量表中,产生布隆过滤器BX并发送给客户端C;客户端C对集合Y中所有元素编码进行相同的哈希映射,通过布隆过滤器BX过滤掉不存在于集合X和集合Y这两个集合交集中的元素,客户端C过滤后的集合用Y'表示,集合大小用n3表示;
S2、服务器S采用简单哈希的映射方式,使用e个随机均匀的哈希函数将集合X中每个元素映射到b个哈希桶中的e个位置上,而无视桶中是否已存在其他元素,即每个元素有e个位置;客户端C采用布谷鸟哈希的映射方式,使用相同的e个哈希函数将集合Y'中每个元素映射到含有b个哈希桶的二维哈希表中,每个元素在哈希表中仅有一个位置;
S3、映射完成之后,分别对每个桶中的元素执行m次N选一ROT扩展协议,执行完成后服务器S输出N个加密序列,客户端C输出N个加密序列中的一个加密序列;
S4、将服务器S生成的加密序列发送给客户端C,然后将客户端C的输出与服务器S的加密序列进行交集计算,从而获得集合X和集合Y'的交集的全部密文数据;将集合Y'中的元素采用与步骤S2中相同哈希映射方式进行映射并与密文数据进行比对,推得对应交集的明文元素;最终,服务器S输出为空,客户端C输出X∩Y'。


2.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的全基因组序列集合存储在VCF文本中,该文本包含每条基因序列相对于公共参照序列所有的突变位点,将双方基因序列中的四种碱基分别编码为00、01、11、10,编码后的两方数据集合为规模不同的二进制序列集合。


3.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的步骤S1中生成的布隆过滤器是一个位向量表示的数据结构,所有bit位均初始化为0,将元素通过若干哈希函数分别映射到位向量表中,并将对应bit位的0置为1;判断某元素是否存在集合中的决策如下:
(1)将该元素通过相同的哈希函数映射到位向量表中;
(2)若存在对应的bit位为0,则该元素一定不存在集合中;
(3)若所有对应的bit位均为1,则该元素可能存在集合中。


4.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,所述的布谷鸟哈希是采用e个哈希函数将每个元素映射到b个哈希桶中,每个元素只映射到b个桶中的一个位置上,具体的映射策略如下:
(1)若映射的e个位置全为无元素的空桶,则采用哈希函数在任选一个位置插入;
(2)若e个位置有一个或多个为空桶,则采用哈希函数在任选一个空桶插入;
(3)若e个位置全都存储了其他元素且存在未满4个元素的桶,则采用哈希函数在任选一个未满4个元素的桶插入;
(4)若e个位置全都存储了4个元素,则任选一个桶踢出原来的某个元素,并通过对应的哈希函数插入新元素,然后对被踢出的元素循环调用该算法,采用其他哈希函数插入到新的位置,直到插入成功。


5.根据权利要求1所述的一种基于隐私保护交集计算协议的致病基因检测方法,其特征在于,在步骤S3中,当执行次数为i时,1≤i≤m,执行该次N选一ROT扩展协议的具体过程如下:
S31、服务器S向N选一ROT扩展协议接收方输入为空,客户端C向N选一ROT扩展协议接收方输入二维哈希表的每个桶中的元素r[i]∈{0,...,N-1}并作为N选一ROT扩展协议接收方的选择向量;
S32、执行κ次基础2选一OT协议,客户端C持有κ个随机密钥对服务器S持有选择向量s←{0,1}κ并输出其中j表示执行基础2选一OT协议的次序,1≤j≤κ,s[...

【专利技术属性】
技术研发人员:翁健田美金刘志全马建峰杨雅希黄昱铭王伟聪张怡
申请(专利权)人:暨南大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1