System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向基因组数据的匹配患者查询方法技术_技高网
当前位置: 首页 > 专利查询>五邑大学专利>正文

面向基因组数据的匹配患者查询方法技术

技术编号:41379456 阅读:16 留言:0更新日期:2024-05-20 10:21
本发明专利技术实施例提供了一种面向基因组数据的匹配患者查询方法。方法包括:初始化医疗机构MI系统,生成系统参数和密钥,并为用户提供注册服务;在基因组数据库S上构建新型压缩德布鲁因图并加密,将加密的德布鲁因图外包给第一代理服务器PS<subgt;1</subgt;;对成功注册的用户生成加密查询,并将加密查询发送给第一代理服务器PS<subgt;1</subgt;;在收到加密查询后,第一代理服务器PS<subgt;1</subgt;在第二代理服务器PS<subgt;2</subgt;的辅助下将搜索加密的德布鲁因图并返回具有匹配患者加密标识符,以使用户通过解密密文读取所有标识符。基于此,本发明专利技术实施例能够使得用户可以在不泄漏患者隐私的前提下进行匹配性计算,实现更精确和高效的匹配患者查询。

【技术实现步骤摘要】

本专利技术实施例涉及数据查询,尤其涉及一种面向基因组数据的匹配患者查询方法


技术介绍

1、在过去的十年里,高通量测序技术的飞速发展使人类基因组测序成本显著降低了100倍,导致基因组学领域产生了大量可用数据。其中,个体化医疗作为基于这些数据的重要应用之一,引发了广泛关注。通过分析个人基因信息,医生能够为患者量身定制更适合的药物和治疗方法,从而提高治疗效果。查询包含某特定片段的匹配患者查询作为个体化医疗的一种,迫切需要可靠、高效的方法来定位和分析特定基因片段。

2、然而,由于基因组数据的大规模和高维度(人类基因组总是由大约29.1亿个碱基对组成),匹配患者查询的计算任务是极其庞大的。为了应对这一挑战,计算任务通常被外包给一个或多个第三方计算提供商。尽管这种方法减轻了医疗机构和从业者的计算负担,但它引入了与敏感基因组数据相关的重要隐私和安全问题。一方面,医疗机构维护的基因组数据库通常由大规模的患者标识符和基因组组成,一旦直接将其外包给第三方,敏感的患者个人信息可能会被泄露,这无疑会给患者带来困扰。例如,患有某些疾病的患者在就业过程中可能会受到不同行业的歧视。另一方面,医生发送的查询总是包含新患者的基因组数据。除了原始基因组外,患者的潜在遗传疾病也会由第三方获得。在利益的诱惑下,第三方很可能将用户的信息泄露给保险公司,然后保险公司可以拒绝相关用户的健康保险,避免经济损失。总之,不受信任的第三方会增加匹配患者查询过程的隐私风险。


技术实现思路

1、本专利技术实施例提供了一种面向基因组数据的匹配患者查询方法,能够使得用户可以在不泄漏患者隐私的前提下进行匹配性计算,实现更精确和高效的匹配患者查询。

2、第一方面,本专利技术实施例提供了一种面向基因组数据的匹配患者查询方法,包括:

3、初始化医疗机构mi系统,生成系统参数和密钥,并为用户提供注册服务;

4、在基因组数据库s上构建新型压缩德布鲁因图并加密,将加密的德布鲁因图外包给第一代理服务器ps1;

5、对成功注册的用户生成加密查询,并将加密查询发送给第一代理服务器ps1;

6、在收到加密查询后,第一代理服务器ps1在第二代理服务器ps2的辅助下将搜索加密的德布鲁因图并返回具有匹配患者加密标识符,以使用户通过解密密文读取所有标识符。

7、在一些实施例中,所述初始化医疗机构mi系统,生成系统参数和密钥,并为用户提供注册服务,包括:

8、给定安全参数{km,kr,kl,kp,kq},医疗机构mi运行she加密算法生成公共参数和密钥{pp,sk,m}←keygen{km,kr,kl,kp,kq},医疗机构mi生成公钥pk={pp,e(0)1,e(0)2};

9、医疗机构mi选择一个安全哈希函数h()并为用户kqui生成一个密钥ku,当用户用标识符idqui向系统注册时,医疗机构mi将kqui=h(idqui,kq)授权给qui;

10、医疗机构mi选择基因组片段的长度k;

11、医疗机构mi发布{h(),k,pk,m},并将ku和sk分别发送给第一代理服务器ps1和第二代理服务器ps2。

12、在一些实施例中,所述在基因组数据库s上构建新型压缩德布鲁因图并加密,包括:

13、在基因组数据库s上构建新型压缩德布鲁因图,假设基因组数据库s中的基因序列数量为n,每个基因序列都有一个唯一患者标识符,并表示为s={(s1,id1),...,(sn,idn)};

14、在基因组数据库s中运行单元最大化算法生成最大单元,以构建加密的德布鲁因图e(γ)。

15、在一些实施例中,所述在基因组数据库s中运行单元最大化算法生成最大单元,包括:

16、使用kmc3算法从基因组数据库s中获得代表边初始枚举的(k+1)-mer;

17、假设k-mer v的两个面分别为左面s(v)l和右面s(v)r,每个(k+1)-mer e={(u,s(u)r),(v,s(v)l)}∈e通过s(u)r和s(v)l将u和v连到一起;在遍历g(s,k)=(v,e)时,只需跟踪每个k-mer v∈v的每个面s(v)的信息;

18、采用((k+1)-mer,state)键值对的哈希表来为边及其状态建立关联数据结构,以保持g(s,k)中边的状态;

19、将桶表bt1中|e|的边标记为中未访问状态,随后,对g(s,k)进行遍历,每次遍历w=(v0,e1,v1...,vn-1,en,vn)对应于s的一个字符串s∈s;对于w(s)中的每条边ei,检查由边ei连接的两个顶点vi和vi+1相关联的面s(vi)r和s(vi+1)l,并执行相应的状态转移以调整ei的自动机状态;在对g(s,k)进行一次完整的遍历之后,生成边的实际状态;

20、根据h1中的边状态信息枚举出状态编码为(1,1)的边,然后在桶表bt2的分区中识别出对应的顶点对,并将所述顶点合并在一起,直到遍历完所有的边,从而生成最大单元。

21、在一些实施例中,所述方法还包括:

22、在生成最大单元之后,医疗机构mi将所述最大单元插入单元数组u中,并得到一个唯一的标识符idu;

23、将每个u分解为一组k-mer,并从中提取最小化器,每个最小化器由u中的偏移量os识别;

24、将最小化器插入到哈希表mindex中,并与最小化器在u中的偏移量os以及标识符idu进行关联。

25、在一些实施例中,所述对成功注册的用户生成加密查询,并将加密查询发送给第一代理服务器ps1,包括:

26、当用户qui使用患者查询服务时,基于查询序列sq生成最小化器miniq和偏移量osq,并使用she算法加密<sq,miniq,osq>;

27、用户qui用授权密钥kqui计算h(e(<sq,miniq,osq>)),并将e(<sq,miniq,osq>)||idqui||h(e(<sq,miniq,osq>),kqui)发送到第一代理服务器ps1。

28、在一些实施例中,所述在收到加密查询后,第一代理服务器ps1在第二代理服务器ps2的辅助下将搜索加密的德布鲁因图并返回具有匹配患者加密标识符,以使用户通过解密密文读取所有标识符,包括:

29、第一代理服务器ps1收到e(<sq,miniq,osq>)||idqui||h(e(<sq,miniq,osq>),kqui)后,用ku计算kqui=h(idqui,ku)和h(e(<sq,miniq,osq>),kqui),从接收到的信息中提取h(e(<sq,miniq,osq>),kqui)并判断是否与h(e(<sq,miniq,osq>))相等;

30、如果相等,第一代理服务器ps1从e(<sq,miniq,os本文档来自技高网...

【技术保护点】

1.一种面向基因组数据的匹配患者查询方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述初始化医疗机构MI系统,生成系统参数和密钥,并为用户提供注册服务,包括:

3.根据权利要求1所述的方法,其特征在于,所述在基因组数据库S上构建新型压缩德布鲁因图并加密,包括:

4.根据权利要求3所述的方法,其特征在于,所述在基因组数据库S中运行单元最大化算法生成最大单元,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述对成功注册的用户生成加密查询,并将加密查询发送给第一代理服务器PS1,包括:

7.根据权利要求6所述的方法,其特征在于,所述在收到加密查询后,第一代理服务器PS1在第二代理服务器PS2的辅助下将搜索加密的德布鲁因图并返回具有匹配患者加密标识符,以使用户通过解密密文读取所有标识符,包括:

8.根据权利要求7所述的方法,其特征在于,所述第二代理服务器PS2返回包含患者标识符的单元标识符E(idqui),包括:

9.根据权利要求7所述的方法,其特征在于,所述安全过滤协议的运行过程如下:

10.根据权利要求7所述的方法,其特征在于,所述安全包含协议的运行过程如下:

...

【技术特征摘要】

1.一种面向基因组数据的匹配患者查询方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述初始化医疗机构mi系统,生成系统参数和密钥,并为用户提供注册服务,包括:

3.根据权利要求1所述的方法,其特征在于,所述在基因组数据库s上构建新型压缩德布鲁因图并加密,包括:

4.根据权利要求3所述的方法,其特征在于,所述在基因组数据库s中运行单元最大化算法生成最大单元,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述对成功注册的用户生成加密查询,并将...

【专利技术属性】
技术研发人员:高乐荆涵
申请(专利权)人:五邑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1