System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 生物标志物的可解释交互作用快速遍历检测方法及装置制造方法及图纸_技高网

生物标志物的可解释交互作用快速遍历检测方法及装置制造方法及图纸

技术编号:41278830 阅读:5 留言:0更新日期:2024-05-11 09:30
本发明专利技术提供一种生物标志物的可解释交互作用快速遍历检测方法及装置,该方法包括如下步骤:S1、获取原始数据,并计算交互作用分析次数;获得GPU单次运算可承载的运算批次数;对原始数据进行数据分割,得到对应的数据分割结果;构建可解释交互作用关系的函数库;S2、获取对应批次指定的原始数据,利用函数库对标志物的组合进行全局交互作用分析,以获得全局交互作用结果,进行个体化交互作用分析,以生成个体化数据;S3、对全局和个体化数据与表型数据进行统计分析,以筛选并输出结果数据。该方法解决在以往的交互作用研究中耗时时间长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题。

【技术实现步骤摘要】

本专利技术涉及数据挖掘分类及生物医药,具体涉及一种针对大规模生物标志物的可解释交互作用快速遍历检测方法及装置


技术介绍

1、生物标志物在确定生物特有属性中起到重要的作用,如鉴定疾病类型、表型类型、药物敏感性、评估个体风险等。一般而言,其中一个生物标志物的真实效应往往会随着另一个生物标志物的改变而发生改变,但是当两种或两种以上的生物标志物同时存在的效应不等于单个作用相联合的效应时,各因素之间存在交互作用。因此,有必要研究生物标志物之间的交互作用,以揭示暴露影响疾病发生的机制。但是,由于生物标志物的数量往往超过万、十万、百万,因此生物标志物的交互作用计算量巨大,需要完成亿、100亿、万亿次的计算。传统方法完成相应运算,就单台电脑(16g内存,i5cpu)而言,需要几个月或几年的时间,无法对全部生物标志物的交互作用进行遍历,至今大规模交互作用计算,是各领域的痛点。因此,针对大规模生物标志物的交互作用快速遍历检测是亟待解决的一个难题。

2、专利技术人在研究中发现,传统的交互作用分析还存在一个解释困难的特点,也就是说尽管发现两个生物标志物存在交互作用,这种交互作用仅仅是偏离随机,而不能具体知道什么含义,阻碍交互作用的发展。因此,有必要提供一种针对大规模生物标志物的可解释交互作用快速遍历检测方法,以解决在以往的交互作用研究中存在的耗时长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题。


技术实现思路

1、为了解决在以往的交互作用研究中,计算交互作用耗时长,无法实现全遍历,并且交互作用关系不明确,可解释性差,给交互作用分析带来的巨大障碍的问题,本专利技术的目的在于提供一种针对大规模生物标志物(指标或特征值)的可解释交互作用快速遍历检测方法。

2、为实现上述目的,本专利技术的技术方案如下。

3、本专利技术的第一方面提供一种生物标志物的可解释交互作用快速遍历检测方法,包括如下步骤:

4、s1、获取原始数据,所述原始数据为含有一种或多种类型标志物的表达矩阵;对所述原始数据进行计算得出交互作用分析次数,对所述交互作用分析次数进行计算,以获得gpu单次运算可承载的运算批次数;当gpu单次运算可承载的运算批次数>1时,根据gpu单次运算可承载的运算批次数对所述原始数据进行数据分割,得到对应的数据分割结果;以及构建可解释交互作用关系的函数库;

5、s2、根据所述数据分割结果获取对应批次指定的原始数据;利用函数库对所述对应批次指定的原始数据中标志物的组合进行全局交互作用分析,以获得全局交互作用结果,和/或,利用函数库对所述对应批次指定的原始数据中标志物的组合进行个体化交互作用分析,以生成个体化数据;

6、s3、对所述全局交互作用结果,和/或,所述个体化数据,以及所述对应批次指定的原始数据中的表型数据进行统计分析,以筛选并输出结果数据,所述结果数据为具有交互作用关系的表达矩阵。

7、本专利技术的方法能够充分利用gpu的多核心计算单元,极大的节约了时间,使得原来在几个月或几年内能够完成的计算任务在几分钟或几十分钟内解决,极大地推进交互作用研究。并且交互作用是基于可解释函数库进行,因此获得的交互作用意义明确,易于个体化,个体化的交互作用可以作为新特征进行高级分类、预测等研究。

8、进一步,s1中,获取原始数据之前,还包括:将一种或多种类型标志物、样本数据、表型数据组成矩阵或分块矩阵并输入,以生成原始数据;

9、s2中,对应批次指定的原始数据中排除标志物外的数据为样本数据。

10、进一步,s1中,交互作用分析次数是全遍历或部分遍历的交互作用分析次数。本专利技术中,计算同一种类型标志物的表达矩阵的交互作用分析次数的全遍历方式是循环计算第i行与余下n-i行的交互作用,n为标志物的总行数,i为≥1的整数。计算不同类型标志物的表达矩阵的交互作用分析次数的全遍历方式是循环计算每个矩阵的行与其他矩阵的行的交互作用。

11、进一步,s1中,获得gpu单次运算可承载的运算批次数的具体计算方式为:k=n/l(1);式(1)中,k为gpu单次运算可承载的运算批次数;n为交互作用分析总次数;l为gpu每批次所运行的交互作用分析次数。

12、进一步,s1中,所述函数库是具有一元及多元函数表达式的函数库。

13、进一步,s3中,所述个体化数据是对标志物的组合根据函数库计算而成的能够度量交互作用关系的数据。

14、进一步,s4中,所述统计分析为差异检验分析或相关性分析。

15、进一步,s4中,筛选并输出结果数据,具体包括:显著结果筛选,以获得具有交互作用关系的表达矩阵。其中,所述显著结果筛选是使用多重检验校正方法以保证结果的阳性率。

16、本专利技术的第二方面提供一种生物标志物的可解释交互作用快速遍历检测装置,包括函数构建模块、数据获取模块、数据计算模块、分割模块和处理模块,以及与所述函数构建模块、所述数据获取模块、所述数据计算模块、所述分割模块和所述处理模块均电连接的存储模块;

17、所述函数构建模块,用于构建可解释交互作用关系的函数库,并将建立的函数库发送至所述处理模块和/或所述存储模块;

18、所述数据获取模块,用于发起获取数据请求,获取所述存储模块中的原始数据,并分配至所述数据计算模块;所述原始数据为一种或多种类型标志物的表达矩阵;

19、所述数据计算模块,用于接收分配的所述原始数据,并对分配的所述原始数据计算交互作用分析次数,得到第一数据,再对第一数据计算gpu单次运算可承载的运算批次,得到第二数据,将所述第一数据和所述第二数据发送至所述分割模块和/或所述存储模块;

20、所述分割模块,用于接收所述数据计算模块发送的第一数据和第二数据,根据所述第二数据对所述第一数据进行数据分割,得到对应的数据分割结果,并将所述数据分割结果发送至所述处理模块和/或所述存储模块;

21、所述处理模块,用于接收所述分割模块发送的数据分割结果,以及接收所述函数构建模块发送的函数库,根据所述数据分割结果获取所述存储模块中的对应批次指定的原始数据,并利用所述函数库对所述对应批次指定的原始数据中的标志物的组合进行全局交互作用或个体化交互作用分析,生成第三数据,对所述第三数据与所述对应批次指定的原始数据中的表型数据进行统计分析,以筛选得到结果数据,并将所述结果数据发送至所述存储模块;所述第三数据为个体化数据;所述结果数据为具有交互作用关系的表达矩阵;

22、所述存储模块,用于存储所述函数构建模块写入的函数库、所述数据计算模块发送的所述第一数据和所述第二数据、所述分割模块发送的所述数据分割结果以及所述处理模块发送的结果数据。

23、本专利技术的第三方面提供一种电子设备,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于在调用计算机程序时执行上述可解释交互作用快速遍历检测方法。

24、本专利技术本文档来自技高网...

【技术保护点】

1.一种生物标志物的可解释交互作用快速遍历检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S1中,获取原始数据之前,还包括:

3.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S1中,交互作用分析次数是全遍历或部分遍历的交互作用分析次数。

4.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S1中,所述函数库是具有一元及多元函数表达式的函数库。

5.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S2中,所述个体化数据是对标志物的组合根据函数库计算而成的能够度量交互作用关系的数据。

6.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S3中,所述统计分析为差异检验分析或相关性分析。

7.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,S3中,筛选并输出结果数据,具体包括:

8.一种生物标志物的可解释交互作用快速遍历检测装置,其特征在于,包括函数构建模块、数据获取模块、数据计算模块、分割模块和处理模块,以及与所述函数构建模块、所述数据获取模块、所述数据计算模块、所述分割模块和所述处理模块均电连接的存储模块;

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于在调用计算机程序时执行权利要求1~7中任意一项所述的可解释交互作用快速遍历检测方法。

10.一种计算机可读或可写存储介质,其特征在于,所述计算机可读或可写存储介质上存储有计算机程序,计算机程序被处理器执行时实现权利要求1~7中任意一项所述的可解释交互作用快速遍历检测方法。

...

【技术特征摘要】

1.一种生物标志物的可解释交互作用快速遍历检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,s1中,获取原始数据之前,还包括:

3.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,s1中,交互作用分析次数是全遍历或部分遍历的交互作用分析次数。

4.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,s1中,所述函数库是具有一元及多元函数表达式的函数库。

5.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,s2中,所述个体化数据是对标志物的组合根据函数库计算而成的能够度量交互作用关系的数据。

6.根据权利要求1所述的生物标志物的可解释交互作用快速遍历检测方法,其特征在于,s3中,所述统计分析...

【专利技术属性】
技术研发人员:姜永帅陶俊先张明明徐静吕洪超魏思宇孙晨吕文华
申请(专利权)人:哈尔滨医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1