System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于加权元联邦学习的隐私保护药物敏感性检测方法技术_技高网

一种基于加权元联邦学习的隐私保护药物敏感性检测方法技术

技术编号:41367721 阅读:3 留言:0更新日期:2024-05-20 10:14
本发明专利技术公开了一种基于加权元联邦学习的隐私保护药物敏感性检测方法,具体涉及药物敏感检测和隐私保护技术领域。一种基于加权元联邦学习的隐私保护药物敏感性检测方法,包括如下步骤:1)数据特征提取;2)通过加权元学习算法进行模型训练;3)加载元学习的模型参数到客户端进行模型微调;4)通过加密客户端损失进行联合更新服务器模型。本发明专利技术所提出的方法不仅可以实现不同机构的数据协作共享同时保护数据隐私,而且可以缓解由于数据数量的限制而导致的过拟合问题以及数据噪声问题,能够提高药物敏感性预测的准确性。

【技术实现步骤摘要】

本专利技术涉及药物敏感检测和隐私保护,具体为一种基于加权元联邦学习的隐私保护药物敏感性检测方法


技术介绍

1、药物敏感性的有效检测可提升药物治疗的效果。因此,开发一种有效的药物敏感性预测方法来设计个性化的治疗方案是一项至关重要的任务。大量研究表明,针对疾病诊断的多样性,每个人都有独特的遗传特征,如基因表达、拷贝数畸变、体细胞突变等,这些多样性的特征对会降低现有药物的治疗效果。近年来,随着高通量测序技术的快速发展,产生了越来越多的组学数据,这些信息丰富的多组学数据被用于构建不同药物敏感性预测的计算模型。

2、人工智能技术已经在医学领域广泛使用。大量研究者已经开发出不同的优秀方法来预测药物的敏感性。这些方法大致可分为两类。第一类方法是通过特征工程提取特征,包括细胞系和药物。第二类方法是基于相似药物在细胞系中产生相似作用,然后通过融合细胞系相似性、药物相似性和细胞系-药物关系来构建异质网络。

3、尽管之前的大量工作已经取得了很好的结果,但由于数据分散在不同的机构中,通常没有足够的本地数据量来可靠地训练药物敏感性预测模型。不同机构之间的数据共享和协作似乎是降低药物敏感性预测成本和提高预测性能的绝佳策略。此外,严格的数据保护法律,在不同机构之间共享数据时可能会导致隐私泄露问题。为了解决上述问题,联邦学习是一种分布式的、保护隐私的机器学习方法,它能够实现不同机构的数据协作,同时保护数据隐私。现有的方法主要针对特定的任务,当被用于新任务时,需要重新进行训练,这就需要额外资源。由于元学习在自然语言处理和计算机视觉等领域能够降低额外资源的需求,因此,元学习被认为对图数据进行训练也是有帮助的。在元学习过程中,高质量的数据可以提高元学习的性能。然而,许多数据集中存在大量的噪声,噪声数据集的存在会降低元学习的性能。为了解决噪声数据的问题,加权方法可以有效缓解数据的噪声,进而提高模型的性能。基于上述内容,本专利技术提出一种基于加权元联邦学习的隐私保护药物敏感性检测方法。


技术实现思路

1、本专利技术的目的在于提供一种基于加权元联邦学习的隐私保护药物敏感性检测方法以实现不同机构的数据协作共享同时保护数据隐私,缓解由于数据数量的限制而导致的过拟合问题以及数据噪声问题,提高药物敏感性预测的准确性。

2、为了实现上述目的,本专利技术采用了如下技术方案:

3、一种基于加权元联邦学习的隐私保护药物敏感性检测方法,包括下列步骤:

4、s1、数据特征提取:利用图神经网络构建细胞系和药物的异构网络模型,提取细胞系和药物的线性和非线性的关系;

5、s2、模型训练:通过加权元学习算法对s1中所构建的异构网络模型进行训练,对异常值或噪声数据点分配较低的权重以降低异常值或噪声数据的重要性,提高模型预测的准确性;

6、s3、模型微调:加载元学习的模型参数到客户端进行模型微调,构建训练损失函数;

7、s4、服务器模型更新:在服务器端,将s3中所得的训练损失发送到服务器更新全局模型参数,通过加密客户端损失进行联合更新服务器模型。

8、优选地,所述s1具体包括如下内容:

9、s1.1、计算第i个和第j个细胞系的基因表达、体细胞突变或拷贝数畸变的相似性,具体计算公式如下所示:

10、

11、其中,xi表示第i细胞系的基因表达、体细胞突变或拷贝数畸变,ε表示缩放参数;

12、s1.2、计算得到基因表达相似矩阵、拷贝数畸变相似矩阵和体细胞突变相似矩阵,具体矩阵表示如下:

13、sg=eg×egt,

14、sc=ec×ect, (2)

15、sm=em×emt,

16、其中,eg,ec,em分别表示基因表达相似性向量、拷贝数畸变相似性向量和体细胞突变相似性向量;

17、s1.3、通过药物子结构指纹的药物jaccard相似度计算药物相似度,具体计算公式如下所示:

18、

19、其中,sdi,j表示第i个和第j个药物的相似性矩阵;

20、s1.4、使用3个m+n行和m+n列的矩阵mg、mc、mm分别存储不同组学相对应的细胞系药物相似性矩阵,具体矩阵表示如下:

21、

22、其中,sd表示药物相似度矩阵;

23、s1.5、构建基因表达对应的细胞系、拷贝数畸变对应的细胞系、体细胞突变和药物对应的细胞系的不同异质网络,其中组学和药物对应的细胞系被视为节点,组学和药物对应的细胞系的关系被视为边缘,进而得到不同组学对应的细胞系和药物的特征矩阵,具体矩阵表示如下:

24、

25、其中,f(·)表示学习器,w1(1),w2(1),w3(1)表示不同组学对应细胞系的参数矩阵和w1(2),w2(2),w3(2)表示不同组学中药物对应的参数矩阵,分别表示基因表达、拷贝数畸变或体细胞突变的细胞系特征,分别表示不同组学对应的药物特征。

26、优选地,所述s2具体包括如下内容:

27、s2.1、设v(l,θ)表示加权学习的体系架构,将加权损失输入到v(l,θ),输出作为样本权值;所述架构中的每个隐藏节点使用relu激活函数,输出层使用sigmoid激活函数以确保输出在[0,1]区间;

28、s2.2、对加权模型的学习体系结构参数进行如下优化:通过表示元学习数据,其中,表示第i个元学习样本,表示对应的元学习标签,m表示元学习样本总数;最小化元学习数据上的元学习损失,得到加权元学习的最优参数和超参数,具体函数表示如下:

29、

30、其中,表示加权元学习的最优参数,表示加权元学习的超参数。

31、优选地,所述s3具体包括如下内容:

32、s3.1、在客户端,使用随机梯度下降方法进行模型的微调,各方的学习器表示为fk(wk),k∈{1,2,…,k},其中fk(wk)表示第k个参与方的学习器,wk表示第k个参与方的模型参数,k表示参与方个数,由此得到第k方的训练损失,具体计算公式如下所示:

33、

34、其中,表示第k个参与方的第i个样本的加权权值,lk表示第k个参与方的元学习损失;

35、s3.2、计算得到第k个参与方的最优模型超参数和模型参数具体计算公式如下所示:

36、

37、其中,表示第k个参与方的最优模型超参数;表示第k个参与方的模型参数。

38、优选地,所述s4具体包括如下内容:

39、s4.1、在服务器端,将k个参与方的训练损失发送到服务器更新全局模型参数,服务器上的全局模型的加密训练损失函数lg表示为:

40、

41、其中,[[lk]]和μk分别表示第k个参与方的加密损失和缩放参数;

42、s4.2、在服务器上解密来自各个参与方的结果,并将这些解密的结果发送给每个参与方以更新本地参数。

43、本文档来自技高网...

【技术保护点】

1.一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,所述S1具体包括如下内容:

3.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,所述S2具体包括如下内容:

4.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,所述S3具体包括如下内容:

5.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,所述S4具体包括如下内容:

【技术特征摘要】

1.一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,包括下列步骤:

2.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法,其特征在于,所述s1具体包括如下内容:

3.根据权利要求1所述的一种基于加权元联邦学习的隐私保护药物敏感性检测方法...

【专利技术属性】
技术研发人员:王庆勇于辉王振宇辜丽川
申请(专利权)人:安徽农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1