System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于使用指纹分析将化合物与生理状况相关联的系统和方法技术方案_技高网

用于使用指纹分析将化合物与生理状况相关联的系统和方法技术方案

技术编号:40525889 阅读:10 留言:0更新日期:2024-03-01 13:45
本发明专利技术提供了用于将化合物与生理状况相关联的系统和方法。获得化合物化学结构的指纹并将其输入到输出一个或多个计算出的激活评分的模型。每个激活评分表示模块的集合中的细胞组分模块,其中每个模块包括细胞组分的子集,并且所述模块的集合中的第一模块与所述生理状况相关联。当针对所述第一模块的所述激活评分满足阈值标准时,所述化合物被识别为与所述生理状况相关联。在一些方面,每个激活评分表示与所述生理状况相关联的扰动特征,并且当针对第一扰动特征的所述激活评分满足阈值标准时,识别出所述化合物。本发明专利技术还提供了用于训练将化合物与生理状况相关联的模型的系统和方法。

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术总体涉及用于将化合物与生理状况相关联的系统和方法。


技术介绍

1、对细胞机制的研究对于理解疾病来说很重要。

2、生物组织是动态且高度网络化的多细胞系统。特定细胞中的亚细胞网络的功能障碍会改变细胞行为的整体形势并导致疾病状态。现有的药物发现努力试图表征导致细胞从健康状态转变为疾病状态的分子机制,并鉴定逆转或抑制这些转变的药理学方法。过去的努力还寻求鉴定表征这些转变的分子签名,以及鉴定逆转这些签名的药理学方法。

3、关于通过表面标志物富集的组织或细胞中的大量细胞集合的分子数据会掩盖群体中的各个细胞的表型和分子多样性。这些大量细胞集合中的细胞的异质性致使当前旨在阐明疾病驱使机制的努力的结果具有误导性,或者甚至完全不正确。新方法诸如单细胞rna测序可以在分子水平上表征各个细胞。这些数据为以较高分辨力理解不同的细胞状态提供了基础,并揭示了细胞所拥有的丰富且显着的状态多样性。

4、当解释单细胞数据时存在重大挑战,即这些数据的稀疏性(忽略存在于细胞中的分子的存在)和噪声,这些分子测量的准确度具有不确定性。因此,需要新方法来得到对用于控制单种细胞状态的药理学方法的深刻理解,并对应地解决疾病。

5、此外,通常不能将复杂的疾病分解为单个或几个分子靶点。尽管针对体外疾病模型的高通量成像技术和高通量筛选最近取得进展,但将从基于体外的筛选方法产生的候选靶点转化为有功效的药物是艰巨的任务,该任务通常涉及回到相对缓慢和低效的基于分子靶点的药物发现方法。

6、鉴于上述背景,本领域所需要的是用于识别用于药物发现的候选化合物的系统和方法。


技术实现思路

1、本公开解决了上述缺点。本公开用与目的生理状况(例如,目的表型、疾病、细胞状态和/或细胞过程)相对应的细胞组分数据(例如,基因的丰度和/或扰动特征)来至少部分地解决这些缺点,并使用潜在表示和机器学习来确定细胞组分的模块(例如,子集)与目的生理状况之间的关联(例如,权重和/或相关)。特别地,本公开提供了用于阐明各种生理状况(诸如疾病)背后的分子机制的系统和方法。

2、本公开的一方面提供了一种将测试化学化合物与目的生理状况相关联的方法。该方法包括(a)获得测试化学化合物的化学结构的指纹。

3、该方法进一步包括(b)获取细胞组分模块的集合。细胞组分模块的集合中的每个相应的细胞组分模块包括多种细胞组分的相应的独立子集。针对多种细胞组分的每个相应的独立子集的对应的多个基于细胞的测定丰度值跨与生理状况相关联的多种不同状态而单独相关。细胞组分模块的集合中的第一细胞组分模块与目的生理状况相关联。

4、该方法进一步包括(c)响应于将化学结构的指纹输入到模型中,检索针对细胞组分模块的集合中的每个细胞组分模块的相应的激活评分,作为来自该模型的输出。在一些实施例中,模型包括50个或更多个参数、100个或更多个参数、1000个或更多个参数,或10,000个或更多个参数。

5、该方法进一步包括(d)当针对第一细胞组分模块的激活评分满足第一阈值标准时,将测试化学化合物与目的生理状况相关联。

6、在一些实施例中,基于细胞的测定丰度值为器官的细胞的测定丰度值。在一些此类实施例中,器官为心脏、肝脏、肺部、肌肉、脑、胰腺、脾脏、肾脏、小肠、子宫或膀胱。

7、在一些实施例中,基于细胞的测定丰度值为组织的细胞的测定丰度值。在一些实施例中,组织为骨骼、软骨、关节、气管、脊髓、角膜、眼睛、皮肤或血管。

8、在一些实施例中,基于细胞的测定丰度值为多个干细胞中的细胞的测定丰度值。在一些实施例中,多个干细胞为多个胚胎干细胞、多个成体干细胞或多个诱导性多能干细胞(ipsc)。

9、在一些实施例中,基于细胞的测定丰度值为多个原代人细胞中的细胞的测定丰度值。在一些此类实施例中,多个原代人细胞为多个cd34+细胞、多个cd34+造血干细胞、多个祖细胞(hspc)、多个t细胞、多个间充质干细胞(msc)、多个气道基底干细胞或多个诱导性多能干细胞。

10、在一些实施例中,基于细胞的测定丰度值为脐带血中、外周血中或骨髓中的细胞的测定丰度值。

11、在一些实施例中,基于细胞的测定丰度值为实体组织中的细胞的测定丰度值。在一些此类实施例中,实体组织为胎盘、肝脏、心脏、脑、肾脏或胃肠道。

12、在一些实施例中,基于细胞的测定丰度值为多个分化细胞的测定丰度值。在一些此类实施例中,多个分化细胞为多个巨核细胞、多个成骨细胞、多个软骨细胞、多个脂肪细胞、多个肝细胞、多个肝间皮细胞、多个胆管上皮细胞、多个肝星状细胞、多个肝窦内皮细胞、多个库普弗细胞、多个隐窝细胞、多个血管内皮细胞、多个胰管上皮细胞、多个胰管细胞、多个腺腔中心细胞、多个腺泡细胞、多个朗格尔汉斯小岛)、多个心肌细胞、多个纤维母细胞、多个角质形成细胞、多个平滑肌细胞、多个i型肺泡上皮细胞、多个ii型肺泡上皮细胞、多个克拉拉细胞、多个纤毛上皮细胞、多个基底细胞、多个杯状细胞、多个神经内分泌细胞、多个库尔契茨基细胞、多个肾小管上皮细胞、多个尿路上皮细胞、多个柱状上皮细胞、多个肾小球上皮细胞、多个肾小球内皮细胞、多个足细胞、多个血管系膜细胞、多个神经细胞、多个星形胶质细胞、多个小胶质细胞或多个少突胶质细胞。

13、在一些实施例中,对应的多个基于细胞的测定丰度值为多个细胞的单细胞核糖核酸(rna)测序(scrna-seq)数据。在一些此类实施例中,通过将细胞的不同等分试样暴露于一种或多种已知影响生理状况的参考化合物而得到与生理状况相关联的多种不同状态,此外还得到对照状态,在该对照状态下,细胞的等分试样并未免于暴露于已知影响生理状况的化合物。

14、在一些实施例中,对应的多个基于细胞的测定丰度值来自大量rna序列。

15、在一些实施例中,对应的多个基于细胞的测定丰度值来自单细胞rna测序。

16、在一些实施例中,细胞组分模块的集合由第一细胞组分模块组成。

17、在一些实施例中,细胞组分模块的集合包括多个细胞组分模块,并且模型为包括多个成分模型的集成模型。响应于将化学结构的指纹输入到多个成分模型中的每个成分模型中,多个成分模型中的每个成分模型提供针对细胞组分模块的集合中的不同细胞组分模块的激活评分。

18、在一些实施例中,该方法进一步包括根据测试化学化合物的简化分子输入行输入系统(smiles)字符串表示来计算指纹。

19、在一些此类实施例中,多个成分模型中的每个成分模型为对应的神经网络(例如,全连接神经网络、消息传递神经网络或其组合)。在一些实施例中,对应的神经网络为对应的全连接神经网络和对应的消息传递神经网络的组合,响应于将化学结构的指纹输入到对应的全连接神经网络和对应的消息传递神经网络中,将对应的全连接神经网络的第一输出和对应的消息传递神经网络的第二输出组合,以确定一个或多个计算出的激活评分中的针对细胞组分模块的集合中的对应的细胞组分模块的激活本文档来自技高网...

【技术保护点】

1.一种将测试化学化合物与目的生理状况相关联的方法,所述方法包括:

2.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为器官的细胞的测定丰度值。

3.根据权利要求2所述的方法,其中所述器官为心脏、肝脏、肺部、肌肉、脑、胰腺、脾脏、肾脏、小肠、子宫或膀胱。

4.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为组织的细胞的测定丰度值。

5.根据权利要求4所述的方法,其中所述组织为骨骼、软骨、关节、气管、脊髓、角膜、眼睛、皮肤或血管。

6.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个干细胞中的细胞的测定丰度值。

7.根据权利要求6所述的方法,其中所述多个干细胞为多个胚胎干细胞、多个成体干细胞或多个诱导性多能干细胞(iPSC)。

8.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个原代人细胞中的细胞的测定丰度值。

9.根据权利要求8所述的方法,其中所述多个原代人细胞为多个CD34+细胞、多个CD34+造血干细胞、多个祖细胞(HSPC)、多个T细胞、多个间充质干细胞(MSC)、多个气道基底干细胞或多个诱导性多能干细胞。

10.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为脐带血中、外周血中或骨髓中的细胞的测定丰度值。

11.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为实体组织中的细胞的测定丰度值。

12.根据权利要求11所述的方法,其中所述实体组织为胎盘、肝脏、心脏、脑、肾脏或胃肠道。

13.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个分化细胞的测定丰度值。

14.根据权利要求13所述的方法,其中所述多个分化细胞为多个巨核细胞、多个成骨细胞、多个软骨细胞、多个脂肪细胞、多个肝细胞、多个肝间皮细胞、多个胆管上皮细胞、多个肝星状细胞、多个肝窦内皮细胞、多个库普弗细胞、多个隐窝细胞、多个血管内皮细胞、多个胰管上皮细胞、多个胰管细胞、多个腺腔中心细胞、多个腺泡细胞、多个朗格尔汉斯小岛、多个心肌细胞、多个纤维母细胞、多个角质形成细胞、多个平滑肌细胞、多个I型肺泡上皮细胞、多个II型肺泡上皮细胞、多个克拉拉细胞、多个纤毛上皮细胞、多个基底细胞、多个杯状细胞、多个神经内分泌细胞、多个库尔契茨基细胞、多个肾小管上皮细胞、多个尿路上皮细胞、多个柱状上皮细胞、多个肾小球上皮细胞、多个肾小球内皮细胞、多个足细胞、多个血管系膜细胞、多个神经细胞、多个星形胶质细胞、多个小胶质细胞或多个少突胶质细胞。

15.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值为多个细胞的单细胞核糖核酸(RNA)测序(scRNA-seq)数据。

16.根据权利要求15所述的方法,其中通过将细胞的不同等分试样暴露于一种或多种已知影响所述生理状况的参考化合物而得到与所述生理状况相关联的所述多种不同状态,此外还得到对照状态,在所述对照状态下,细胞的等分试样并未免于暴露于已知影响所述生理状况的化合物。

17.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值来自大量RNA序列。

18.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值来自单细胞RNA测序。

19.根据权利要求1至18中任一项所述的方法,其中所述细胞组分模块的集合由所述第一细胞组分模块组成。

20.根据权利要求1至18中任一项所述的方法,其中所述细胞组分模块的集合包括多个细胞组分模块并且所述模型为包括多个成分模型的集成模型,并且其中所述多个成分模型中的每个成分模型响应于将所述化学结构的所述指纹输入到所述多个成分模型中的每个成分模型中而提供针对不同细胞组分模块的激活评分。

21.根据权利要求1至20中任一项所述的方法,所述方法进一步包括根据所述测试化学化合物的简化分子输入行输入系统(SMILES)字符串表示来计算所述指纹。

22.根据权利要求20或21所述的方法,其中所述多个成分模型中的每个成分模型为对应的神经网络。

23.根据权利要求22所述的方法,其中所述对应的神经网络为全连接神经网络、消息传递神经网络或其组合。

24.根据权利要求20或21所述的方法,其中所述多个成分模型中的成分模型为逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

25.根据权利要求22所述的方法,其...

【技术特征摘要】
【国外来华专利技术】

1.一种将测试化学化合物与目的生理状况相关联的方法,所述方法包括:

2.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为器官的细胞的测定丰度值。

3.根据权利要求2所述的方法,其中所述器官为心脏、肝脏、肺部、肌肉、脑、胰腺、脾脏、肾脏、小肠、子宫或膀胱。

4.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为组织的细胞的测定丰度值。

5.根据权利要求4所述的方法,其中所述组织为骨骼、软骨、关节、气管、脊髓、角膜、眼睛、皮肤或血管。

6.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个干细胞中的细胞的测定丰度值。

7.根据权利要求6所述的方法,其中所述多个干细胞为多个胚胎干细胞、多个成体干细胞或多个诱导性多能干细胞(ipsc)。

8.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个原代人细胞中的细胞的测定丰度值。

9.根据权利要求8所述的方法,其中所述多个原代人细胞为多个cd34+细胞、多个cd34+造血干细胞、多个祖细胞(hspc)、多个t细胞、多个间充质干细胞(msc)、多个气道基底干细胞或多个诱导性多能干细胞。

10.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为脐带血中、外周血中或骨髓中的细胞的测定丰度值。

11.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为实体组织中的细胞的测定丰度值。

12.根据权利要求11所述的方法,其中所述实体组织为胎盘、肝脏、心脏、脑、肾脏或胃肠道。

13.根据权利要求1所述的方法,其中所述基于细胞的测定丰度值为多个分化细胞的测定丰度值。

14.根据权利要求13所述的方法,其中所述多个分化细胞为多个巨核细胞、多个成骨细胞、多个软骨细胞、多个脂肪细胞、多个肝细胞、多个肝间皮细胞、多个胆管上皮细胞、多个肝星状细胞、多个肝窦内皮细胞、多个库普弗细胞、多个隐窝细胞、多个血管内皮细胞、多个胰管上皮细胞、多个胰管细胞、多个腺腔中心细胞、多个腺泡细胞、多个朗格尔汉斯小岛、多个心肌细胞、多个纤维母细胞、多个角质形成细胞、多个平滑肌细胞、多个i型肺泡上皮细胞、多个ii型肺泡上皮细胞、多个克拉拉细胞、多个纤毛上皮细胞、多个基底细胞、多个杯状细胞、多个神经内分泌细胞、多个库尔契茨基细胞、多个肾小管上皮细胞、多个尿路上皮细胞、多个柱状上皮细胞、多个肾小球上皮细胞、多个肾小球内皮细胞、多个足细胞、多个血管系膜细胞、多个神经细胞、多个星形胶质细胞、多个小胶质细胞或多个少突胶质细胞。

15.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值为多个细胞的单细胞核糖核酸(rna)测序(scrna-seq)数据。

16.根据权利要求15所述的方法,其中通过将细胞的不同等分试样暴露于一种或多种已知影响所述生理状况的参考化合物而得到与所述生理状况相关联的所述多种不同状态,此外还得到对照状态,在所述对照状态下,细胞的等分试样并未免于暴露于已知影响所述生理状况的化合物。

17.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值来自大量rna序列。

18.根据权利要求1至14中任一项所述的方法,其中所述对应的多个基于细胞的测定丰度值来自单细胞rna测序。

19.根据权利要求1至18中任一项所述的方法,其中所述细胞组分模块的集合由所述第一细胞组分模块组成。

20.根据权利要求1至18中任一项所述的方法,其中所述细胞组分模块的集合包括多个细胞组分模块并且所述模型为包括多个成分模型的集成模型,并且其中所述多个成分模型中的每个成分模型响应于将所述化学结构的所述指纹输入到所述多个成分模型中的每个成分模型中而提供针对不同细胞组分模块的激活评分。

21.根据权利要求1至20中任一项所述的方法,所述方法进一步包括根据所述测试化学化合物的简化分子输入行输入系统(smiles)字符串表示来计算所述指纹。

22.根据权利要求20或21所述的方法,其中所述多个成分模型中的每个成分模型为对应的神经网络。

23.根据权利要求22所述的方法,其中所述对应的神经网络为全连接神经网络、消息传递神经网络或其组合。

24.根据权利要求20或21所述的方法,其中所述多个成分模型中的成分模型为逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

25.根据权利要求22所述的方法,其中

26.根据权利要求1所述的方法,其中

27.根据权利要求1至26中任一项所述的方法,所述方法进一步包括通过包括以下的过程来识别所述第一细胞组分模块:

28.根据权利要求27所述的方法,其中所述多个协变量参数包括:

29.根据权利要求27或28所述的方法,其中所述多种经注释的细胞状态中的经注释的细胞状态为所述第一多个细胞中的细胞在暴露条件下暴露于化合物。

30.根据权利要求29所述的方法,其中所述暴露条件为暴露的持续时间、所述化合物的浓度或暴露的持续时间与所述化合物的浓度的组合。

31.根据权利要求1至30中任一项所述的方法,其中所述多种细胞组分中的每种细胞组分为特定基因、与基因相关联的特定mrna、碳水化合物、脂质、表观遗传特征、代谢物、蛋白质或其组合。

32.根据权利要求27至30中任一项所述的方法,其中

33.根据权利要求11所述的方法,其中

34.根据权利要求1至30或32至33中任一项所述的方法,其中使用所述多个向量来识别所述多个候选细胞组分模块中的每个候选细胞组分模块包括使用所述多个向量中的每个向量的每组对应的多个元素来将相关模型应用于所述多个向量。

35.根据权利要求34所述的方法,其中所述相关模型包括图聚类。

36.根据权利要求34所述的方法,其中所述图聚类为基于皮尔逊相关的距离度量上的莱顿聚类。

37.根据权利要求34所述的方法,其中所述图聚类为鲁汶聚类。

38.根据权利要求27至37中任一项所述的方法,其中所述多个细胞组分模块由介于10个与2000个之间的细胞组分模块组成。

39.根据权利要求27至37中任一项所述的方法,其中所述多种细胞组分由介于100种与8,000种之间的细胞组分组成。

40.根据权利要求27至37中任一项所述的方法,其中多个组分模块中的每个候选细胞组分模块由介于二百种与三百种之间的细胞组分组成。

41.根据权利要求1至40中任一项所述的方法,其中所述目的生理状况为疾病。

42.根据权利要求27所述的方法,其中所述目的生理状况为疾病,并且所述第一多个细胞包括表示所述疾病的细胞和不表示所述疾病的细胞,如由所述多种经注释的细胞状态所指示。

43.根据权利要求27所述的方法,其中所述多个协变量包括细胞批次、细胞供体、细胞类型、疾病状态、暴露于化学化合物或其任何组合。

44.根据权利要求27所述的方法,其中所述训练所述候选细胞组分模型是在多任务公式中使用分类交叉熵损失来进行的,其中所述多个协变量中的每个协变量对应于多个成本函数中的成本函数,并且所述多个成本函数中的每个相应的成本函数具有公共的权重因子。

45.根据权利要求1至44中任一项所述的方法,其中所述测试化学化合物为具有小于2000道尔顿的分子量的有机化合物。

46.根据权利要求45所述的方法,其中所述测试化学化合物为满足里宾斯基五规则标准中的每一个的有机化合物。

47.根据权利要求45所述的方法,其中所述测试化学化合物为满足里宾斯基五规则标准中的至少三个标准的有机化合物。

48.根据权利要求1至19中任一项所述的方法,其中所述模型包括逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

49.根据权利要求1至48中任一项所述的方法,所述方法进一步包括使用daylight、bci、ecfp4、ecfc、mdl、apfp、ttfp、unity 2d指纹、rnns2s或graphconv从所述测试化学化合物的化学结构生成所述指纹。

50.根据权利要求1至18或20至49中任一项所述的方法,其中所述细胞组分模块的集合包括五个或更多个细胞组分模块。

51.根据权利要求1至18或20至50中任一项所述的方法,其中所述细胞组分模块的集合包括十个或更多个细胞组分模块。

52.根据权利要求1至18或20至50中任一项所述的方法,其中所述细胞组分模块的集合包括100个或更多个细胞组分模块。

53.根据权利要求1至52中任一项所述的方法,其中所述相应的细胞组分模块中的所述多种细胞组分的所述独立子集包括五种或更多种细胞组分。

54.根据权利要求1至52中任一项所述的方法,其中所述相应的细胞组分模块中的所述多种细胞组分的所述独立子集由与所述目的生理状况相关联的分子途径中的介于两种与20种之间的细胞组分组成。

55.根据权利要求1至54中任一项所述的方法,其中所述第一阈值标准为以下要求:所述第一细胞组分模块具有阈值激活评分。

56.一种计算机系统,其包括一个或多个处理器以及存储器,所述存储器存储用于进行用于将测试化学化合物与目的生理状况相关联的方法的指令,所述方法包括:

57.一种存储由计算机可执行的一个或多个计算机程序的非暂时性计算机可读介质,其用于将测试化学化合物与目的生理状况相关联,所述计算机包括一个或多个处理器以及存储器,所述一个或多个计算机程序共同编码进行包括以下的方法的计算机可执行指令:

58.一种将测试化学化合物与目的生理状况相关联的方法,所述方法包括:

59.根据权利要求58所述的方法,所述方法进一步包括根据所述测试化学化合物的简化分子输入行输入系统(smiles)字符串表示来计算所述指纹。

60.根据权利要求58或59所述的方法,其中所述模型包括神经网络。

61.根据权利要求60所述的方法,其中所述神经网络为全连接神经网络、消息传递神经网络或其组合。

62.根据权利要求58至61中任一项所述的方法,其中所述模型为包括多个成分模型的集成模型,并且其中所述多个成分模型中的每个成分模型响应于将所述化学结构的所述指纹输入到多个成分模型的集合中的每个成分模型中而提供针对所述扰动特征的集合中的不同的扰动特征的激活评分。

63.根据权利要求62所述的方法,其中所述多个成分模型包括逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

64.根据权利要求62或63所述的方法,其中所述多个成分模型中的每个成分模型为对应的神经网络。

65.根据权利要求64所述的方法,其中所述对应的神经网络为全连接神经网络、消息传递神经网络或其组合。

66.根据权利要求63或64所述的方法,其中所述多个成分模型中的成分模型为逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

67.根据权利要求65所述的方法,其中

68.根据权利要求58所述的方法,其中

69.根据权利要求58至68中任一项所述的方法,其中所述目的生理状况为疾病。

70.根据权利要求58所述的方法,其中所述测试化学化合物为具有小于2000道尔顿的分子量的有机化合物。

71.根据权利要求70所述的方法,其中所述测试化学化合物为满足里宾斯基五规则标准中的每一个的有机化合物。

72.根据权利要求70所述的方法,其中所述测试化学化合物为满足里宾斯基五规则标准中的至少三个标准的有机化合物。

73.根据权利要求58所述的方法,其中所述模型包括逻辑回归模型、神经网络模型、支持向量机模型、朴素贝叶斯模型、最近邻模型、提升树模型、随机森林模型、决策树模型、多项逻辑回归模型、线性模型或线性回归模型。

74.根据权利要求58至73中任一项所述的方法,所述方法进一步包括使用daylight、bci、ecfp4、ecfc、mdl、apfp、ttfp、unity 2d指纹、rnns2s或graphconv从所述测试化学化合物的化学结构生成所述指纹。

75.根据权利要求58至74中任一项所述的方法,其中所述扰动特征的集合由所述第一扰动特征组成。

76.根据权利要求58至74中任一项所述的方法,其中所述扰动特征的集合包括五个或更多个扰动特征。

77.根据权利要求58至74中任一项所述的方法,其中所述扰动特征的集合包括十个或更多个扰动特征。

78.根据权利要求58至74中任一项所述的方法,其中所述扰动特征的集合包括100个或更多个扰动特征。

79.根据权利要求58至74中任一项所述的方法,其中所述第一阈值标准为以下要求:所述第一扰动特征具有阈值激活评分。

80.一种计算机系统,其包括一个或多个处理器以及存储器,所述存储器存储用于进行用于将测试化学化合物与目的生理状况相关联的方法的指令,所述方法包括:

81.一种存储由计算机可执行的一个或多个计算机程序的非暂时性计算机可读介质,其用于将测试化学化合物与目的生理状况相关联,所述计算机包括一个或多个处理器以及存储器,所述一个或多个计算机程序共同编码...

【专利技术属性】
技术研发人员:F·A·沃尔夫R·哈达德N·M·普拉吉斯
申请(专利权)人:旗舰先锋创新VI有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1