一种重定位候选药物的筛选方法及其应用技术

技术编号:38745706 阅读:16 留言:0更新日期:2023-09-08 23:27
本发明专利技术涉及一种重定位候选药物的筛选方法及其应用,涉及生物信息学技术领域。该方法筛选方法通过整合单细胞转录组测序技术和转录组测序技术,从疾病的单细胞转录组测序数据、转录组测序数据出发,挑选与正常样本相比在疾病样本中表达上调和下调的基因,输入到转录组信号数据库,筛选出产生“负”相关转录组信号的药物。而通过上述方法筛选得到的药物在理论上可以逆转由疾病导致的转录组变化进而使转录组回归“正常”,因此可以列为治疗该疾病的重定位候选药物。重定位候选药物。

【技术实现步骤摘要】
一种重定位候选药物的筛选方法及其应用


[0001]本专利技术涉及生物信息学
,特别是涉及一种重定位候选药物的筛选方法及其应用。

技术介绍

[0002]传统的新药研发主要包括临床前研究、临床前实验、临床试验等,这一过程需要耗费大量的时间、费用,研发成本高且失败率也高。药物重定位是指对已经上市或者正在开发的药物进行相关研究用于新治疗用途的研发策略。由于重定位的药物使用的是已批准的药物或正在开发的化合物,这些药物或化合物已经在人体中进行了测试,我们可以获得它在药理学、剂量、可能的毒性和配方等方面的信息。与传统的药物研发方法相比,药物重定位可以显著降低研发成本并缩短药物开发时间。目前药物重定位已经有许多成功的例子,例如1988年美国FDA批准用于治疗高血压的米诺地尔可以用于治疗脱发;2015年美国预防服务工作组发布了用于阵痛的阿司匹林可以帮助预防心血管疾病和结肠直肠癌的建议草案。
[0003]药物重定位有基于实验和基于计算机预测两种方法。在基于实验的方法中,最典型的方法是表型筛选。随着测序技术的发展,基于转录组信号匹配的计算预测方法逐渐成熟,常规采用的方法是从该疾病的常规转录组数据出发,筛选可作为该疾病的重定位候选药物。然而,基于常规转录组测序数据的筛选方法,存在一定的假阳性。

技术实现思路

[0004]针对上述问题,本专利技术提供一种重定位候选药物的筛选方法,该筛选方法通过整合单细胞转录组测序技术和常规转录组测序技术,对两套测序数据分析得到的差异表达基因分别取交集,得到更加真实的差异表达基因结果,避免了假阳性。
[0005]为了达到上述目的,本专利技术提供一种重定位候选药物的筛选方法,包括以下步骤:
[0006]单细胞差异表达基因筛选:获取待筛选疾病阳性样本组的病灶单细胞转录组测序数据和对照样本组对应组织的单细胞转录组测序数据,分析筛选阳性样本组和对照样本组中单细胞转录的差异表达基因,得到单细胞差异表达上调基因和/或单细胞差异表达下调基因;
[0007]组织差异表达基因筛选:获取待筛选疾病阳性样本组的病灶组织转录组测序数据和对照样本组对应组织的组织转录组测序数据,采用PCA主成分分析、层次聚类分析对组织转录组测序的基因counts数矩阵进行分析,选取在PCA主成分分析、层次聚类分析中均正确分组的样本数据,分析筛选阳性样本组和对照样本组中组织转录的差异表达基因,得到组织转录差异表达上调基因和/或组织转录差异表达下调基因;
[0008]候选药物筛选:将单细胞差异表达上调基因和组织差异表达上调基因取交集,得到差异表达上调的交集基因;将单细胞差异表达下调基因和组织差异表达下调基因取交集,得到差异表达下调的交集基因;筛选与差异表达上调的交集基因相关联的基因作为上调候选基因,和/或筛选与差异表达下调的交集基因相关联的基因作为下调候选基因,该上
调候选基因的抑制剂或拮抗剂,和/或该下调候选基因的激活剂或促进剂即为重定位的候选药物。
[0009]上述筛选方法通过整合单细胞转录组测序技术和常规转录组测序技术,从疾病的单细胞转录组测序数据、常规转录组测序数据出发,挑选与正常样本相比在疾病样本中表达上调和下调的基因,输入到转录组信号数据库,筛选出产生“负”相关转录组信号的药物。而通过上述方法筛选得到的药物在理论上可以逆转由疾病导致的转录组变化进而使转录组回归“正常”,所以可以列为治疗该疾病的重定位候选药物。与单纯的组织转录组测序数据相比,对两套测序数据分析得到的差异表达基因分别取交集,得到更加真实的差异表达基因结果,避免了假阳性。同时,单纯的单细胞转录组测序的测序深度低,敏感性高,因此准确性较差,而相较之下,常规转录组测序的测序深度高且技术更加成熟,因此,本案整合单细胞转录组测序技术和常规转录组测序技术得到的筛选方法,能够将两种技术取长补短,使最终得到的结果更加可信。
[0010]上述分析步骤中,因组织差异表达基因筛选步骤中,转录组测序取的是肿瘤组织或正常组织样本,得到的是一群细胞的转录组的平均数据,这群细胞包括了正常细胞和癌细胞,而通过PCA主成分分析和层次聚类分析对样本分组进行验证,可以确保测序分析的肿瘤组织中主要为肿瘤细胞,正常组织中主要为正常细胞,从而实现样本分组无误,即为上述正确分组的含义。
[0011]在其中一个实施例中,所述单细胞差异表达基因筛选步骤中,还包括在获取待筛选疾病阳性样本组和对照样本组对应的病灶单细胞转录组测序数据后,分析筛选阳性样本组和对照样本组中单细胞转录的差异表达基因前,分别将所述单细胞转录组测序数据中的基因counts数矩阵进行过滤、标准化;
[0012]所述组织差异表达基因筛选步骤中,还包括在获取待筛选疾病阳性样本组和对照样本组对应的病灶组织转录组测序数据后,采用PCA主成分分析、层次聚类分析对标准化后的组织转录组测序的基因counts数矩阵进行分析前,分别将所述组织转录组测序数据中的基因counts数矩阵进行过滤、标准化。
[0013]在其中一个实施例中,所述将单细胞转录组测序数据中的基因counts数矩阵进行过滤的条件为:当一细胞表达基因的数量≥200时,保留该细胞;当一基因在≥3个细胞中表达时,保留该基因。
[0014]在其中一个实施例中,所述组织转录组测序数据中的基因counts数矩阵进行过滤的条件为:当一基因为蛋白编码基因时,保留该基因。
[0015]在其中一个实施例中,所述单细胞差异表达基因筛选步骤中,所述单细胞转录组测序数据中的基因counts数矩阵采用R包seurat的NormalizeData函数进行标准化;采用R包seurat的FindMarkers函数分析筛选阳性样本组和对照样本组中单细胞转录组的差异表达基因;
[0016]所述组织差异表达基因筛选步骤中,所述组织转录组测序数据中的基因counts数矩阵采用R包DESeq2的量化因子法进行标准化;采用R包DESeq2分析筛选阳性样本组和对照样本组中组织转录的差异表达基因;
[0017]所述候选药物筛选步骤中,采用R包VennDiagram的venn.diagram函数将单细胞差异表达上调基因和组织差异表达上调基因取交集;采用R包VennDiagram的venn.diagram函
数将单细胞差异表达下调基因和组织差异表达下调基因取交集。
[0018]上述量化因子法是R包DESeq2对表达矩阵进行标准化的方法,DESeq2的标准化步骤具体如下:1、对counts矩阵取对数变换;2、取各基因对数变换后的平均数;3、过滤掉

Inf基因,过滤掉的基因不参与标准化因子的计算;4、将该DESeq2的标准化过程中步骤1得到的对数矩阵减去步骤3得到的对数均值,得到对数比值矩阵;5、计算每个样本的对数比值矩阵的中位数;6、将对数中位数转换为其相应的真数,得到各个样本的标准化因子;7、将原始表达矩阵除以该DESeq2的标准化过程中步骤6中得到的标准化因子。
[0019]在其中一个实施例中,所述分析筛选阳性样本组和对照样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种重定位候选药物的筛选方法,其特征在于,包括以下步骤:单细胞差异表达基因筛选:获取待筛选疾病阳性样本组的病灶单细胞转录组测序数据和对照样本组对应组织的单细胞转录组测序数据,分析筛选阳性样本组和对照样本组中单细胞转录的差异表达基因,得到单细胞差异表达上调基因和/或单细胞差异表达下调基因;组织差异表达基因筛选:获取待筛选疾病阳性样本组的病灶组织转录组测序数据和对照样本组对应组织的组织转录组测序数据,采用PCA主成分分析、层次聚类分析对组织转录组测序的基因counts数矩阵进行分析,选取在PCA主成分分析、层次聚类分析中均正确分组的样本数据,分析筛选阳性样本组和对照样本组中组织转录的差异表达基因,得到组织转录差异表达上调基因和/或组织转录差异表达下调基因;候选药物筛选:将单细胞差异表达上调基因和组织差异表达上调基因取交集,得到差异表达上调的交集基因;将单细胞差异表达下调基因和组织差异表达下调基因取交集,得到差异表达下调的交集基因;筛选与差异表达上调的交集基因相关联的基因作为上调候选基因,和/或筛选与差异表达下调的交集基因相关联的基因作为下调候选基因,该上调候选基因的抑制剂或拮抗剂,和/或该下调候选基因的激活剂或促进剂即为重定位的候选药物。2.根据权利要求1所述的筛选方法,其特征在于,所述单细胞差异表达基因筛选步骤中,还包括在获取待筛选疾病阳性样本组的病灶单细胞转录组测序数据和对照样本组对应组织的单细胞转录组测序数据后,分析筛选阳性样本组和对照样本组中单细胞转录的差异表达基因前,分别将所述单细胞转录组测序数据中的基因counts数矩阵进行过滤、标准化;所述组织差异表达基因筛选步骤中,还包括在获取待筛选疾病阳性样本组的病灶组织转录组测序数据和对照样本组对应组织的组织转录组测序数据后,采用PCA主成分分析、层次聚类分析对标准化后的组织转录组测序的基因counts数矩阵进行分析前,分别将所述组织转录组测序数据中的基因counts数矩阵进行过滤、标准化。3.根据权利要求2所述的筛选方法,其特征在于,所述将单细胞转录组测序数据中的基因counts数矩阵进行过滤的条件为:当一细胞表达基因的数量≥200时,保留该细胞;当一基因在≥3个细胞中表达时,保留该基因。4.根据权利要求2所述的筛选方法,其特征在于,所述组织转录组测序数据中的基因counts数矩阵进行过滤的条件为:当一基因为蛋白编码基因时,保留该基因。5.根据权利要求2所述的筛选方法,其特征在于,所述单细胞差异表达基因筛选步骤中,所述单细胞转录组测序数据中的基因counts数矩阵采用R包seurat的NormalizeData函数进行标准化;采用R包seurat的FindMarkers函数分析筛选阳性样本组和对照样本组中单细胞转录组的差异表达基因;所述组织差异表达基因筛选步骤中,所述组织转录组测序数据中的基因counts数矩阵采用R包DESeq2的量化因子法进行标准化;采用R包DESeq2分析筛选阳性样本组和对照样本组中组织转录的差异表达基因;所述候选药物筛选步骤中,采用R包VennDiagram的venn.diagram函数将单细胞差异表达上调基因和组织差异表达上调基因取交集;采用R包VennDiagram的venn.diagram函数将单细胞差异表达下调基因...

【专利技术属性】
技术研发人员:余艳孙蔓蔓苏洁琼唐春燕李莉莉袁悉奥
申请(专利权)人:长沙金域医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1