基于转录组和机器学习的多靶点抗癌药物筛选优化方法技术

技术编号:39593995 阅读:9 留言:0更新日期:2023-12-03 19:49
本发明专利技术提供一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法,涉及生物医药技术领域,本发明专利技术首先获得了三组转录组资料,并采用

【技术实现步骤摘要】
基于转录组和机器学习的多靶点抗癌药物筛选优化方法


[0001]本专利技术涉及生物医药
,尤其涉及一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法


技术介绍

[0002]癌症是一种严重的疾病,对人类的健康和生命造成了巨大的威胁

现有的抗癌药物往往只能作用于单个靶点或通路,难以对复杂的癌症发挥全面的治疗作用

因此,研发多靶点的抗癌药物成为了目前癌症研究的热点和难点

[0003]随着高通量测序技术的发展,越来越多的基因表达数据被积累和公开

这些数据为基于基因表达谱的药物发现提供了有力的支持

然而,如何从这些数据中挖掘出与癌症相关的基因和通路,以及如何利用机器学习方法进行有效的药物筛选和优化,仍然是一个具有挑战性的问题


技术实现思路

[0004]针对现有技术的不足,本专利技术提供一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法

[0005]一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法,包括以下步骤:
[0006]步骤1:采集特定类型肿瘤的转录组测序数据,分别获得3‑5组肿瘤组织样本和正常组织样本;
[0007]步骤2:使用生物信息学软件对转录组测序数据进行差异分析,筛选差异基因,获得差异程度高于设定阈值的上调基因和下调基因;
[0008]步骤3:从筛选出的差异基因中分别获得各组上调基因和下调基因的交集,使用基因分析预测软件对差异基因取交集,并绘制韦恩图以确定与当前癌症疾病相关的关键基因簇;
[0009]步骤4:对关键基因簇进行
GO

KEGG
分析,获得与当前癌症相关的功能和通路信息;具体为:使用者选择最新版本的生物数据库,使用
DAVID 2021
,将关键基因簇的各个基因名提交到数据库的分析窗口,提交数据并选择细胞成分
CC、
生物过程
BP
和分子功能
MF
的类别以及京都基因和基因组百科全书通路
KEGG
进行分析,设定选择关键功能和通路的阈值为
P

<0.05

counts

≥2。
[0010]步骤5:将差异基因输入到
CMap
数据库中进行筛选;
[0011]具体为:将差异基因上传在数据库分析窗口,其中上调基因和下调基因分别上传,并且均不少于
15
个,确定“基因表达
L1000”和“个体查询”的查询参数,并选择与研究针对癌症相同的细胞系,分析得到一个小分子干扰细胞的基因表达变化列表,其中基因表达变化列表中每行分别代表一种小分子,表示小分子针对所选细胞系干扰后其基因的变化情况,且包含一个

100

100
的分数,分数
100
表示该小分子的作用与所提供的差异基因上下调情况完全相同,分数

100
则表示完全相反;得分低于阈值的小分子则被认定为其对细胞的干
扰效果与癌症所导致的基因上下调情况相反,具有抗癌效果的可能性就越高

[0012]步骤6:结合步骤4的分析结果和步骤5中的小分子得分情况,选择候选药物;
[0013]步骤7:针对候选药物,进行包括但不限于抑制癌细胞的增殖和迁移的生物学实验进行验证,以确定候选药物的有效性

[0014]步骤8:使用靶点预测工具对有效药物进行基于机器学习的靶点预测,获得药物可能的靶点;
[0015]步骤9:以计算生物学的方法对可能的靶点进行验证,采用分子对接软件进行分子对接,观测小分子与靶点之间存在的稳定的连接关系

[0016]采用上述技术方案所产生的有益效果在于:
[0017]本专利技术提供一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法

该方法可以通过综合分析转录组数据

药物筛选和生物学实验验证,有效地识别具有潜在治疗效果的抗癌药物和靶点

具体具备以下有益效果:
[0018]1.
高效性:该方法可以在大规模基因组数据中,快速而准确地筛选出与特定癌症疾病相关的差异基因,从而实现高效的药物筛选和开发

[0019]2.
多靶点筛选:该方法考虑了多个基因的表达变化,可以在药物筛选中同时考虑多个靶点,从而提高药物疗效和减少副作用

[0020]3.
可靠性:该方法对筛选出的药物进行了多个环节的验证,包括生物学实验和分子模拟等,可以有效降低误筛的概率,提高药物开发的可靠性

[0021]4.
数据丰富:该方法使用了多组成对的肿瘤组织样本和正常组织样本进行转录组测序,并结合了外部数据库进行药物筛选和靶点预测,可以充分利用丰富的数据资源提高药物开发的成功率

[0022]5.
可重复性:该方法在每个步骤中均使用了常见的生物信息学软件和在线工具,方便其他操作者进行复制和重现

附图说明
[0023]图1为本专利技术实施例中多靶点癌症药物筛选优化方法流程图

具体实施方式
[0024]下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述

以下实施例用于说明本专利技术,但不用来限制本专利技术的范围

[0025]一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法,如图1所示,包括以下步骤:
[0026]步骤1:采集特定类型肿瘤的转录组测序数据,分别获得3‑5组肿瘤组织样本和正常组织样本;这些样本用于后续差异分析,以确定每组数据的上调和下调的差异基因

[0027]本实施例中选择从
GEO
数据库下载基因表达数据集,推荐使用时采取基于
GPL570(Affymetrix
人类基因组
U133 Plus 2.0
阵列
)
的图谱;
[0028]步骤2:使用生物信息学软件如
DESeq2、edgeR
等对转录组测序数据进行差异分析,筛选差异基因,获得差异程度高于设定阈值的上调基因和下调基因

本实施例中采取
DESeq2
进行差异分析是,设定阈值为
logFC>1

P

<0.05

[0029]步骤3:从筛选出的差异基因中分别获得各组上调基因和下调基因的交集,使用基因分析预测软件
FunRich
对差异基因取交集,并绘制韦恩图以确定与当前癌症疾病相关的关键基因簇;
[0030]步骤4:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于转录组和机器学习的多靶点抗癌药物筛选优化方法,其特征在于,包括以下步骤:步骤1:采集特定类型肿瘤的转录组测序数据,分别获得肿瘤组织样本和正常组织样本;步骤2:使用生物信息学软件对转录组测序数据进行差异分析,筛选差异基因,获得差异程度高于设定阈值的上调基因和下调基因;步骤3:从筛选出的差异基因中分别获得各组上调基因和下调基因的交集,使用基因分析预测软件对差异基因取交集,并绘制韦恩图以确定与当前癌症疾病相关的关键基因簇;步骤4:对关键基因簇进行
GO

KEGG
分析,获得与当前癌症相关的功能和通路信息;步骤5:将差异基因输入到
CMap
数据库中进行筛选获得小分子得分情况;步骤6:结合步骤4获得的功能和通路信息,以及步骤5中的小分子得分情况,选择候选药物;步骤7:针对候选药物,进行生物学实验进行药物有效性验证;步骤8:使用靶点预测工具对有效药物进行基于机器学习的靶点预测,获得药物可能的靶点;步骤9:以计算生物学的方法对可能的靶点进行验证,采用分子对接软件进行分子对接,观测小分子与靶点之间存在的稳定的连接关系
。2.
根据权利要求1所述的基于转录组和机器学习的多靶点抗癌药物筛选优化方法,其特征在于,所述步骤4具体为:使用者选择最新版本的生物数据库,将关键基因簇的各个基因名提交到数据库的分析窗口,提交数据并选择细胞成分
CC、
生物过程
BP
和分子功能
MF
的类别以及京都基因和基因组百科全书通路
KEGG
进行分析
。3.
根据权利要求2所述的基于转录组和机器学习的多靶点抗癌...

【专利技术属性】
技术研发人员:赵勇山张睿琦张景海
申请(专利权)人:沈阳药科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1