一种用于挖掘肿瘤标志物的方法以及肿瘤风险筛查方法技术

技术编号:36348392 阅读:26 留言:0更新日期:2023-01-14 18:03
本发明专利技术提供了一种用于挖掘肿瘤标志物的方法,包括:S1、获取预定的多个分子通路所含有的所有基因在预设的实验组、对照组中分别发生变异的频率,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤或者患有所述预定类别的肿瘤但与实验组的样本的分型不同;S2、基于每个分子通路所含有的基因在实验组、对照组中分别发生变异的频率,确定在实验组和对照组中每个基因发生变异频率的差异指数;S3、针对每个分子通路,将该分子通路所含有的所有基因发生变异频率的差异指数求和,得到该分子通路的差异指数;S4、从预定的多个分子通路中,选择分子通路的差异指数大于预定检测阈值的分子通路作为肿瘤标志物。志物。志物。

【技术实现步骤摘要】
一种用于挖掘肿瘤标志物的方法以及肿瘤风险筛查方法


[0001]本专利技术涉及生物化学或者生物医药领域,具体来说涉及肿瘤标志物挖掘领域,更具体地说,涉及一种用于挖掘肿瘤标志物的方法以及肿瘤风险筛查方法。

技术介绍

[0002]随着高通量测序和多组学技术的应用,基因组、转录组、蛋白质组以及代谢组等多维度组学的数据快速增长。越来越多的分子层面的生物标志物被挖掘并用于肿瘤诊断、风险分级、疗效评估及预后预测的研究中。现有的DNA层面的肿瘤标志物的挖掘通常采用多因素风险回归、分组间的差异比较分析方法(包括卡方检验、费希尔(Fisher)检验统计分析方法)来获得;比如一些著名的基因标志物如TP53、EGFR突变大多通过此类分析方法获得。这类分析方法虽然直接有效,然而随着肿瘤研究的进展,单个基因形式的标志物已被广泛地发掘,未来利用这类分析方法挖掘新的同类型肿瘤标志物将会变得越来越困难。
[0003]以往的肿瘤DNA分子标志物挖掘方法是以单个基因为单元,逐一进行回归或者差异的统计分析。这种分析方法忽略了基因之间协同参与的生物通路的相互作用。分子执行生物功能是以通路为单元,在一些肿瘤研究场景中,虽然样本间的基因并无差异或者差异较小,但一些基因相互迭加后构成了通路的异常,这种通路层面的差异是在多个肿瘤发生发展过程中可重现的。而现有肿瘤标志物是只对较明显的单个基因层面标志物进行挖掘得到,对于隐藏性的基因协作关系及其组合状态,并未进行有效地挖掘。

技术实现思路

[0004]因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种用于挖掘肿瘤标志物的方法以及肿瘤风险筛查方法。
[0005]本专利技术的目的是通过以下技术方案实现的:
[0006]根据本专利技术的第一方面,提供一种用于挖掘肿瘤标志物的方法,该方法包括:S1、获取预定的多个分子通路所含有的所有基因在预设的实验组、对照组中分别发生变异的频率,其中,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤或者患有所述预定类别的肿瘤但与实验组的样本的分型不同;S2、基于每个分子通路所含有的基因在实验组、对照组中分别发生变异的频率,确定在实验组和对照组中每个基因发生变异频率的差异指数;S3、针对每个分子通路,将该分子通路所含有的所有基因发生变异频率的差异指数求和,得到该分子通路的差异指数;S4、从预定的多个分子通路中,选择分子通路的差异指数大于预定检测阈值的分子通路作为肿瘤标志物。
[0007]在本专利技术的一些实施例中,按照以下方式确定每个基因发生变异频率的差异指数:
[0008][0009]其中,F
case
表示该基因在实验组中发生变异的频率,F
ctr
表示该基因在对照组中发
生变异的频率,max(F
case
,F
ctr
)表示从F
case
和F
ctr
中取最大值,表示用于避免分母为零的偏移值。
[0010]在本专利技术的一些实施例中,按照以下方式确定每个分子通路的差异指数:
[0011][0012]其中,DI
gene(i)
表示分子通路所含有的第i个基因发生变异频率的差异指数,n表示当前分子通路所含有的基因的总数。
[0013]根据本专利技术的第二方面,提供一种肿瘤风险筛查方法,该方法包括:根据第一方面挖掘出预定类别的肿瘤对应的肿瘤标志物,确定该肿瘤标志物所对应的分子通道所含的基因在待检测人员的DNA中的发生变异情况,其中,挖掘该肿瘤标志物时,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤;根据所述基因在待检测人员的DNA中的发生变异情况以及每个基因发生变异频率的差异指数,确定待检测人员患有相应类别的肿瘤的风险。
[0014]在本专利技术的一些实施例中,按照以下方式确定待检测人员是否患有相应类别的肿瘤:将该肿瘤标志物所对应的分子通道所含有并且在待检测人员的DNA中发生变异的基因对应的基因发生变异频率的差异指数求和,得到检测指标,其中:检测指标的数值大于0时,认为待检测人员患有预定类别的肿瘤的风险为高;检测指标的数值小于0时,待检测人员患有预定类别的肿瘤的风险为低。
[0015]在本专利技术的一些实施例中,所述预定类别的肿瘤为肝癌、结肠癌、肺癌、乳腺癌、胃癌、宫颈癌、卵巢癌、膀胱癌和胰腺癌中至少一种癌症。
[0016]根据本专利技术的第三方面,提供一种肿瘤分型方法,该方法包括:根据第一方面掘出预定类别的肿瘤对应的肿瘤标志物,确定该肿瘤标志物所对应的分子通道所含的基因在待检测人员的DNA中的发生变异情况,其中,挖掘该肿瘤标志物时,实验组中的每个样本患有预定类别中属于第一分型的肿瘤,对照组中的每个样本患有所述预定类别中属于与第一分型不同的第二分型的肿瘤;根据所述基因在待检测人员的DNA中的发生变异情况以及每个基因发生变异频率的差异指数,确定待检测人员患有的预定类别的肿瘤的分型。
[0017]在本专利技术的一些实施例中,按照以下方式确定待检测人员是否患有相应类别的肿瘤:将该肿瘤标志物所对应的分子通道所含有并且在待检测人员的DNA中发生变异的基因对应的基因发生变异频率的差异指数求和,得到肿瘤分型指标,其中:肿瘤分型指标的数值大于0时,认为待检测人员患有预定类别中属于第一分型的肿瘤;肿瘤分型指标的数值小于0时,认为待检测人员患有预定类别中属于第二分型的肿瘤。
[0018]在本专利技术的一些实施例中,所述预定类别的肿瘤为肝癌或者胃癌,第一分型为非化疗敏感型,第二分型为化疗敏感型。
[0019]根据本专利技术的第四方面,一种电子设备,包括:一个或多个处理器;以及存储器,其中存储器用于存储可执行指令;所述一个或多个处理器被配置为经由执行所述可执行指令以实现第一方面、第二方面和/或第三方面所述方法的步骤。
[0020]与现有技术相比,本专利技术的优点在于:
[0021]本专利技术可以发现新形式的肿瘤标志物,用于为后期的肿瘤风险筛查、肿瘤分型、肿瘤疗效评估、预后预测、生物医药等研究提供参考或帮助;而且,相较于单个基因(一些研究表明,人类大约含有2万个基因,每个基因需要逐一分析)的差异分析方法,本专利技术以分子通
路(一些研究表明,人类的细胞中大约含有几百个分子通路)为对象进行分析,可以将需要进行分析的对象大大缩小,从而更高效地发现特定类别的肿瘤对应的肿瘤标志物。
附图说明
[0022]以下参照附图对本专利技术实施例作进一步说明,其中:
[0023]图1为根据本专利技术实施例的用于挖掘肿瘤标志物的方法的流程示意图。
具体实施方式
[0024]为了使本专利技术的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0025]如在
技术介绍
部分提到的,现有肿瘤标志物是只对较明显的单个基因层面标志物进行挖掘得到,对于隐藏性的基因协作关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于挖掘肿瘤标志物的方法,其特征在于,该方法包括:S1、获取预定的多个分子通路所含有的所有基因在预设的实验组、对照组中分别发生变异的频率,其中,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤或者患有所述预定类别的肿瘤但与实验组的样本的分型不同;S2、基于每个分子通路所含有的基因在实验组、对照组中分别发生变异的频率,确定在实验组和对照组中每个基因发生变异频率的差异指数;S3、针对每个分子通路,将该分子通路所含有的所有基因发生变异频率的差异指数求和,得到该分子通路的差异指数;S4、从预定的多个分子通路中,选择分子通路的差异指数大于预定检测阈值的分子通路作为肿瘤标志物。2.根据权利要求1所述的方法,其特征在于,步骤S2中,按照以下方式确定每个基因发生变异频率的差异指数:其中,F
case
表示该基因在实验组中发生变异的频率,F
ctr
表示该基因在对照组中发生变异的频率,max(F
case
,F
ctr
)表示从F
case
和F
ctr
中取最大值,表示用于避免分母为零的偏移值。3.根据权利要求2所述的方法,其特征在于,步骤S3中,按照以下方式确定每个分子通路的差异指数:其中,DI
gene(i)
表示分子通路所含有的第i个基因发生变异频率的差异指数,n表示当前分子通路所含有的基因的总数。4.一种肿瘤风险筛查方法,其特征在于,该方法包括:根据权利要求1

3挖掘出预定类别的肿瘤对应的肿瘤标志物,确定该肿瘤标志物所对应的分子通道所含的基因在待检测人员的DNA中的发生变异情况,其中,挖掘该肿瘤标志物时,实验组中的每个样本患有预定类别的肿瘤,对照组中的每个样本未患有所述预定类别的肿瘤;根据所述基因在待检测人员的DNA中的发生变异情况以及每个基因发生变异频率的差异指数,确定待检测人员患有相应类别的肿瘤的...

【专利技术属性】
技术研发人员:卜德超赵屹靳辉赵连鹤
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1