当前位置: 首页 > 专利查询>赣南医学院专利>正文

一种浆液性卵巢癌预后标志物模型的建立和验证方法技术

技术编号:35550667 阅读:10 留言:0更新日期:2022-11-12 15:30
本申请涉及一种浆液性卵巢癌预后标志物模型的建立和验证方法,将不同平台的样本合并为训练集,采用基于样本内基因相对表达秩序关系的方法形成基因对矩阵,利用Cox回归模型得到预后显著相关基因对,再通过正向选择、贪婪算法、测试筛选出一组基因对作为浆液性卵巢癌预后标志物模型,在其他不同平台的样本测试集和样本验证集中得到验证。这种方法基于基因间相对秩序关系,可以在个体化水平上应用于不同实验室的独立临床样本,准确预测诊断癌症的发生发展过程,避免了预后标志在风险分层时阈值选择所受的系统偏差和实验室批次效应影响,综合考虑了浆液性卵巢癌发生发展过程中各种基因对预后产生的影响,具备浆液性卵巢癌患者预后的临床应用价值。后的临床应用价值。后的临床应用价值。

【技术实现步骤摘要】
一种浆液性卵巢癌预后标志物模型的建立和验证方法


[0001]本申请涉及卵巢癌预后
,特别是涉及一种浆液性卵巢癌预后标志物模型的建立和验证方法。

技术介绍

[0002]浆液性卵巢癌通常在晚期被发现并且预后较差,使其成为妇科癌症死亡的第二大常见原因。浆液性卵巢癌具有多变的生物学和复杂的分子特征,实现个体化精准医疗是其预后面临的最大挑战。
[0003]随着大数据和基因技术的发展,出现了基于全基因组表达变化,寻找卵巢癌预后生物标志的技术。目前这种技术主要分成两类:第一类是评估单个基因标志对卵巢癌预后的影响,此类基于单个基因的研究并未考虑基因间相互作用的影响,无法准确预测浆液性卵巢癌患者的预后;第二类是基于某个特征层面评价一组基因的预后价值,这种方法忽略了患者个体的异质性和影响因素的复杂性,容易导致其预后标志过度拟合而无法真正地应用于临床。
[0004]目前无论是基于单个基因还是一组功能相关基因的卵巢癌预后预测模型,大多基于风险评分、通过预设风险评分阈值来判断患者风险高低,但由于批次效应和平台差异,基因表达水平对微阵列测量的系统偏差很敏感,训练数据集生成的风险阈值不能直接应用于独立数据集。并且,基于基因表达水平的风险评分方法,在样本风险分类时并不确定分类为高风险或低风险,无法在临床中应用。最后,目前大部分的研究都存在一个共同的问题,样本量太小,找出的基因标志鲁棒性非常差。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够在浆液性卵巢癌样本中寻找稳定的具有临床转化价值的预后风险标志的方法。
[0006]一种浆液性卵巢癌预后标志物模型的建立方法,所述方法包括:
[0007]步骤A:从基因表达综合数据库获取浆液性卵巢癌患者的表达谱数据和临床信息,对所述表达谱数据和临床信息进行预处理,将来自不同检测平台的浆液性卵巢癌表达谱数据集分为两个数据子集,一个数据子集作为训练集,另一数据子集作为测试集;
[0008]步骤B:通过Cox回归模型筛选出与浆液性卵巢癌患者总生存率显著相关的基因,将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵,通过Cox回归模型基于所述基因对矩阵筛选出与浆液性卵巢癌预后显著相关的基因对;
[0009]步骤C:将所述与浆液性卵巢癌预后显著相关的基因对按照正向选择顺序选择一致性指数C

index值最大的前N组基因对,所述一致性指数C

index是描述预后模型的预测能力的指数,采用贪婪算法对所述前N组基因对中的每个基因对进行筛选,再利用所述测试集对所述基因对进行测试,将得到的一组基因对作为浆液性卵巢癌预后标志物模型。
[0010]在其中一个实施例中,所述对表达谱数据和临床信息进行预处理包括:
[0011]步骤A1:去除没有临床信息和总生存期为0天的肿瘤样本;
[0012]步骤A2:去除正常样本;
[0013]步骤A3:去除低表达基因,所述低表达基因是超过一半的样本基因表达缺失或为0的基因。
[0014]在其中一个实施例中,所述将来自不同检测平台的浆液性卵巢癌表达谱数据集作为训练集,将另一数据集的浆液性卵巢癌表达谱数据集合作为测试集包括:所述训练集是检测平台GPL570、GPL8300、GPL96平台的GSE18520、GSE19829、TCGA的浆液性卵巢癌表达谱数据集合,测试集是来自GPL7759平台GSE13876的浆液性卵巢癌表达谱数据集合。
[0015]在其中一个实施例中,所述步骤B:通过Cox回归模型筛选出与浆液性卵巢癌患者总生存率显著相关的基因,将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵,通过Cox回归模型基于所述基因对矩阵筛选出与浆液性卵巢癌预后显著相关的基因对,包括:
[0016]通过Cox回归模型对所述训练集中的单个基因进行认定,当p值小于0.05时,认定该基因为与卵巢癌患者总生存率显著相关的基因;
[0017]将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵;
[0018]通过Cox回归模型对所述候选预后相关基因对进行认定,当p值小于0.05值时认定该基因对为与卵巢癌预后显著相关的基因对。
[0019]在其中一个实施例中,所述步骤C:将所述与浆液性卵巢癌预后显著相关的基因对按照正向选择顺序选择一致性指数C

index值最大的前N组基因对,所述一致性指数C

index是描述预后模型的预测能力的指数,采用贪婪算法对所述前N组基因对中的每个基因对进行筛选,再利用所述测试集对所述基因对进行测试,得到的一组基因对作为浆液性卵巢癌预后标志物模型,包括:
[0020]以所述与卵巢癌预后显著相关的基因对中的每个基因对为种子,将剩下基因对一一添加进组合,如果基因对添加后一致性指数C

index值变大,则继续往所述组合添加基因对,如果基因对添加后一致性指数C

index值变小,则不添加基因对,直至一致性指数C

index值不再增加时,得到N组基因对,所述一致性指数C

index是描述预后模型的预测能力的指数;
[0021]根据所述N组基因对,按照一致性指数C

index值由大到小排序,利用所述测试集对所述N组基因对进行测试,筛选出与浆液性卵巢癌预后相关且一致性指数C

index值最高的一组基因对,作为最终的浆液性卵巢癌预后标志物模型。
[0022]一种浆液性卵巢癌预后标志物模型的验证方法
[0023]步骤A:从基因表达综合数据库获取浆液性卵巢癌患者的表达谱数据和临床信息,对所述表达谱数据和临床信息进行预处理,将来自不同检测平台的浆液性卵巢癌表达谱数据集分为三个数据子集,一个数据子集作为训练集,一个数据子集作为测试集,另一个数据子集作为验证集;
[0024]步骤B:通过Cox回归模型筛选出与浆液性卵巢癌患者总生存率显著相关的基因,将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对
的相对表达秩序关系得到基因对矩阵,通过Cox回归模型基于所述基因对矩阵筛选出与浆液性卵巢癌预后显著相关的基因对;
[0025]步骤C:将所述与浆液性卵巢癌预后显著相关的基因对按照正向选择顺序选择一致性指数C

index值最大的前N组基因对,采用贪婪算法对所述前N组基因对中的每组基因对进行筛选,再利用所述测试集对所述基因对组合进行测试,将得到的一组基因对作为浆液性卵巢癌预后标志物模型;
[0026]步骤D:对所述浆液性卵巢癌预后标志物模型在验证集验证,具体包括:对所述浆液性卵巢癌预后标志物模型进行生存分析、对所述浆液性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种浆液性卵巢癌预后标志物模型的建立方法,其特征在于,所述方法包括:步骤A:从基因表达综合数据库获取浆液性卵巢癌患者的表达谱数据和临床信息,对所述表达谱数据和临床信息进行预处理,将来自不同检测平台的浆液性卵巢癌表达谱数据集分为两个数据子集,一个数据子集作为训练集,另一数据子集作为测试集;步骤B:通过Cox回归模型筛选出与浆液性卵巢癌患者总生存率显著相关的基因,将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵,通过Cox回归模型基于所述基因对矩阵筛选出与浆液性卵巢癌预后显著相关的基因对;步骤C:将所述与浆液性卵巢癌预后显著相关的基因对按照正向选择顺序选择一致性指数C

index值最大的前N组基因对,所述一致性指数C

index是描述预后模型的预测能力的指数,采用贪婪算法对所述前N组基因对中的每个基因对进行筛选,再利用所述测试集对所述基因对进行测试,将得到的一组基因对作为浆液性卵巢癌预后标志物模型。2.根据权利要求1所述的方法,其特征在于,所述对表达谱数据和临床信息进行预处理包括:步骤A1:去除没有临床信息和总生存期为0天的肿瘤样本;步骤A2:去除正常样本;步骤A3:去除低表达基因,所述低表达基因是超过一半的样本基因表达缺失或为0的基因。3.根据权利要求1所述的方法,其特征在于,所述将来自不同检测平台的浆液性卵巢癌表达谱数据集分为两个数据子集,一个数据子集作为训练集,将另一数据子集作为测试集包括:所述训练集是检测平台GPL570、GPL8300、GPL96平台的GSE18520、GSE19829、TCGA的浆液性卵巢癌表达谱数据集合,测试集是来自GPL7759平台GSE13876的浆液性卵巢癌表达谱数据集合。4.根据权利要求1所述的方法,其特征在于,所述步骤B:通过Cox回归模型筛选出与浆液性卵巢癌患者总生存率显著相关的基因,将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵,通过Cox回归模型基于所述基因对矩阵筛选出与浆液性卵巢癌预后显著相关的基因对,包括:通过Cox回归模型对所述训练集中的单个基因进行认定,当p值小于0.05时,认定该基因为与卵巢癌患者总生存率显著相关的基因;将所述显著相关的基因两两组合得到候选预后相关基因对,根据所述候选预后相关基因对的相对表达秩序关系得到基因对矩阵;通过Cox回归模型对所述候选预后相关基因对进行认定,当p值小于0.05值时认定该基因对为与卵巢癌预后显著相关的基因对。5.根据权利要求1

4任意一项所述的方法,其特征在于,所述步骤C:将所述与浆液性卵巢癌预后显著相关的基因对按照正向选择顺序选择一致性指数C

index值最大的前N组基因对,所述一致性指数C

index是描述预后模型的预测能力的指数,采用贪婪算法对所述前N组基因对中的每个基因对进行筛选,再利用所述测试集对所述基因对进行测试,得到的一组基因对作为浆液性卵巢癌预后标志物模型,包括:
以所述与卵巢癌预后显著相关的基因对中的每个基因对为种子,将剩下基因对一一添加进组合,如果基因对添加后一致性指数C

index值变大,则继续往所述组合添加基因对,如果基因...

【专利技术属性】
技术研发人员:李红东罗凤媛洪贵妮
申请(专利权)人:赣南医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1