【技术实现步骤摘要】
一种个体癌症样本的生物标记物识别方法
本专利技术涉及生物标记物识别
,是一种个体癌症样本的生物标记物识别方法。
技术介绍
现有的生物标记物识别方法多基于两组不同表型的样本的差异性来识别生物标记物,然而癌症是一种复杂的异质性疾病,不同的患者有不同的发病机制,需要不同的治疗,因此,需要一种可以确定个体癌症样本的生物标记物的方法。
技术实现思路
本专利技术为确定个体癌症样本的生物标记,本专利技术提供了一种个体癌症样本的生物标记物识别方法,本专利技术提供了以下技术方案:一种个体癌症样本的生物标记物识别方法,包括以下步骤:步骤1:基于两种不同表型的样本数据确定差异表达成分,所述成分包括蛋白质、基因或者分子化合物,选取出q个差异表达成分;步骤2:基于选取的q个差异表达成分,获得平均样本;步骤3:构建基于平均样本和单体样本的回归模型,对样本进行回归预测,得到样本回归预测的结果;步骤4:基于样本回归预测的结果和差异表达成分,确定单样本的生物标记成分。优选地,所述步骤1具体为:选取两组不同表型的成分表达数据样本,分别使用“+”和“-”作为两组不同表型的成分表达数据样本的标签,n1和n2分别表示“+”和“-”两类样本的样本数;采用yji表示第i个样本,样本标签为“+”的第j个成分的表达值,采用xji表示第i个样本,样本标签为“-”的第j个成分的表达值,基于yji和xji选取出q个差异表达成分。优选地,所述步骤2具体为:步骤2.1:确 ...
【技术保护点】
1.一种个体癌症样本的生物标记物识别方法,其特征是:包括以下步骤:/n步骤1:基于两种不同表型的样本数据确定差异表达成分,所述成分包括蛋白质、基因或者分子化合物,选取出q个差异表达成分;/n步骤2:基于选取的q个差异表达成分,获得平均样本;/n步骤3:构建基于平均样本和单体样本的回归模型,对样本进行回归预测,得到样本回归预测的结果;/n步骤4:基于样本回归预测的结果和差异表达成分,确定单样本的生物标记成分。/n
【技术特征摘要】
1.一种个体癌症样本的生物标记物识别方法,其特征是:包括以下步骤:
步骤1:基于两种不同表型的样本数据确定差异表达成分,所述成分包括蛋白质、基因或者分子化合物,选取出q个差异表达成分;
步骤2:基于选取的q个差异表达成分,获得平均样本;
步骤3:构建基于平均样本和单体样本的回归模型,对样本进行回归预测,得到样本回归预测的结果;
步骤4:基于样本回归预测的结果和差异表达成分,确定单样本的生物标记成分。
2.根据权利要求1所述的一种个体癌症样本的生物标记物识别方法,其特征是:所述步骤1具体为:
选取两组不同表型的成分表达数据样本,分别使用“+”和“-”作为两组不同表型的成分表达数据样本的标签,n1和n2分别表示“+”和“-”两类样本的样本数;
采用yji表示第i个样本,样本标签为“+”的第j个成分的表达值,采用xji表示第i个样本,样本标签为“-”的第j个成分的表达值,基于yji和xji选取出q个差异表达成分。
3.根据权利要求1所述的一种个体癌症样本的生物标记物识别方法,其特征是:所述步骤2具体为:
步骤2.1:确定“+”和“-”两组样本的平均样本,通过下式表示所述两组样本的平均样本:
其中,u+和u-分别表示“+”和“-”两组样本的平均样本,为在“+”组中的第q个成分的平均表达值,为“-”组中的第q个成分的平均表达值;
步骤2.2:根据第i个样本标签为“+”的样本的第j个成分的表达值和第i个样本标签为“-”的的第j个成分的表达值,来确定在“+”组和“-”组的第j个成分的平均表达值,通过下式确定在“+”组和“-”组的第j个成分的平均表达值:
其中,为“+”组的第j个成分的平均表达值,为“-”组的第j个成分的平均表达值,n1和n2分别表示“+”和“-”两类样本的样本数。
4.根据权利要求1所述的一种个体癌症样本的生物标记物识别方法,其特征是:所述步骤3具体为:
步骤3.1:构建基于平均样本和单体样本的回归模型,令y'ji表示第i个样本,样本标签为“+”的第j个差异表达成分的表达值,获得第i个标签为“+”的样本,通过下式确定第i个标签为“+”的样本:
其中,为第i个标签为“+”的样本;
对第i个标签为“+”的样本进行回归预...
【专利技术属性】
技术研发人员:李杰,王东,王亚东,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。