【技术实现步骤摘要】
一种特征miRNA表达谱组合及肾乳头状细胞癌早期预测方法
本专利技术属于生物技术和医学领域,具体地说,涉及一种特征miRNA表达谱组合及肾乳头状细胞癌早期预测方法。
技术介绍
肾乳头状细胞癌(kidneyrenalpapillarycellcarcinoma)约占肾细胞癌的15%。其发病年龄一般为50-70岁,男女患病比率为2-3.9:1。肾乳头状细胞癌预后较好,5年生存率能达到80%以上。全球疾病负担(GlobalBurdenofDisease,GBD)数据显示,2017年全球患有肾癌的人数超过210万,其中中国患病人数约为27万。2017年全球患有肾癌的死亡人数约为14万,占总死亡人数的0.25%。中国2017年死亡患者数约为1.7万,占总死亡人数的0.16%。统计结果显示,从1990年到2017年全球肾癌患病率和死亡率持续增长。近十年来中国肾癌患病人数,患病率和死亡率相对稳定。支持向量机(SupportVectorMachine,SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习 ...
【技术保护点】
1.一种特征miRNA表达谱组合,其特征在于,包括hsa-mir-10a、hsa-mir-10b、hsa-mir-125a、hsa-mir-126、hsa-mir-143、hsa-mir-182、hsa-mir-183、hsa-mir-21、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27b、hsa-mir-29a、hsa-mir-29b-1、hsa-mir-29b-2、hsa-mir-29c、hsa-mir-30b、hsa-mir-34a、hsa-mir-500a、hsa-mir-532、hsa-mir-625和hsa- ...
【技术特征摘要】
1.一种特征miRNA表达谱组合,其特征在于,包括hsa-mir-10a、hsa-mir-10b、hsa-mir-125a、hsa-mir-126、hsa-mir-143、hsa-mir-182、hsa-mir-183、hsa-mir-21、hsa-mir-26a-1、hsa-mir-26a-2、hsa-mir-26b、hsa-mir-27b、hsa-mir-29a、hsa-mir-29b-1、hsa-mir-29b-2、hsa-mir-29c、hsa-mir-30b、hsa-mir-34a、hsa-mir-500a、hsa-mir-532、hsa-mir-625和hsa-mir-99b,其核苷酸序列分别如SEQIDNO.1-SEQIDNO.22所示。
2.一种基于miRNA表达谱组合特征的肾乳头状细胞癌早期预测方法,其特征在于,包括以下步骤:
步骤1、获取肾乳头状细胞癌早期患者稳定差异表达的特征miRNA;
步骤2、选取特征miRNA表达数据,对每个样本进行数据标准化处理;
步骤3、使用支持向量机对标准化后的数据构建早期预测模型;
步骤4、根据患者特征miRNA的表达水平进行早期预测;
本方法用于非疾病的诊断和治疗目的。
3.根据权利要求2所述的预测方法,其特征在于,所述步骤1中的获取肾乳头状细胞癌早期患者稳定差异表达的特征miRNA具体为:
步骤1.1、从GenomicDataCommonsDataPortal数据库中下载肾乳头状细胞癌患者肿瘤组织和癌旁组织转录组数据以及临床数据,获得肾乳头状细胞癌患者肿瘤组织基因表达谱readcounts数值,进行对数转换;
步骤1.2、选取样本中miRNA的readcounts大于等于10的miRNA,再对所有miRNA的readcounts取对数,设样本总数为n,筛选后miRNA总数为m,v为miRNA的readcounts,u为取对数之后的表达值,则有;
uij=log2vij,i∈(1,n),j∈(1,m)(1)
其中,i为样本编号,j为miRNA编号,uij为第i个样本、第j个miRNA编号取对数之后的表达值,vij为第i个样本、第j个miRNA编号的readcounts数值;
步骤1.3、选取疾病分期为I期和II期的肾乳头状细胞癌患者,将这些患者记为肾乳头状细胞癌早期患者,肾乳头状细胞癌早期患者总数记为n′;
步骤1.4、选取肿瘤和正常样本中变异系数均小于0.1的miRNA,设μ为所有样本中miRNA的表达均值,σ为标准差,变异系数的计算公式为:
其中,j为miRNA编号,cv为变异系数,cvj为第j个样本的变异系数,σj为第j个miRNA编号的标准差,μj为第j个miRNA编号的miRNA的表达均值,设m1为稳定表达的miRNA总数,则有:
步骤1.5、选取肿瘤和正常样本中差异表达的miRNA,使用取对数后的表达值计算肿瘤和正常样本miRNA取对数后的倍数变化f,公式为:
其中j为miRNA编号,fj为第j个miRNA编号的倍数变化,μ1j为第j个miRNA编号的肿瘤样本的表达均值,μ2j为第j个miRNA编号的正常样本的表达均值;
然后使用独立样本t检验比较肿瘤和正常样本中miRNA的表达差异,独立样本t检验公式为:
其中n1为肿瘤样本数,n2为正常样本数,μ1为肿瘤样本miRNA表达均值,μ2为正常样本miRNA表达均值,为肿瘤样本miRNA方差,为正常样本miRNA方差;
对所有t检验得出的p值进行错误发现率(falsediscoveryrate,FDR)校正,定义q为FDR校正后的数值,r为p值在m1个miRNA中排序后的位置,则有:
其中,j为miRNA编号,qj代表第j个miRNA编号的FDR校正后的数值,pj代表第j个miRNA编号的t检验得出的p值,rj代表第j个miRNA编号的p值在m1个miRNA中排序后的位置;
最后选取倍数变化f的绝对值大于1且FDR校正后q值小于等于0.05的miRNA,记为特征miRNA,设特征miRNA总数为m2,则有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1)(7)。
4.根据权利要求2所述的预测方法,其特征在于,所述miRNA分别为:hsa-mir-10a、hsa-mir-10b、hsa-mir-125a、hsa-mir-126、hsa-m...
【专利技术属性】
技术研发人员:刘大海,李文兴,刘杰汀,刘蕾娜,焦文乔,
申请(专利权)人:佛山科学技术学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。