一种基于microRNA测序丰度的肺腺癌机器学习模型制造技术

技术编号:41879919 阅读:13 留言:0更新日期:2024-07-02 00:33
本发明专利技术公开了一种基于microRNA(miRNA)测序丰度的肺腺癌机器学习分类模型,其方法为:步骤一、分析肺腺癌组织样本和癌旁正常组织样本的miRNA高通量测序数据,获取成熟的miRNA在测序文件中的丰度值;步骤二、对丰度值矩阵进行批次效应校正和标准化处理;步骤三、用DFL算法选出3个miRNA,分别是hsa‑miR‑200b‑5p、hsa‑miR‑126‑5p、hsa‑miR‑30c‑2‑3p,并使用K‑邻近、决策树、随机森林、支持向量机、DFL,5种分类算法对上述3个miRNA对应的丰度值数据构建用于预测肺腺癌的机器学习分类模型,准确率分别为100%,98.6%,100%,98.6%,100%。

【技术实现步骤摘要】

本专利技术涉及生物信息学、机器学习领域。具体来说本专利找到了3个microrna(mirna),即hsa-mir-200b-5p、hsa-mir-126-5p和hsa-mir-30c-2-3p是识别肺腺癌的重要特征,并构建了一种基于上述3种mirna丰度值的肺腺癌机器学习分类模型。


技术介绍

1、肺癌是全球死亡率最高的恶性肿瘤,是人类癌症致死的主要类型,约占所有癌症的18%。而肺腺癌作为原发性肺癌中最常见的一种亚型,约占所有肺癌的40%,它的发病年龄小,女性群体的发病率相对较高,在早期常无明显的发病症状,往往发现于临床晚期,极大的增加了治疗难度和治疗成本。已有研究发现,肺腺癌的发生和基因突变有着极大的相关性。

2、microrna(mirna)是一种在动植物体内广泛存在的内源性单链非编码rna,长约21nt~24nt。mirna通常是在核内转录,经过一系列的剪切处理后输送到细胞质中。随后,经核酸酶dicer将其剪切产生约为22个核苷酸长度的成熟mirna。成熟的mirna通过碱基配对结合与其互补的mrna,介导mrna降解或者抑制其翻译,从而起本文档来自技高网...

【技术保护点】

1.一种基于microRNA测序丰度的肺腺癌机器学习分类模型,其特征在于:

2.本专利采用DFL算法找到的3个识别肺腺癌的miRNA特征(即hsa-miR-200b-5p、hsa-miR-126-5p、hsa-miR-30c-2-3p),以及以此构建其他机器学习分类模型的方法,即除了KNN、C4.5、RF、SVM和DFL以外的其他机器学习分类算法,仍然受到该专利的保护。

【技术特征摘要】

1.一种基于microrna测序丰度的肺腺癌机器学习分类模型,其特征在于:

2.本专利采用dfl算法找到的3个识别肺腺癌的mirna特征(即hsa-mir-200b-5p、hsa-...

【专利技术属性】
技术研发人员:郑云李宛燃郭仕勇
申请(专利权)人:云源智鑫生物科技昆明有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1