System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于MLP构建甲状腺癌淋巴结转移诊断分类器制造技术_技高网

基于MLP构建甲状腺癌淋巴结转移诊断分类器制造技术

技术编号:40659306 阅读:4 留言:0更新日期:2024-03-18 18:51
本发明专利技术主要涉及一种基于MLP构建甲状腺癌淋巴结转移诊断分类器,其特征在于基于甲状腺癌淋巴结转移N0期及N1期的样本聚类。所述样本聚类是利用mRMR(最大相关性最小冗余)算法对甲状腺癌淋巴结转移分期相关的mRNA表达数据进行排序筛选,得到可明显区分样本的特征mRNA;采用不同算法基于特征mRNA分别构建支持向量机(SVM)分类器、随机森林(RF)分类器、高斯朴素贝叶斯(NB)分类器、神经网络(MLP)分类器、K近邻(KNN)分类器。基于增量特征选择(IFS)方法对5个分类器最终筛选,最终得到用于区分甲状腺癌淋巴结转移最佳分类模型神经网络(MLP)分类器,具有最佳灵敏度、特异性、准确度及AUC值,可保证诊断评估的最佳性能。

【技术实现步骤摘要】

【】本专利技术涉及甲状腺癌研究及分型应用领域,具体地说,是一种基于mlp构建甲状腺淋巴结转移诊断分类器。


技术介绍

0、
技术介绍

1、甲状腺癌是最常见的内分泌恶性肿瘤,其发病率逐年增加。目前许多方法用于诊断甲状腺癌,或者进行血清甲状腺激素测定、超声诊断检查、细针穿刺(fna)等。在临床实践中,约20%的fna细胞学报告显示为“不确定性”或滤泡结节。因此,辅助诊断方法和分子诊断的方法成为术前诊断的必要手段。尽管近些年来诊断技术和治疗技术的提升,但甲状腺癌的预后仍不理想。早期快速诊断对患者治疗和生存具有重要意义,尤其是诊断甲状腺癌典型特征淋巴结转移分期,因此急需开发新的诊断标志物,用于甲状腺癌早期诊断以通过针对性治疗改善患者预后。

2、机器学习是现代医学非常重要的研究手段,在生物信息学领域,机器学习主要用于疾病诊断标志物筛选和预后模型的构建。已有人利用支持向量机(svm)、随机森林(rf)和knn算法,并通过ifs算法挑选最优的阿兹尔海默症诊断分类器。有研究报道基于机器学习模型使用k折交叉验证和基于混杂因素的交叉验证方法,发现一种通过无细胞dna(cfdna)特征来进行早期癌症诊断的方法,这种方法具有高灵敏度和特异性。有研究报道了通过knn算法分析骨肉瘤基因组表达图谱,鉴定了软组织骨肉瘤新型诊断和预后的生物标志物,并且该标志物有希望成为治疗靶点。机器学习在挖掘癌症诊断标志物和预后标志物等研究中具有重大潜力。

3、甲状腺癌最常见的转移方式是淋巴结转移,超过90%的甲状腺癌为分化型甲状腺癌,分化型甲状腺癌主要包括甲状腺乳头状癌和甲状腺滤泡癌。颈部淋巴结转移在分化型甲状腺癌中更为常见,因此颈部淋巴结转移是衡量预后重要因素之一,也是诊断甲状腺癌患病和精准性治疗的重要因素。淋巴结转移与肿瘤复发及术后生存率密切相关,准确评估淋巴结转移情况有利于临床医生确定更优化的治巧方案和手术方式,例如决定是否进行全甲状腺切除术或次全切除术、近全切除术除等术等,以及决定有无必要进行淋巴结清扫术等。目前判断甲状腺癌淋巴结转移诊断主要以影像学为基础,鉴于早期甲状腺癌淋巴结转移影像学特征隐匿,不利于早期甲状腺癌淋巴结转移的筛查及分期诊断。因而本研究选择通过机器学习算法构建基于甲状腺癌淋巴结转移诊断模型,为甲状腺癌淋巴结转移诊断提供更便利的检测工具。


技术实现思路

0、
技术实现思路

1、基于上述技术问题,本专利技术提供一种机器学习算法构建的甲状腺癌的淋巴结转移诊断分类器,其特征在于分类算法的具体化及基于甲状腺癌淋巴结转移分期的样本聚类。

2、所述分类算法的具体化是利用mrmr算法对甲状腺癌淋巴结转移分期数据集分析,获得可区分样本的特征mrna后,基于特征mrna采用不同算法构建各异分类模型,结合ifs分析从中筛选具有最佳auc值的最佳分类模型。

3、所述样本聚类是指基于最佳分类器的分类结果可准确区分甲状腺癌淋巴结转移n0及n1分期。

4、一种机器学习算法构建的甲状腺癌样本的淋巴结转移分期分类器,其具体算法为:

5、step1:利用mrmr进行特征mrna筛选。

6、利用mrmr算法(最大相关性最小冗余)对差异矩阵中mrna排序。筛选出与甲状腺癌淋巴结转移分期相关性最大,与其它特征的冗余度最小的特征mrna。

7、所述mrmr算法具体步骤为:

8、(1)量化基因集中mrna与甲状腺癌淋巴结转移分期特征的相关性和与其他特征的冗余性:

9、

10、其中p(x,y)是向量x和y的联合概率密度,p(x)和p(y)是边际概率密度。

11、(2)基因f与其目标变量c之间的相关性d定义为:

12、d=i(f,c)

13、(3)基因f和基因集t中的基因之间的冗余r定义为:

14、

15、其中m是t中的基因数。相关性和冗余之间的权衡如下:

16、maxf(d-r)

17、(4)重复上述计算,获得基因排序矩阵,选择一组特征基因用于区分甲状腺癌淋巴结分期。

18、step2:多个样本聚类模型构建;

19、基于mrmr初步筛得mrna,采用差异算法分别构建支持向量机(svm)分类器、随机森林(rf)分类器、高斯朴素贝叶斯(nb)分类器、神经网络mlp分类器、k近邻(knn)算法构建分类器。

20、step3:样本聚类模型筛选;

21、为了筛选具有最佳诊断性能的分类模型,利用增量特征选择(ifs)方法,绘制各模型的ifs曲线,选择合适的基因数目截止值和合适的分类器来获得良好的预测性能:

22、ifs增量特征选择的具体实施步骤如下:

23、(1)在10倍交叉验证下绘制各分类器的ifs曲线,以获取各分类器的马修斯系数(mcc);

24、(2)以mcc作为反映分类器可靠性的统计参数,选择mcc值最大的分类器中的特征mrna;

25、(3)计算auc值判断分类器的诊断性能。最终根据auc值筛选所得mlp分类器具有最佳诊断性能,将其作为一种机器学习算法构建甲状腺癌淋巴结转移样本聚类分类器。

26、所述用于构建甲状腺癌淋巴结转移诊断分类器的特征基因为znf536、mlycd、eva1c、ahnak、cbfb。

27、所述甲状腺癌淋巴结转移诊断分类器为基于神经网络算法构建的mlp分类器。

28、本专利技术的有益效果为:本申请采用mrmr算法初步筛选特征mrna,结合支持向量机(svm)、随机森林(rf)、高斯朴素贝叶斯(nb)、神经网络mlp、k近邻(knn)分类器构建作为候选甲状腺癌淋巴结转移分期聚类模型。通过ifs曲线绘制,通过auc等关键参数实现分类器的最终筛选。

29、为比较验证各模型的筛选效果以及所筛选基因的有效性,本申请基于最终筛选的基因重新处理数据,并利用常用的机器学习分类模型进行训练验证。为了避免分类模型本身的影响,分别采用了svm、rf、knn、决策树等多个机器学习算法反复验证,比较不同算法的分类效果。

30、本申请基于甲状腺癌淋巴结转移不同分期的数据,横向比较不同分类器算法模型,神经网络算法在所有分类模型中都表现出了比较大的优势。这表明神经网络分类器模型针对小样本高维度的基因特征数据能够表现出强大的分类能力。

本文档来自技高网...

【技术保护点】

1.一种甲状腺癌淋巴结转移诊断分类器,其特征在于分类算法的具体化及基于甲状腺癌淋巴结转移分期的样本聚类;

2.按照权利要求1所述的一种甲状腺癌淋巴结转移诊断分类器,其具体算法为:

3.按照权利要求1所示的一种甲状腺癌淋巴结转移诊断分类器其特征在于,所述分类器为MLP分类器。

4.按照权利要求1所示的一种甲状腺癌淋巴结转移诊断分类器其特征在于,对甲状腺癌淋巴结转移N0及N1期的准确聚类。

5.按照权利要求1所示的一种一种甲状腺癌淋巴结转移诊断分类器,其特征在于,特征基因为ZNF536、MLYCD、EVA1C、AHNAK、CBFB。

【技术特征摘要】

1.一种甲状腺癌淋巴结转移诊断分类器,其特征在于分类算法的具体化及基于甲状腺癌淋巴结转移分期的样本聚类;

2.按照权利要求1所述的一种甲状腺癌淋巴结转移诊断分类器,其具体算法为:

3.按照权利要求1所示的一种甲状腺癌淋巴结转移诊断分类器其特征在于,所述分类器为mlp分...

【专利技术属性】
技术研发人员:程翎李晨倪显彬
申请(专利权)人:浙江洛兮医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1