【技术实现步骤摘要】
一种基于多层感知机的乳腺肿瘤数据清洗方法
本专利技术涉及数据清洗
,具体涉及一种基于多层感知机的乳腺肿瘤数据清洗方法。
技术介绍
研究表明,超声对区分肿瘤良恶性具有较高的准确性,可以极大程度的避免不必要的活检。超声图像的读取依赖于超声医师自身经验水平,因此使用计算机手段进行超声图像数据的处理,能有效地提高数据处理的特异性及敏感性,具有重要的理论意义与极高的临床价值。传统的计算机处理技术利用图像预处理手段及分割技术从乳腺肿瘤超声图像中提取出感兴趣区域的纹理、形态学等有效特征,然后根据得到的特征使用机器学习手段进行分类器的拟合学习,从而实现乳腺肿瘤良恶性的分类。由于上述过程中使用的皆是纹理、形态学等低级图像特征,而医师临床诊断中常使用的为与乳腺肿瘤超声征象相关的高级语义特征,从而导致学习模型给出的分类结果难以直观被理解和解释。其次,由于相关特征的提取对设备参数、图片质量依赖性过高,导致分类模型不具有较强的鲁棒性。当乳腺肿瘤超声图像来源不同时,超声图像质量的改变将影响到最终分类的效果。若是根据BI-RADS打分细则得到的数据 ...
【技术保护点】
1.一种基于多层感知机的乳腺肿瘤数据清洗方法,其特征在于,其包括以下步骤:/n步骤S1、基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;/n步骤S2、根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;/n步骤S3、基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩 ...
【技术特征摘要】
1.一种基于多层感知机的乳腺肿瘤数据清洗方法,其特征在于,其包括以下步骤:
步骤S1、基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
步骤S2、根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
步骤S3、基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
2.根据权利要求1的所述数据清洗方法,其特征在于,所述步骤S1中,所述n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。
3.根据权利要求1的所述数据清洗方法,其特征在于,所述步骤S3中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。
4.根据权利要求1的所述数据清洗方法,其特征在于,所述多层感知机中,输出层节点激发函数为Relu。
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。