基于不确定度校准和区域分解的端到端染色体分割方法技术

技术编号：37593329 阅读：9 留言：0更新日期：2023-05-18 11:34

本发明专利技术公开一种基于不确定度校准和区域分解的端到端染色体分割方法，属于视频识别技术领域。首先对需要进行端到端染色体分割的染色体图片进行预处理：通过迁移学习方法在染色体分类数据集上预训练骨干网络ResNet101提取染色体基本特征；引入不确定度分支输出不确定度学习检测框的可靠性，利用不确定度修正染色体检测框的位置来实现对染色体更加精确的定位，最后利用分解因子将区域生成网络RPN产生的所有建议框RoI分解、自适应融合，减轻重叠染色体分割时产生的语义歧义，最终得到分割更完整的染色体。实现了在数据量较少的情况下有效提取染色体特征；够更好的应对交叉、重叠染色体的漏检和定位不准的问题。体的漏检和定位不准的问题。体的漏检和定位不准的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于不确定度校准和区域分解的端到端染色体分割方法

[0001]本专利技术涉及一种基于不确定度校准和区域分解的端到端染色体分割方法，属于图像识别

技术介绍

[0002]由于染色体的数目异常或结构畸变均可能引发如智力障碍、先天性畸形等遗传类疾病，因此目前需要通过对染色体进行观测，从而对胎儿健康进行预测，目前主要通过孕期产前筛查和产前诊断等加以预防。羊水穿刺染色体核型分析作为目前产前诊断的金标准，是将样本羊水细胞分裂中期的染色体显带成像后进一步分割、排序以识别异常。然而，细胞中染色体游离柔性，多重叠交叉且形态多变，导致目前核型分析仍主要依赖专业人士，代价高昂，效率低下且极度依赖经验，亟需高效精确的智能辅助手段。
[0003]现有技术中存在的问题：染色体分割作为核型分析的首要任务，是后续分类和识别的基础，重点需要解决重叠交叉染色体的分割。和自然图像分割不同，染色体图像的分割存在如下几大大挑战：1)染色体非刚性。染色体是一种非刚性的物质，其多以弯曲状态游离存在于人体细胞核中，造成染色体的多姿态复杂性，给染色体分割任务带来困难。2)多簇性。由于染色体是以游离的状态分布于细胞核中，这就导致染色体容易出现两条或者多条的簇集，造成染色体接触、重叠。3)标记数不足。染色体图像由于其私密性，缺少标注的数据集。
[0004]现有技术中，申请号：202210548618.6公开一种重叠染色体分割方法，对重叠染色体图像进行边缘提取，并获得所有重叠染色体的边缘轮廓，将所述的边缘轮廓点全部加入到待选切割点集合；对重叠染色体...

【技术保护点】

【技术特征摘要】
1.一种基于不确定度校准和区域分解的端到端染色体分割方法，其特征在于步骤如下：步骤1、首先对需要进行端到端染色体分割的染色体图片进行预处理：步骤2、通过迁移学习方法在染色体分类数据集上预训练骨干网络ResNet101提取染色体基本特征；步骤3、引入不确定度分支输出不确定度学习检测框的可靠性，利用不确定度修正染色体检测框的位置来实现对染色体更加精确的定位；步骤4、最后利用分解因子将区域生成网络RPN产生的所有建议框RoI分解、自适应融合，减轻重叠染色体分割时产生的语义歧义，最终得到分割更完整的染色体。2.根据权利要求1所述一种基于不确定度校准和区域分解的端到端染色体分割方法，其特征在于，步骤1中预处理的具体步骤为：1a、将染色体图像放缩到800
×
1088
×
3像素；1b、利用labelme软件根据G带染色体数据集对染色体图像中的染色体G带信息进行标注，包括染色体的定位、类别、分割标签向量信息。3.根据权利要求1所述一种基于不确定度校准和区域分解的端到端染色体分割方法，其特征在于，步骤2具体步骤如下：2a、将原始染色体图片作为输入送入主干特征提取网络ResNet101，特征提取后利用长宽压缩了两次、三次、四次、五次的特征图C2，C3，C4，C5进行后续特征金字塔的构造,其中ResNet101网络为通过迁移学习在公共染色体分类公共数据集上预训练微调过的骨干网络，通过迁移学习得到的骨干网络相比在ImageNet自然图像上训练骨干网络可以提取染色体的基本特征，有利于后续针对染色体设计的分割网络；2b将四张特征图C2，C3，C4，C5送入特征金字塔FPN以多尺度提取特征，得到不同尺度的四张特征图P2，P3，P4，P5；计算labelme软件标注了染色体G带信息中所有单条染色体的面积得出染色体为小目标的结论，仅需要特征金字塔FPN的多尺度作用在小尺度上，因此只选择P2，P3层作为特征层输出即可；2c将特征金字塔FPN的输出的特征图P2，P3，P4，P5送入区域生成网络RPN进行第一阶段的回归和分类任务，得到的染色体定位框RoI，由于染色体是小目标，只需要输出特征图P2，P3，利用染色体定位RoI到特征图P2，P3上进行RoIAlign截取出每个RoI对应的特征图。4.根据权利要求1所述一种基于不确定度校准和区域分解的端到端染色体分割方法，其特征在于，其特征在于步骤3具体步骤如下：3a截取出每个RoI对应的特征图分别接回归分支和分类分支，其中在回归分支设置两个卷积层Conv，在分类分支设置两个全连接层FC；3b在回归分支额外设计不确定度分支，利用不确定度分支输出的不确定度建立高斯分布模型，染色体目标对应所有候选框的回归参数平均值作为高斯分布的均值，同时将对应候选框不确定度分支的预测值经过softmax操作后得到的处于[0,1]之间的值作为高斯分布的标准差，建立每一条染色体对应的所有候选框的高斯分布；在训练过程中，使经过回归后被认定可以覆盖染色体的候选框的分布接近真实框的分布计算损失函数。5.根据权利要求4所述一种基于不确定度校准和区域分解的端到端染色体分割方法，其特征在于，步骤4具体步骤如下：
4a将RoI区域多次分割以避免由两条及两条以上染色体重叠引起的语义歧义，具体做法为：在RoIAlign之前将RoI根据...

【专利技术属性】
技术研发人员：张林，范心宇，刘辉，李秀宇，郑红党，翟敬芳，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人