【技术实现步骤摘要】
一种基于自适应分辨率的癌细胞识别方法
本专利技术属于癌细胞识别
,具体涉及一种基于自适应分辨率的癌细胞识别方法。
技术介绍
近年来,随着深度学习在语音图像识别和自然语言处理等领域中突飞猛进的发展,深度学习在医学图像中的研究成为热点,充分挖掘了大数据的潜在价值。应用于病理学图像分析的深度学习网络主要有基于受限玻耳兹曼机模型的深度信念网络、卷积神经网络、稀疏自动编码器、降噪自动编码器。深度学习是一种数据驱动(通过自主调度提升任务准确度)的学习方法,有特定结构和训练的多隐含层神经网络,其思想源于人脑对视觉信息的层次式处理。非线性激活函数ReLU和防过拟合函数Dropout的提出推动了CNN的再次流行。CNN利用空间的相对关系减少参数数目以提高训练速度,可在同一深层的最优化中实现特征提取、特征选择及特征分类这3个核心步骤,还可以根据需求将输出的特征进行特定处理后再输入分类器,较手工提取特征的方法能够更好地表达特征和区分细胞。由此,深度学习在病理特征选择和分类上具有不可比拟的优势。现有技术存在以下问题:1、由于每幅图像有十分巨大的尺寸与许多相似的细胞:一幅超过1.6亿像素的显微医学图像有2百万的细胞,而且病理图像有标记的数据集较少,因此在实现肿瘤细胞图像的自动精准分类处理过程中,样本信息的准确获取和有效处理是关键;2、由于一幅图像的感兴趣区域非常小(通常只有80个像素),而且往往重叠在一起,因此良恶性病变的各种细胞学标准中存在重叠,处理过程中的不充分非代表性抽样等可能导致不确切诊断。 >
技术实现思路
为解决上述
技术介绍
中提出的问题。本专利技术提供了一种基于自适应分辨率的癌细胞识别方法,具有从源头上解决现有显微医学图像下目标检测不准确问题的特点。为实现上述目的,本专利技术提供如下技术方案:一种基于自适应分辨率的癌细胞识别方法,具体包括以下步骤:(1)通过k-means方法对boundingbox聚类与高斯核函数加权滑窗,实现根据boundingbox大小自动调节分辨率,使得绝大多数采集到的训练集数据中的boundingbox处于一个合适的大小内;(2)对滑窗大小使用k-means方法根据boundingbox长和宽进行聚类,针对每一个目标框,标记文件格式为:object-class,x,y,width,height,因为使用欧氏距离会让大的boundingboxes比小的boundingboxes产生更多的错误,而我们希望能通过目标框获得好的目标框交并比(IOU),为此定义距离公式:d(box,centroid)=1-IOU(box,centroid),在计算目标框位置时我们将所有目标框中心点的x,y坐标都置为0,这样所有的目标框都处在相同的位置上,方便我们通过新距离公式计算目标框之间的相似度;(3)通过高斯核函数与滑窗加权,创造自适应度分辨率的训练集,如果一个目标被多个滑窗检测出来,则把置信度根据距离的高斯核函数加权得到最后的置信度训练集,对滑窗大小进行聚类,置信度距离与高斯核函数加权,每个癌细胞只会被与之最匹配的滑窗框出来;(4)结构保留的颜色规划:将RGB图像映射到laB颜色空间后配置直方图;(5)“随机中心法”产生原始数据10倍的初始训练集;(6)处理图片:对不同梯度的分辨率图片进行重叠滑窗法得出结果,最后进行数据融合处理得出最后结果。在本专利技术中进一步的,所述步骤(2)中提到的标记文件格式中的object-class是类的索引,针对癌细胞分为阳性和阴性,后面的4个值都是相对于整张图片的比例,x是候选框中心的x坐标,y是候选框中心的y坐标,width是候选框的宽,height是候选框的高。在本专利技术中进一步的,所述步骤(2)中使用的是软投票机制。在本专利技术中进一步的,所述步骤(5)中“随机中心法”的具体方法是对每张显微医学图像进行预处理,根据每个boundingbox的顶点位置在其附近产生一个随机中心的矩形框,该矩形框的尺寸采用输入网络所需要的尺寸。与现有技术相比,本专利技术的有益效果是:1、本专利技术从数据集的生成与推理过程中对高尺寸图像的预处理出发,从源头上解决现有显微医学图像下目标检测不准确的问题。2、本专利技术针对癌细胞识别时的重叠与细胞相似问题,利用自适应,实现根据boundingbox大小自动调节分辨率,进而使得绝大多数采集到的训练集数据中的boundingbox处于一个合适的大小内,从而具有提高确切诊断的功能。附图说明图1为本专利技术的自适应分辨率算法流程图。图2为本专利技术的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1请参阅图1-2,本专利技术提供以下技术方案:一种基于自适应分辨率的癌细胞识别方法,具体包括以下步骤:一种基于自适应分辨率的癌细胞识别方法,具体包括以下步骤:(1)通过k-means方法对boundingbox聚类与高斯核函数加权滑窗,实现根据boundingbox大小自动调节分辨率,使得绝大多数采集到的训练集数据中的boundingbox处于一个合适的大小内;(2)对滑窗大小使用k-means方法根据boundingbox长和宽进行聚类,针对每一个目标框,标记文件格式为:object-class,x,y,width,height,因为使用欧氏距离会让大的boundingboxes比小的boundingboxes产生更多的错误,而我们希望能通过目标框获得好的目标框交并比(IOU),为此定义距离公式:d(box,centroid)=1-IOU(box,centroid),在计算目标框位置时我们将所有目标框中心点的x,y坐标都置为0,这样所有的目标框都处在相同的位置上,方便我们通过新距离公式计算目标框之间的相似度;(3)通过高斯核函数与滑窗加权,创造自适应度分辨率的训练集,如果一个目标被多个滑窗检测出来,则把置信度根据距离的高斯核函数加权得到最后的置信度训练集,对滑窗大小进行聚类,置信度距离与高斯核函数加权,每个癌细胞只会被与之最匹配的滑窗框出来;(4)结构保留的颜色规划:将RGB图像映射到laB颜色空间后配置直方图;(5)“随机中心法”产生原始数据10倍的初始训练集;(6)处理图片:对不同梯度的分辨率图片进行重叠滑窗法得出结果,最后进行数据融合处理得出最后结果。为了对标记文件格式进行解释说明,本实施例中,优选的,所述步骤(2)中提到的标记文件格式中的object-class是类的索引,针对癌细胞分为阳性和阴性,后面的4个值都是相对于整张图片的比例,x是候选框中心的x坐标,y是候选框中心的y坐标,width是候选框的宽,本文档来自技高网...
【技术保护点】
1.一种基于自适应分辨率的癌细胞识别方法,具体包括以下步骤:/n(1)通过k-means方法对boundingbox聚类与高斯核函数加权滑窗,实现根据boundingbox大小自动调节分辨率,使得绝大多数采集到的训练集数据中的boundingbox处于一个合适的大小内;/n(2)对滑窗大小使用k-means方法根据boundingbox长和宽进行聚类,针对每一个目标框,标记文件格式为:object-class,x,y,width,height,因为使用欧氏距离会让大的boundingboxes比小的boundingboxes产生更多的错误,而我们希望能通过目标框获得好的目标框交并比(IOU),为此定义距离公式:d(box,centroid)=1-IOU(box,centroid),/n在计算目标框位置时我们将所有目标框中心点的x,y坐标都置为0,这样所有的目标框都处在相同的位置上,方便我们通过新距离公式计算目标框之间的相似度;/n(3)通过高斯核函数与滑窗加权,创造自适应度分辨率的训练集,如果一个目标被多个滑窗检测出来,则把置信度根据距离的高斯核函数加权得到最后的置信度训练集,对滑窗大 ...
【技术特征摘要】
1.一种基于自适应分辨率的癌细胞识别方法,具体包括以下步骤:
(1)通过k-means方法对boundingbox聚类与高斯核函数加权滑窗,实现根据boundingbox大小自动调节分辨率,使得绝大多数采集到的训练集数据中的boundingbox处于一个合适的大小内;
(2)对滑窗大小使用k-means方法根据boundingbox长和宽进行聚类,针对每一个目标框,标记文件格式为:object-class,x,y,width,height,因为使用欧氏距离会让大的boundingboxes比小的boundingboxes产生更多的错误,而我们希望能通过目标框获得好的目标框交并比(IOU),为此定义距离公式:d(box,centroid)=1-IOU(box,centroid),
在计算目标框位置时我们将所有目标框中心点的x,y坐标都置为0,这样所有的目标框都处在相同的位置上,方便我们通过新距离公式计算目标框之间的相似度;
(3)通过高斯核函数与滑窗加权,创造自适应度分辨率的训练集,如果一个目标被多个滑窗检测出来,则把置信度根据距离的高斯核函数加权得到最后的置信度训练集,对滑窗大小进行聚类,置信度距离与高斯核...
【专利技术属性】
技术研发人员:白夏颖,翟得胜,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。