一种基于柯西抗旋转损失函数的皮肤镜图像检索方法技术

技术编号：28837827 阅读：12 留言：0更新日期：2021-06-11 23:35

本发明专利技术提出一种基于柯西抗旋转损失函数的皮肤镜图像检索方法，包括如下步骤：步骤一：建立皮肤镜图像数据集；步骤二：柯西抗旋转CAR损失函数的设计；步骤三：基于柯西抗旋转损失函数的卷积神经网络结构设计；步骤四：网络训练；步骤五：皮肤镜图像检索。该损失函数能使网络直接学习图像对间的相似性，使得提取的哈希码具有类内紧密、类间远离的特点。并且其中设计的旋转不变损失项可以约束网络学习不同角度样本数据的输出差异，来获得具有一定旋转不变性。通过以上步骤，本发明专利技术可以较准确、较快速地从数据库中得到待检索皮肤镜图像的相似图像，其附带的诊断报告为皮肤科医生提供客观的建议和参考，提高诊断的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于柯西抗旋转损失函数的皮肤镜图像检索方法
本专利技术属于皮肤镜图像处理领域，具体涉及一种基于柯西抗旋转(CauchyAnti-rotation，CAR)损失函数的皮肤镜图像检索方法。
技术介绍
皮肤作为人体最大的器官，覆盖于全身，是防止病原体侵害和体内水分流失的重要屏障。受到多种因素的影响，各种各样的皮肤病侵犯着人们的健康。皮肤镜是一种观察活体皮肤表面及以下的亚微观结构和色素的无创性显微图像分析技术，对皮肤科临床诊断有重要意义。目前，皮肤病临床主要依靠医生使用皮肤镜检查技术，通过观察皮损区域颜色、纹理等特征，再结合自己的主观经验进行疾病诊断。这种方法带有主观性，易受皮肤科医生当时的视觉评价和诊断经验影响，诊断结果可重复性较差。而皮肤镜图像检索技术能够从已确诊的皮肤镜图像数据库中快速、准确地检索出一组相似的已确诊病例的皮肤镜图像并附带其诊断报告，为医生的诊断提供了有价值的参考信息，提高诊断准确率。皮肤病检索技术是一项具有高挑战性的研究任务，相比皮肤镜图像分类、分割等任务研究成果较少。传统的皮肤镜图像检索算法主要基于提取人工特征和遍历搜索的模式。人工设计的低层特征往往不具有高级语义信息，对皮损区域的描述能力不强。并且遍历检索计算量大、耗时长。又由于该类方法多个步骤之间会存在累计误差，因此检索准确率较低。近年来，随着深度学习技术的发展，利用卷积神经网络对皮肤图像提取高层语义特征并进行检索的方法，相比于传统方法通常能获得更好的检索准确率。皮肤镜图像特点复杂，异类皮肤病之间存在高相似度特征，同类皮肤病之间...

【技术保护点】
1.一种基于柯西抗旋转损失函数的皮肤镜图像检索方法，其特征在于，具体方案如下：/n步骤一：建立皮肤镜图像数据集/n针对黄种人皮肤镜图像构建数据集，共包含N种常见皮肤病，为构建数据集，将采集到的皮肤镜图像分辨率统一缩放为M×M；/n步骤二：柯西抗旋转CAR损失函数的设计/n设计基于图像对的柯西抗旋转损失函数；该损失函数能使网络直接学习图像对间的相似性，并且旋转不变损失项能约束网络学习不同角度样本数据的输出差异，来获得具有旋转不变性的深度哈希码；/n柯西抗旋转损失函数公式如式1：/n

【技术特征摘要】
1.一种基于柯西抗旋转损失函数的皮肤镜图像检索方法，其特征在于，具体方案如下：
步骤一：建立皮肤镜图像数据集
针对黄种人皮肤镜图像构建数据集，共包含N种常见皮肤病，为构建数据集，将采集到的皮肤镜图像分辨率统一缩放为M×M；
步骤二：柯西抗旋转CAR损失函数的设计
设计基于图像对的柯西抗旋转损失函数；该损失函数能使网络直接学习图像对间的相似性，并且旋转不变损失项能约束网络学习不同角度样本数据的输出差异，来获得具有旋转不变性的深度哈希码；
柯西抗旋转损失函数公式如式1：

式中N为样本数据量，λ和为超参数，γ1、γ2和γ3为尺度因子，i、j为图像编号，hi表示第i张图像的输出连续哈希码，hj表示第j张图像的输出连续哈希码，sij表示第i张图像和第j张图像是否相似，由图像样本标签得到，li表示第i张图像的标签，ωij为权重，k为θ为旋转扩充角度度数，hij为第i个样本在第j个旋转角度时的输出连续哈希码，为第i个样本不同角度的输出连续哈希码的均值，d1、d2和d3为距离函数；

步骤三：基于柯西抗旋转损失函数的卷积神经网络结构设计
采用经典的残差网络ResNet-18作为基础网络，将最终任务层设为哈希编码层，并构建孪生网络CAR-ResNet-18；
3.1ResNet-18网络结构
在深层网络能够收敛的前提下，随着网络深度加深，网络会遇到网络退化问题，即梯度消失或梯度爆炸；残差网络针对这一问题，通过将输入信息绕道传到输出，使网络学习输入与输出残差部分，简化学习目标和学习难度，避免了梯度消失问题，使网络更容易训练；
ResNet-18残差网络结构包含1个卷积层、1个最大值池化层、4个残差组、1个平均值池化层以及1个全连接层；其中，Resnet-18中数字18指定的是带有权重的18层，即包括卷积层和全连接层；maxpool代表最大值池化层，conv代表卷积层，avgpool代表平均值池化层，FC代表全连接层，s代表步长，p为padding；
3.2CAR-ResNet-18网络结构
基于基础网络ResNet-18构建基于柯西抗旋转损失函数的孪生网络CAR-ResNet-18；该网络的输入数据为皮肤镜图像对，并且采用两个孪生卷积神经网络，网络结构均为基础网络ResNet-18，两个分支采用权值共享策略；网络的最终任务层为哈希编码层HashingLayer,在哈希编码层之后采用如式(7)所示的Sigmoid激活函数将神经元的输出限制在范围[0,1]中，得到网络的最终输出连续哈希码，作为皮肤镜图像的连续特征向量；

步骤四：网络训练
用步骤一中的皮肤镜图像数据库，采用步骤二中设计的柯西抗旋转损失函数对步骤三中设计的孪生网络CAR-ResNet-18进行训练；
步骤五：皮肤镜图像检索
针对步骤一中的皮肤镜图像数据库基于哈希码构建哈希表结构，将孪生网络CAR-Res...

【专利技术属性】
技术研发人员：谢凤英，张漪澜，郑钰山，姜志国，张浩鹏，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人