基于数据扩增的识别模型的优化方法、设备及介质技术

技术编号：40111740 阅读：6 留言：0更新日期：2024-01-23 19:17

本公开描述一种基于数据扩增的识别模型的优化方法、设备及介质，优化方法包括获取多张眼底图像和各张眼底图像对应的真实标签；构建包括多个训练样本的训练集，训练样本包括对眼底图像进行数据扩增获得的至少两张扩增图像；基于训练集的各个训练样本对识别模型进行训练以获取与扩增图像对应的多个特征向量以及包括预测标签的预测结果；基于多个特征向量获得用于表征多个特征向量之间的相似性的第一损失函数，基于真实标签和预测标签获得第二损失函数；并且基于第一损失函数和第二损失函数优化识别模型。由此，提供一种能够提高对同一类别图像的识别效果的基于数据扩增的识别模型的优化方法、设备及介质。

全部详细技术资料下载

【技术实现步骤摘要】

本公开大体涉及图像处理，具体涉及一种基于数据扩增的识别模型的优化方法、设备及介质。

技术介绍

1、眼底照片作为一种用于显示眼底各类体征的医学资料，能够用于检查和评估病人的身体状况。其中，对眼底照片上的体征(尤其是一些难以通过人眼察觉的体征)进行准确地识别尤为重要，能够便于掌握病人的实际情况。现如今，大多使用深度神经训练等方式来构建用于识别眼底照片的识别模型，以实现对眼底照片的准确识别。

2、在申请号202210237199.4，专利技术名称为“一种基于美学相似性度量的图像美学排序方法”的中国专利中，其训练过程以图像对作为输入，根据两个美学特征向量间的距离及真实标签，利用余弦相似度损失函数计算模型损失值，以最小化该损失值为目标，通过梯度反向传播的方式更新模型梯度，可以缩小预测类别与实际类别之间的距离，从而提高分析的准确性。

3、上述专利通过两张不同的原始图像作为识别模型的输入，两张图像的相似度基于图像的真实标签进行设定，以此来训练模型提高识别不同的图像是否属于同一类别的效果。然而，原始图像可能会受到外界因素的影响产生变化，进而导致模型无法适应不同条件下的同一图像，往往会导致模型产生域偏移问题(也即，模型通常会因为数据的分布差异而减弱其泛化能力)，从而可能会使识别模型对同一图像的分类和判断的准确性较低。

技术实现思路

1、本公开是有鉴于上述的状况而提出的，其目的在于提供一种能够提高同一类别图像的识别效果的基于数据扩增的识别模型的优化方法、设备及介质。

>2、为此，本公开第一方面提供一种基于数据扩增的识别模型的优化方法，包括获取多张眼底图像和各张眼底图像对应的真实标签；构建包括多个训练样本的训练集，所述训练样本包括对所述眼底图像进行数据扩增获得的至少两张扩增图像；基于所述训练集的各个所述训练样本对所述识别模型进行训练以获取与所述扩增图像对应的多个特征向量以及包括预测标签的预测结果；基于所述多个特征向量获得用于表征所述多个特征向量之间的相似性的第一损失函数，基于所述真实标签和所述预测标签获得第二损失函数；并且基于所述第一损失函数和所述第二损失函数优化所述识别模型。

3、在本公开的第一方面中，由于对眼底图像进行数据扩增获得的扩增图像属于同一类别，同时由于数据扩增能够模拟不同条件下的同一张眼底图像(例如，通过不同的采集设备或处于不同拍摄环境所获取的同一张眼底图像)，通过构建包括对眼底图像数据扩增后的扩增图像的训练集，能够较好地囊括同一张眼底图像处于不同条件下的各个情况，从而能够使识别模型的训练更加全面。另外，由于特征向量能够以数值的方式表征图像的特征，因此基于特征向量能够便于比较扩增图像之间的相似性。另外，由于第一损失函数能够用于计算特征向量之间的相似度并基于相似度的调整(例如，采用降低相似度的值采用提高相似度的值或使相似度的值趋近1的方式)以优化识别模型的参数，由此能够提高扩增图像之间的相似性，从而能够提高识别模型对同一眼底图像在不同条件下(也即，同一眼底图像进行数据扩增获得的至少两张扩增图像)分类的准确性。同时，由于第二损失函数能够用于计算真实标签和预测标签之间的损失并通过最小化损失以优化识别模型的参数，由此能够降低真实标签和预测标签之间的差异性，从而能够提高识别模型对同一眼底图像和扩增图像的判断的准确性。

4、另外，在本公开第一方面所涉及的优化方法中，可选地，所述训练样本包括两张所述扩增图像，基于两张所述扩增图像对所述识别模型进行训练。在这种情况下，由于计算扩增图像之间的相似度(也即，比较扩增图像之间的相似性)需要基于两张扩增图像，通过两张扩增图像对识别模型进行训练，能够基于扩增图像之间的相似度来优化识别模型，从而能够提高识别模型对扩增图像的识别准确性。

5、另外，在本公开第一方面所涉及的优化方法中，可选地，所述数据扩增的运算包括图像翻转、图像随机旋转、图像缩放、图像剪裁、图像填充、图像颜色变换或图像添加噪声中的至少一种。在这种情况下，通过将同一眼底图像进行多种数据扩增，能够模拟同一眼底图像的不同条件并对识别模型进行训练，进而能够提高不同条件下的同一眼底图像之间的相似性，从而能够提高识别模型对同一图像在不同条件下(也即，同一眼底图像进行数据扩增获得的至少两张扩增图像)分类的准确性。

6、另外，在本公开第一方面所涉及的优化方法中，可选地，所述数据扩增的运算包括图像复制。在这种情况下，由于经图像复制后所获得的扩增图像与眼底图像一致，通过提高经图像复制后所获得的扩增图像与其他扩增图像的相似性，能够提高识别模型对眼底图像以及扩增图像的识别效果，由此，能够提高识别模型对同一眼底图像的分类的准确性。

7、另外，在本公开第一方面所涉及的优化方法中，可选地，还利用历史模型和当前识别模型的特征向量优化所述识别模型，所述历史模型为所述当前识别模型之前的任一次优化所得的识别模型。在这种情况下，通过调取历史模型的扩增图像的特征向量，能够计算出输入至历史模型的扩增图像和输入至当前识别模型的扩增图像之间的相似度，并基于上述相似度提高输入至历史模型的扩增图像和输入至当前识别模型的扩增图像之间的相似性以优化当前识别模型，由此能够进一步提高当前识别模型对同一类别的扩增图像的分类的准确性。

8、另外，在本公开第一方面所涉及的优化方法中，可选地，基于同一个所述训练样本优化所述识别模型。在这种情况下，由于同一训练样本属于同一类别，通过计算同一训练样本内多个扩增图像之间的相似度，能够提高同一训练样本内不同扩增图像之间的相似性，从而能够提高当前识别模型对同一训练样本内不同扩增图像之间分类的准确性。

9、另外，在本公开第一方面所涉及的优化方法中，可选地，将所述眼底图像的真实标签作为所述扩增图像的真实标签，所述预测结果与所述扩增图像相对应。在这种情况下，由于眼底图像和扩增图像属于同一类别，能够使扩增图像的真实标签与眼底图像的真实标签保持一致，同时，能够基于预测结果中的预测标签与真实标签进行对比以获取识别模型对扩增图像的识别的准确性。

10、另外，在本公开第一方面所涉及的优化方法中，可选地，所述第二损失函数用于表征所述真实标签与所述预测标签之间的差异性。在这种情况下，通过第二损失函数对真实标签与预测标签之间的损失进行计算，能够基于调整损失的大小以降低真实标签与预测标签之间的差异性，从而能够使具有预测标签的预测结果与具有真实标签的真实结果尽可能接近，进而能够提高识别模型对同一眼底图像的判断的准确性。

11、本公开的第二方面提供一种电子设备，所述电子设备包括处理器和存储器，所述处理器执行所述存储器存储的程序以实现如本公开第一方面所涉及的优化方法。

12、本公开的第三方面提供一种计算机可读存储介质，所述计算机可读存储介质存储有至少一个指令，所述至少一个指令被处理器执行时实现如本公开第一方面所涉及的优化方法。

13、根据本公开，能够提供一种提高对同一类别图像的识别效果的基于数据扩增的识别模型的优化方法、设备及介质本文档来自技高网...

【技术保护点】

1.一种基于数据扩增的识别模型的优化方法，其特征在于，包括获取多张眼底图像和各张眼底图像对应的真实标签；构建包括多个训练样本的训练集，所述训练样本包括对所述眼底图像进行数据扩增获得的至少两张扩增图像；基于所述训练集的各个所述训练样本对所述识别模型进行训练以获取与所述扩增图像对应的多个特征向量以及包括预测标签的预测结果；基于所述多个特征向量获得用于表征所述多个特征向量之间的相似性的第一损失函数，基于所述真实标签和所述预测标签获得第二损失函数；并且基于所述第一损失函数和所述第二损失函数优化所述识别模型。

2.根据权利要求1所述的优化方法，其特征在于，所述训练样本包括两张所述扩增图像，基于两张所述扩增图像对所述识别模型进行训练。

3.根据权利要求1所述的优化方法，其特征在于，所述数据扩增的运算包括图像翻转、图像随机旋转、图像缩放、图像剪裁、图像填充、图像颜色变换或图像添加噪声中的至少一种。

4.根据权利要求1所述的优化方法，其特征在于，所述数据扩增的运算包括图像复制。

5.根据权利要求1所述的优化方法，其特征在于，还利用历史模型和当前识别

6.根据权利要求5所述的优化方法，其特征在于，基于同一个所述训练样本优化所述识别模型。

7.根据权利要求1所述的优化方法，其特征在于，将所述眼底图像的真实标签作为所述扩增图像的真实标签，所述预测结果与所述扩增图像相对应。

8.根据权利要求1所述的优化方法，其特征在于，所述第二损失函数用于表征所述真实标签与所述预测标签之间的差异性。

9.一种电子设备，其特征在于，所述电子设备包括处理器和存储器，所述处理器执行所述存储器存储的程序以实现如权利要求1-8中任一项所述的优化方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有至少一个指令，所述至少一个指令被处理器执行时实现如权利要求1-8中任一项所述的优化方法。

...

【技术特征摘要】

2.根据权利要求1所述的优化方法，其特征在于，所述训练样本包括两张所述扩增图像，基于两张所述扩增图像对所述识别模型进行训练。

4.根据权利要求1所述的优化方法，其特征在于，所述数据扩增的运...

【专利技术属性】
技术研发人员：郑万铎，潘晓春，王娟，陈素平，熊慧彤，夏斌，
申请(专利权)人：深圳硅基智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人