痘痘类别预测模型的训练方法及相关装置制造方法及图纸

技术编号:37982246 阅读:8 留言:0更新日期:2023-06-30 09:57
本申请实施例涉及图像处理技术领域,公开了一种痘痘类别预测模型的训练方法及相关装置,该痘痘类别预测模型的训练方法,一方面,通过收集多种痘痘类别的痘痘图像,组合若干个痘痘图像,生成若干个痘痘图像块,并基于特征提取模块,对痘痘图像块进行处理,生成处理之后的痘痘图像块,本申请能够更好地对痘痘图像进行预处理;另一方面,通过Transformer模型模块的注意力机制对处理之后的痘痘图像块进行特征提取,再通过构建包括多类别加权交叉熵损失的损失函数进行模型训练,通过注意力机制,使得模型能够更加关注于痘痘特征在不同环境下的差异,从而提升痘痘类别识别的准确度。从而提升痘痘类别识别的准确度。从而提升痘痘类别识别的准确度。

【技术实现步骤摘要】
痘痘类别预测模型的训练方法及相关装置


[0001]本申请实施例涉及图像处理
,尤其涉及一种痘痘类别预测模型的训练方法及相关装置。

技术介绍

[0002]随着移动通信技术的快速发展以及人民生活水平的提升,各种智能终端已广泛应用于人民的日常工作和生活,使得人们越来越习惯于使用APP等软件,使得美颜自拍、拍照测肤等功能的APP需求也变得越来越多,因此不少的用户希望此类APP能够自动分析出脸部的痘痘情况,根据痘痘类别情况,有针对性提出皮肤改善方案。
[0003]目前,痘痘类别的识别通常采用神经网络进行训练,得到训练后的神经网络模型进行识别,但是由于痘痘类别之间可区别的特征不明显,可区分度较低,同时痘痘图像的分辨率较低,图像质量较差,容易导致训练出的模型的痘痘识别的准确度偏低。

技术实现思路

[0004]本申请实施例提供一种痘痘类别预测模型的训练方法及相关装置,以提高预测痘痘类别的准确率。
[0005]第一方面,本申请实施例提供一种痘痘类别预测模型的训练方法,痘痘类别预测模型包括特征提取模块、Transformer模型模块和分类器模块,方法包括:
[0006]获取图像数据集,其中,图像数据集包括多种痘痘类别的痘痘图像;
[0007]组合若干个痘痘图像,生成若干个痘痘图像块,其中,每一痘痘图像块包括相同数量的痘痘图像;
[0008]基于特征提取模块,对痘痘图像块进行处理,生成处理之后的痘痘图像块;
[0009]基于Transformer模型模块,对处理之后的痘痘图像块进行特征提取,以得到处理之后的痘痘图像块对应的编码特征,其中,Transformer模型模块通过注意力机制对处理之后的痘痘图像块进行特征提取;
[0010]基于分类器模块,对编码特征进行痘痘类别预测,以得到痘痘图像对应的痘痘类别;
[0011]构建损失函数,基于损失函数对痘痘类别预测模型进行训练,直至损失函数收敛,其中,损失函数包括多类别加权交叉熵损失。
[0012]在一些实施例中,特征提取模块包括嵌入层,基于特征提取模块,对痘痘图像块进行处理,生成处理之后的痘痘图像块,包括:
[0013]将痘痘图像块对应的向量输入到嵌入层,生成处理之后的痘痘图像块对应的特征向量,其中,特征向量的大小与痘痘类别的种类数量相关,嵌入层的网络结构为全连接层。
[0014]在一些实施例中,方法还包括:
[0015]生成类别块,将类别块与处理之后的痘痘图像块进行合并,得到拼接块,具体包括:
[0016]生成类别块,其中,类别块对应一随机向量,将类别块对应的随机向量与处理之后的痘痘图像块对应的特征向量进行合并,得到拼接块对应的拼接向量。
[0017]在一些实施例中,基于Transformer模型模块,对处理之后的痘痘图像块进行特征提取,以得到处理之后的痘痘图像块对应的编码特征,包括:
[0018]基于Transformer模型模块,对拼接块进行特征提取,以得到拼接块对应的编码特征,其中,Transformer模型模块通过注意力机制对拼接块进行特征提取。
[0019]在一些实施例中,Transformer模型模块包括归一化层、注意力机制层以及感知机层,基于Transformer模型模块,对拼接块进行特征提取,以得到拼接块对应的编码特征,包括:
[0020]PE

=LN(PE)
[0021]PE

=Attention(PE

)+PE

[0022]PE
″′
=MLP(LN(PE

))+PE

[0023]其中,PE为拼接块对应的特征向量,LN为线性变换,PE

为对拼接块对应的特征向量进行线性变换得到的特征向量,Attention为注意力网络变换,Attention(PE

)为对特征向量PE

进行注意力网络变换得到的特征向量,PE

为特征向量PE

和对特征向量PE

进行注意力网络变换得到的特征向量的向量和,MLP(LN(PE

))为先对特征向量PE

进行线性变换,再将线性变换得到的特征向量输入到感知机层得到的特征向量,PE
″′
为Transformer模型模块进行一次编码得到的特征向量。
[0024]在一些实施例中,注意力机制层的计算公式包括:
[0025]Q=X*W
Q
[0026]K=X*W
K
[0027]V=X*W
V
[0028][0029]其中,X为拼接块对应的拼接向量,Q为查询向量,K为键向量,V为值向量,W
Q
为拼接向量X进行线性映射到查询向量Q的参数矩阵,W
K
为拼接向量X进行线性映射到键向量K的参数矩阵,W
V
为拼接向量X进行线性映射到值向量V的参数矩阵,K
T
为键向量K的转置,d
k
为键向量K的列数,softmax为按列进行归一化的函数,Attention(Q,K,V)为关系权重。
[0030]在一些实施例中,方法还包括:
[0031]通过多次调用Transformer模型模块,多次对拼接块进行特征提取,以得到拼接块对应的编码特征,其中,每一次调用Transformer模型模块的输入向量和输出向量的大小不变。
[0032]在一些实施例中,痘痘类别预测模型的损失函数为:
[0033][0034]其中,Loss为多类别加权交叉熵损失,z为痘痘图像的总数量,n为痘痘类别的数
量,W
i
为第i类别的类别权重,为真实的第j个样本预测为第i类别的痘痘的概率,为预测的第j个样本预测为第i类别的痘痘的概率。
[0035]在一些实施例中,痘痘类别包括粉刺、痘后红斑、炎症性丘疹、脓包、结节和囊肿中的至少一种。
[0036]第二方面,本申请实施例提供一种痘痘类别的预测方法,包括:
[0037]获取待预测的痘痘图像;
[0038]将待预测的痘痘图像输入痘痘类别预测模型,得到待预测的痘痘图像对应的痘痘类别,其中,痘痘类别预测模型是基于第一方面的方法进行训练得到的。
[0039]第三方面,本申请实施例提供一种电子设备,包括:
[0040]至少一个处理器,以及
[0041]与至少一个处理器通信连接的存储器,其中,
[0042]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面的方法。
[0043]第四方面,本申请实施例提供一种非易失性计算机可读存储介质,非易失性计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于使电子设备执行如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种痘痘类别预测模型的训练方法,其特征在于,所述痘痘类别预测模型包括特征提取模块、Transformer模型模块和分类器模块,所述方法包括:获取图像数据集,其中,所述图像数据集包括多种痘痘类别的痘痘图像;组合若干个所述痘痘图像,生成若干个痘痘图像块,其中,每一所述痘痘图像块包括相同数量的痘痘图像;基于所述特征提取模块,对所述痘痘图像块进行处理,生成处理之后的痘痘图像块;基于所述Transformer模型模块,对所述处理之后的痘痘图像块进行特征提取,以得到所述处理之后的痘痘图像块对应的编码特征,其中,所述Transformer模型模块通过注意力机制对所述处理之后的痘痘图像块进行特征提取;基于所述分类器模块,对所述编码特征进行痘痘类别预测,以得到所述痘痘图像对应的痘痘类别;构建损失函数,基于所述损失函数对所述痘痘类别预测模型进行训练,直至所述损失函数收敛,其中,所述损失函数包括多类别加权交叉熵损失。2.根据权利要求1所述的方法,其特征在于,所述特征提取模块包括嵌入层,所述基于所述特征提取模块,对所述痘痘图像块进行处理,生成处理之后的痘痘图像块,包括:将所述痘痘图像块对应的向量输入到所述嵌入层,生成处理之后的痘痘图像块对应的特征向量,其中,所述特征向量的大小与所述痘痘类别的种类数量相关,所述嵌入层的网络结构为全连接层。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:生成类别块,将所述类别块与所述处理之后的痘痘图像块进行合并,得到拼接块,具体包括:生成类别块,其中,所述类别块对应一随机向量,将所述类别块对应的随机向量与所述处理之后的痘痘图像块对应的特征向量进行合并,得到拼接块对应的拼接向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述Transformer模型模块,对所述处理之后的痘痘图像块进行特征提取,以得到所述处理之后的痘痘图像块对应的编码特征,包括:基于所述Transformer模型模块,对所述拼接块进行特征提取,以得到拼接块对应的编码特征,其中,所述Transformer模型模块通过注意力机制对所述拼接块进行特征提取。5.根据权利要求4所述的方法,其特征在于,所述Transformer模型模块包括归一化层、注意力机制层以及感知机层,所述基于所述Transformer模型模块,对所述拼接块进行特征提取,以得到拼接块对应的编码特征,包括:PE

=LN(PE)PE

=Attention(PE

)+PE

PE
″′
=MLP(LN(PE

))+PE

其中,PE为所述拼接块对应的特征向量,LN为线性变换,PE

为对所述拼接块对应的特征向量进行线性变换得到的特征向量,Attention为注意力网络变换,Attention(PE

)为对特征向量PE

进行注意力网络变换得到的特征向量,PE

【专利技术属性】
技术研发人员:陈仿雄
申请(专利权)人:深圳数联天下智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1