图像处理、模型训练方法、装置、设备、存储介质及程序制造方法及图纸

技术编号：33391761 阅读：14 留言：0更新日期：2022-05-11 23:09

本公开提供了图像处理、模型训练方法、装置、设备、存储介质及程序，涉及人工智能领域，尤其涉及计算机视觉和深度学习技术领域。具体实现方案为：获取待处理的第一图像，对第一图像进行特征提取，得到第一图像特征，根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；对所述M个第二图像特征进行分类处理，得到所述第一图像的类别。上述过程，一方面提高了图像分类结果的准确性，另一方面提高了分类效率。高了分类效率。高了分类效率。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理、模型训练方法、装置、设备、存储介质及程序

[0001]本公开涉及人工智能领域，具体涉及计算机视觉和深度学习技术，尤其涉及一种图像处理、模型训练方法、装置、设备、存储介质及程序。

技术介绍

[0002]目前，图像和视频等多媒体数据在人们生活中得到广泛应用。越来越多的用户通过图像和视频等多媒体数据来表达和传递信息。
[0003]在很多应用场景中，需要对图像或者视频进行分类。例如，一些场景中，需要识别图像是否为色情图像。另一些场景中，需要识别图像是否为伪造图像。还有一些场景中，需要将图像分类为人物图像、风景图像、动物图像等。以识别色情图像的场景为例，在用户向多媒体平台发布图像时，由审核人员对待发布的图像进行人工审核，确定是否含有色情内容，从而确定图像的类别。
[0004]然而，上述方式中需要人工对图像进行分类，一方面效率较低，另一方面，图像分类结果容易受到人为因素影响，准确性无法保证。

技术实现思路

[0005]本公开提供了一种图像处理、模型训练方法、装置、设备、存储介质及程序。
[0006]根据本公开的第一方面，提供了一种图像处理方法，包括：
[0007]获取待处理的第一图像；
[0008]对所述第一图像进行特征提取，得到第一图像特征；
[0009]根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；
[0010]对所述M个第二图像特征进行分类处理，得到所述第一图像的类别。
>[0011]根据本公开的第二方面，提供了一种模型训练方法，包括：
[0012]获取第一样本图像和所述第一样本图像对应的标记类别；
[0013]通过预设模型对所述第一样本图像进行特征提取，得到第一图像特征；
[0014]通过所述预设模型根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；
[0015]通过所述预设模型对所述M个第二图像特征进行分类处理，得到所述第一样本图像的预测类别；
[0016]根据所述标记类别和所述预测类别，更新所述预设模型的模型参数。
[0017]根据本公开的第三方面，提供了一种图像处理装置，包括：
[0018]获取模块，用于获取待处理的第一图像；
[0019]特征提取模块，用于对所述第一图像进行特征提取，得到第一图像特征；
[0020]特征增强模块，用于根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；
[0021]分类模块，用于对所述M个第二图像特征进行分类处理，得到所述第一图像的类别。
[0022]根据本公开的第四方面，提供了一种模型训练装置，包括：
[0023]获取模块，用于获取第一样本图像和所述第一样本图像对应的标记类别；
[0024]特征提取模块，用于通过预设模型对所述第一样本图像进行特征提取，得到第一图像特征；
[0025]特征增强模块，用于通过所述预设模型根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；
[0026]分类模块，用于通过所述预设模型对所述M个第二图像特征进行分类处理，得到所述第一样本图像的预测类别；
[0027]更新模块，用于根据所述标记类别和所述预测类别，更新所述预设模型的模型参数。
[0028]根据本公开的第五方面，提供了一种电子设备，包括：
[0029]至少一个处理器；以及
[0030]与所述至少一个处理器通信连接的存储器；其中，
[0031]所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法，或者，执行第二方面所述的方法。
[0032]根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据第一方面所述的方法，或者，第二方面所述的方法。
[0033]根据本公开的第七方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法，或者，执行第二方面所述的方法。
[0034]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0035]附图用于更好地理解本方案，不构成对本公开的限定。其中：
[0036]图1为本公开实施例提供的一种系统架构的示意图；
[0037]图2为本公开实施例提供的一种图像处理方法的流程示意图；
[0038]图3为本公开实施例提供的一种预设模型的结构示意图；
[0039]图4为本公开实施例提供的一种特征提取网络及其处理过程的示意图；
[0040]图5为本公开实施例提供的一种特征增强网络及其处理过程的示意图；
[0041]图6为本公开实施例提供的另一种图像处理方法的流程示意图；
[0042]图7为本公开实施例提供的一种分类网络及其处理过程的示意图；
[0043]图8为本公开实施例提供的一种模型训练方法的流程示意图；
[0044]图9为本公开实施例提供的一种图像处理装置的结构示意图；
[0045]图10为本公开实施例提供的一种模型训练装置的结构示意图；
[0046]图11为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0047]以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0048]本公开提供一种图像处理、模型训练方法、装置、设备、存储介质及程序，应用于人工智能领域中的计算机视觉和深度学习技术，可应用于图像分类场景，以提高分类效率以及分类结果的准确性。
[0049]需要说明的是，本公开提供的技术方案可应用于任何需要对图像进行分类的场景。例如，识别图像是否为色情图像的场景、识别图像是否为伪造图像的场景、识别图像是否为人物图像的场景等。本公开对此不作限定。后续涉及举例时，以色情图像的识别场景为例进行说明。
[0050]一些相关技术中，在对色情图像进行识别时，可以利用图像处理算法对图像中的关键区域(例如人体皮肤裸露区域)进行特征提取，进而，利用事先确定的分类策略对提取的特征进行分类，确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，包括：获取待处理的第一图像；对所述第一图像进行特征提取，得到第一图像特征；根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；对所述M个第二图像特征进行分类处理，得到所述第一图像的类别。2.根据权利要求1所述的方法，其中，根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，包括：根据每一特征增强方式，在所述第一图像特征中确定第一子图像特征和第二子图像特征；根据每一特征增强方式，对所述第一子图像特征进行处理，得到目标增强参数；根据所述目标增强参数对所述第二子图像特征进行特征增强处理，得到每一特征增强方式对应的所述第二图像特征。3.根据权利要求2所述的方法，其中，根据每一特征增强方式，对所述第一子图像特征进行处理，得到目标增强参数，包括：在所述第一子图像特征中确定第三子图像特征和第四子图像特征；根据所述特征增强方式对应的位置编码参数，对所述第三子图像特征进行位置编码处理，得到位置矩阵；对所述第三子图像特征和所述第四子图像特征进行预设运算，得到权重系数矩阵；根据所述位置矩阵和所述权重系数矩阵，确定所述目标增强参数。4.根据权利要求3所述的方法，其中，对所述第三子图像特征和所述第四子图像特征进行预设运算，得到权重系数矩阵，包括：对所述第三子图像特征和所述第四子图像特征进行相乘处理，得到中间融合结果；利用激活函数对所述中间融合结果进行处理，得到所述权重系数矩阵。5.根据权利要求2至4任一项所述的方法，其中，所述第一图像特征包括K1个通道对应的通道特征；根据每一特征增强方式，在所述第一图像特征中确定第一子图像特征和第二子图像特征，包括：根据所述特征增强方式对应的卷积参数对所述第一图像特征进行卷积处理，得到第三图像特征，所述第三图像特征中包括K2个通道对应的通道特征，K2＜K1；对所述第三图像特征进行通道分解处理，得到所述第一子图像特征和所述第二子图像特征。6.根据权利要求2至5任一项所述的方法，其中，根据所述目标增强参数对所述第二子图像特征进行特征增强处理，得到每一特征增强方式对应的所述第二图像特征，包括：对所述目标增强参数和所述第二子图像特征进行相乘处理，得到增强图像特征；对所述增强图像特征进行卷积处理和池化处理，得到所述第二图像特征。7.根据权利要求1至6任一项所述的方法，其中，对所述第一图像进行特征提取，得到第一图像特征，包括：对所述第一图像进行卷积处理，得到第1卷积图像，所述第1卷积图像中包括N1个通道；对第i卷积图像进行通道扩充处理，得到第i+1卷积图像；所述i依次取1、2、
…
、N，所述
第i+1卷积图像包括N
i+1
个通道，N
i+1
＞N
i
；根据所述第N+1卷积图像确定所述第一图像特征。8.根据权利要求1至7任一项所述的方法，其中，对所述M个第二图像特征进行分类处理，得到所述第一图像的类别，包括：对所述M个第二图像特征进行融合处理，得到融合图像特征；对所述融合图像特征进行分类处理，得到所述第一图像为预设类别的概率；若所述概率大于或者等于预设阈值，则确定所述第一图像的类别为所述预设类别；若所述概率小于预设概率，则确定所述第一图像的类别为非预设类别。9.根据权利要求1至8任一项所述的方法，其中，对所述第一图像进行特征提取，得到第一图像特征，包括：通过预设模型对所述第一图像进行特征提取，得到第一图像特征；根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，包括：通过所述预设模型根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征；对所述M个第二图像特征进行分类处理，得到所述第一图像的类别，包括：通过所述预设模型对所述M个第二图像特征进行分类处理，得到所述第一图像的类别。10.根据权利要求1至9任一项所述的方法，对所述M个第二图像特征进行分类处理，得到所述第一图像的类别之后，还包括：显示所述第一图像的类别；或者，向预设设备发送所述第一图像的类别。11.一种模型训练方法，包括：获取第一样本图像和所述第一样本图像对应的标记类别；通过预设模型对所述第一样本图像进行特征提取，得到第一图像特征；通过所述预设模型根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；通过所述预设模型对所述M个第二图像特征进行分类处理，得到所述第一样本图像的预测类别；根据所述标记类别和所述预测类别，更新所述预设模型的模型参数。12.根据权利要求11所述的方法，其中，根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，包括：根据每一特征增强方式，在所述第一图像特征中确定第一子图像特征和第二子图像特征；根据每一特征增强方式，对所述第一子图像特征进行处理，得到目标增强参数；根据所述目标增强参数对所述第二子图像特征进行特征增强处理，得到每一特征增强方式对应的所述第二图像特征。13.根据权利要求12所述的方法，其中，根据每一特征增强方式，对所述第一子图像特征进行处理，得到目标增强参数，包括：在所述第一子图像特征中确定第三子图像特征和第四子图像特征；
根据所述特征增强方式对应的位置编码参数，对所述第三子图像特征进行位置编码处理，得到位置矩阵；对所述第三子图像特征和所述第四子图像特征进行预设运算，得到权重系数矩阵；根据所述位置矩阵和所述权重系数矩阵，确定所述目标增强参数。14.根据权利要求13所述的方法，其中，对所述第三子图像特征和所述第四子图像特征进行预设运算，得到权重系数矩阵，包括：对所述第三子图像特征和所述第四子图像特征进行相乘处理，得到中间融合结果；利用激活函数对所述中间融合结果进行处理，得到所述权重系数矩阵。15.根据权利要求12至14任一项所述的方法，其中，所述第一图像特征包括K1个通道对应的通道特征；根据每一特征增强方式，在所述第一图像特征中确定第一子图像特征和第二子图像特征，包括：根据所述特征增强方式对应的卷积参数对所述第一图像特征进行卷积处理，得到第三图像特征，所述第三图像特征中包括K2个通道对应的通道特征，K2＜K1；对所述第三图像特征进行通道分解处理，得到所述第一子图像特征和所述第二子图像特征。16.一种图像处理装置，包括：获取模块，用于获取待处理的第一图像；特征提取模块，用于对所述第一图像进行特征提取，得到第一图像特征；特征增强模块，用于根据M种特征增强方式，对所述第一图像特征进行M次特征增强处理，得到M个第二图像特征，所述M为大于或等于1的整数；分类模...

【专利技术属性】
技术研发人员：王昊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人