【技术实现步骤摘要】
图像处理方法、装置、电子设备及计算机可读存储介质
本申请涉及人工智能和大数据技术,尤其涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。计算机视觉技术(ComputerVision,CV)是人工智能的一个重要分支,主要研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。动作预测涉及到计算机视觉技术以及云
中的大数据技术,主要通过模型对与特定的对象(如虚拟对象)相关的图像进行处理,从而预测对象所要执行的动作。在模型的训练阶段会获取多个类别的样本,但是,不同类别的样本往往存在数量不平衡的问题,即某个类别的样本的数量会远超其他类别,这会导致训练后的模型的输出更倾向于数量最多的类别,图像处理的效果差,预测出的动作的错误率高。针对于此,相关技术尚未提供有效的解决方案。
技术实现思路
本申请实施例提供一种图像处理方法、装置、电子设备及计算机可读存储介质,能够优化图像处理的效果,提升预测出的动作的精度。本申请实施例的技术方案是这样实现的:本申请实施例提供一种图像处理方法,包括:获取包括虚拟对象的虚拟场景的多个场景图像、以及在每个所述场景图像对应时刻控制所述虚拟对象执行的动作,根据每个所述场景图像及对应的动作构建动作样本;根据所 ...
【技术保护点】
1.一种图像处理方法,其特征在于,所述方法包括:/n获取包括虚拟对象的虚拟场景的多个场景图像、以及在每个所述场景图像对应时刻控制所述虚拟对象执行的动作,根据每个所述场景图像及对应的动作构建动作样本;/n根据所述动作对多个所述动作样本进行分类,并根据与每个类别的动作样本的数量负相关的采样概率进行采样处理,得到样本集;/n对所述样本集中的多个所述场景图像进行融合处理得到图像融合结果,对所述样本集中的多个所述动作进行融合处理得到动作融合结果,根据所述图像融合结果和所述动作融合结果构建融合动作样本;/n根据所述融合动作样本训练图像处理模型,并通过训练后的所述图像处理模型预测目标动作。/n
【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:
获取包括虚拟对象的虚拟场景的多个场景图像、以及在每个所述场景图像对应时刻控制所述虚拟对象执行的动作,根据每个所述场景图像及对应的动作构建动作样本;
根据所述动作对多个所述动作样本进行分类,并根据与每个类别的动作样本的数量负相关的采样概率进行采样处理,得到样本集;
对所述样本集中的多个所述场景图像进行融合处理得到图像融合结果,对所述样本集中的多个所述动作进行融合处理得到动作融合结果,根据所述图像融合结果和所述动作融合结果构建融合动作样本;
根据所述融合动作样本训练图像处理模型,并通过训练后的所述图像处理模型预测目标动作。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对任意一个类别的动作样本,执行以下处理:
将所述动作样本的总数量除以所述虚拟场景中动作的类别数量,得到类别平均数量;
将所述类别平均数量除以所述任意一个类别的动作样本的数量,得到所述任意一个类别的动作样本的采样权重;
对所述任意一个类别的动作样本的采样权重进行归一化处理,得到所述任意一个类别的动作样本的采样概率。
3.根据权利要求2所述的方法,其特征在于,所述对所述任意一个类别的动作样本的采样权重进行归一化处理之前,还包括:
将所述任意一个类别的动作样本的采样权重与设定权重进行相加处理,得到新的采样权重;
其中,不同的所述动作样本对应的设定权重相同。
4.根据权利要求2所述的方法,其特征在于,所述对所述任意一个类别的动作样本的采样权重进行归一化处理,得到所述任意一个类别的动作样本的采样概率,包括:
将多个所述动作样本的采样权重的和,作为总采样权重;
将所述任意一个类别的动作样本的采样权重除以所述总采样权重,得到所述任意一个类别的动作样本的采样概率。
5.根据权利要求1至4任一项所述的方法,其特征在于,
所述对所述样本集中的多个所述场景图像进行融合处理得到图像融合结果,包括:
通过所述图像处理模型对所述样本集中的所述场景图像进行特征提取处理,得到图像特征;
根据所述样本集中的多个所述场景图像分别对应的融合权重,对所述样本集中的多个所述场景图像分别对应的图像特征进行加权处理,得到图像融合结果;
所述对所述样本集中的多个所述动作进行融合处理得到动作融合结果,包括:
根据所述样本集中的多个所述场景图像分别对应的融合权重,对所述样本集中的多个所述动作的向量进行加权处理,得到动作融合结果。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
构建维度与所述虚拟场景中动作的类别数量相同的初始向量;
将所述初始向量中与任意一个动作的类别对应的数值更新为设定数值,并将所述初始向量中的其他数值更新为零,得到所述任意一个动作的向量;
其中,所述设定数值大于零;
所述通过训练后的所述图像处理模型预测目标动作,包括:
通过训练后的所述图像处理模型进行预测处理,得到目标向量;
将所述目标向量中最大的数值对应的动作,作为目标动作。
7.根据权利要求1至4任一项所述的方法,其特征在于,
用于预测所述目标动作的所述图像处理模型的数量包括多个;不同所述图像处理模型的模型结构不同;
所述根据与每个类别的动作样本的数量负相关的采样概率进行采样处理,得到样本集之后,还包括:
将多个所述样本集划分为训练样本集和测试样本集;其中,所述训练样本集用于训练每个所述图像处理模型;
所述通过训练后的所述图像处理模型预...
【专利技术属性】
技术研发人员:黄超,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。