图像处理方法及装置、交互控制方法及装置制造方法及图纸

技术编号:26835678 阅读:8 留言:0更新日期:2020-12-25 12:46
本申请实施例公开了一种基于人工智能的图像处理方法及装置、交互控制方法及装置,在该方法中,首先使用包括样本图像内物体边缘的损失目标的训练目标对神经网络进行训练,然后网络设备调用训练后的神经网络处理目标图像生成所述目标图像的深度图像;由于本申请在进行神经网络训练时,独创性的引入了样本图像内物体的边缘损失目标,训练后的神经网络在输出深度图像时,会考虑目标图像内物体边缘损失,这样就可以最大程度的保证不会将同一物体错误的分割为几个部分,也不会将不同物体划分为一个整体,深度图像准确性更高,游戏AI基于这些深度图像就可以反馈更准确的互动交互参数,用户体验更好。

【技术实现步骤摘要】
图像处理方法及装置、交互控制方法及装置
本申请涉及图像处理领域,具体涉及一种基于人工智能的图像处理方法及装置、交互控制方法及装置。
技术介绍
随着人工智能技术的发展,基于人工智能的交互控制技术,例如游戏AI基于客户端实时的对战游戏画面对应的深度图像向客户端反馈对应的交互动作参数(控制角色往离角色最远的位置移动)以控制角色移动等,使得游戏参与者等用户可以解放双手,增强用户体验。深度图像的准确性直接影响到游戏AI反馈交互动作参数的准确性,当前深度神经网络是基于语义分割来实现根据对照画面确定深度图像的,而语义分割往往会根据颜色的差异,将一个包括多个颜色的物体切分为几个独立的部分,或者将颜色相同或者相近、且临近的不同物体划分一个物体,从而导致深度图像的准确性较差,进而导致游戏AI反馈交互动作参数的准确性较低。即当前图像处理技术至少存在由于神经网络仅关注色彩导致深度图像不准确的技术问题。申请内容本申请实施例提供一种图像处理方法及装置、交互控制方法及装置,以提高神经网络处理得到的深度图像的准确性。为解决上述技术问题,本申请实施例提供以下技术方案:本申请实施例提供一种图像处理方法,其包括:获取训练样本以及训练目标,所述训练样本包括样本图像以及所述样本图像对应的实际深度图像,所述训练目标包括样本图像内物体的边缘损失目标;构建神经网络;使用所述训练样本训练所述神经网络,直至所述神经网络处理所述样本图像得到的估计深度图像与所述实际深度图像满足所述训练目标,得到训练后的神经网络;获取目标图像;使用所述训练后的神经网络处理所述目标图像,生成所述目标图像的深度图像。本申请实施例提供一种基于人工智能的交互控制方法,其包括:获取终端展示给用户的交互画面,确定为目标图像;通过上述实施例提供的图像处理方法,得到所述目标图像的深度图像;根据所述深度图像以及预设的交互控制策略,向所述终端返回所述目标图像对应的交互动作参数。本申请实施例提供一种图像处理装置,其包括:数据获取模块,用于获取训练样本以及训练目标,所述训练样本包括样本图像以及所述样本图像对应的实际深度图像,所述训练目标包括样本图像内物体边缘的损失目标;构建模块,用于构建神经网络;训练模块,用于使用所述训练样本训练所述神经网络,直至所述神经网络处理所述样本图像得到的估计深度图像与所述实际深度图像满足所述训练目标,得到训练后的神经网络;第一获取模块,用于获取目标图像;第一处理模块,用于使用所述训练后的神经网络处理所述目标图像,生成所述目标图像的深度图像。本申请实施例提供一种基于人工智能的交互控制装置,其包括:第二获取模块,用于获取终端展示给用户的交互画面,确定为目标图像;第二处理模块,用于通过上述实施例提供的图像处理方法,得到所述目标图像的深度图像;反馈模块,用于根据所述深度图像以及预设的交互控制策略,向所述终端返回所述目标图像对应的交互动作参数。本申请实施例提供一种计算机设备,其包括处理器和存储器,存储器存储有多条指令,指令适于处理器进行加载,以执行上述方法中的步骤。本申请实施例提供一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行上述方法中的步骤。本申请实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方法中的步骤。本申请实施例提供了一种基于人工智能的图像处理方法及装置、交互控制方法及装置,在该方法中,首先基于包括样本图像内物体边缘的损失目标的训练目标对神经网络进行训练,然后网络设备获取目标图像,调用训练后的神经网络,使用所述训练后的神经网络处理目标图像生成所述目标图像的深度图像;由于本申请在进行神经网络训练时,独创性的引入了样本图像内物体边缘的损失目标,这样训练后的神经网络在输出深度图像时,会考虑目标图像内物体边缘,可以最大程度的保证不会将同一物体错误的分割为几个部分,也不会将不同物体划分为一个整体,深度图像内不同物体之间的差异度更大,准确性更高,那么游戏AI基于这些深度图像就可以反馈更准确的互动交互参数,用户体验更好。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的交互系统的组网示意图。图2是本申请实施例提供的图像处理方法的流程示意图。图3是本申请实施例提供的交互控制方法的第一种流程示意图。图4是本申请实施例提供的交互控制方法的第二种流程示意图。图5是本申请实施例提供的图像处理装置的结构示意图。图6是本申请实施例提供的计算机设备的结构示意图。图7a至图7b是本申请实施例提供的神经网络及训练示意图。图8a至图8b是本申请实施例提供的深度图像和梯度图像的示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例涉及的图像处理方法及装置、交互控制方法及装置涉及人工智能领域,具体的可以通过云
中的人工智能云服务实现。人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。在本申请中,人工智能技术主要用于处理图像得到图像对应的深度图像,并根据深度图像生成反馈控制结果,以实现游戏等自动化控制。机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请中,机器学习主要是指深度学习(DeepLearning)下属的深度神经网络(Deepneuralnetwork,DNN),通过构建像素本文档来自技高网
...

【技术保护点】
1.一种图像处理方法,其特征在于,包括:/n获取训练样本以及训练目标,所述训练样本包括样本图像以及所述样本图像对应的实际深度图像,所述训练目标包括样本图像内物体边缘的损失目标;/n构建神经网络;/n使用所述训练样本训练所述神经网络,直至所述神经网络处理所述样本图像得到的估计深度图像与所述实际深度图像满足所述训练目标,得到训练后的神经网络;/n获取目标图像;/n使用所述训练后的神经网络处理所述目标图像,生成所述目标图像的深度图像。/n

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:
获取训练样本以及训练目标,所述训练样本包括样本图像以及所述样本图像对应的实际深度图像,所述训练目标包括样本图像内物体边缘的损失目标;
构建神经网络;
使用所述训练样本训练所述神经网络,直至所述神经网络处理所述样本图像得到的估计深度图像与所述实际深度图像满足所述训练目标,得到训练后的神经网络;
获取目标图像;
使用所述训练后的神经网络处理所述目标图像,生成所述目标图像的深度图像。


2.根据权利要求1所述的图像处理方法,其特征在于,所述样本图像包括虚拟物体画面,所述获取训练样本的步骤,包括:
通过提供所述虚拟物体画面的应用的数据接口获取所述虚拟物体画面作为所述样本图像;
通过所述数据接口获取所述虚拟物体画面对应的深度图像作为所述样本图像的实际深度图像。


3.根据权利要求2所述的图像处理方法,其特征在于,所述样本图像包括真实物体画面,所述获取训练样本的步骤,包括:
通过摄像设备获取所述真实物体画面作为所述样本图像;
获取各真实物体与所述摄像设备之间的距离;
根据所述各真实物体与所述摄像设备之间的实际距离,生成所述样本图像的实际深度图像。


4.根据权利要求1所述的图像处理方法,其特征在于,所述训练所述神经网络的步骤,包括:
根据所述训练目标,构建目标函数;
使用所述初始神经网络得到所述样本图像的估计深度图像;
根据所述目标函数,得到所述估计深度图像与所述实际深度图像之间的目标函数值;
根据所述训练目标中的训练结束条件、以及所述目标函数值,对所述初始神经网络进行迭代优化,直至训练结束得到所述训练后的神经网络。


5.根据权利要求4所述的图像处理方法,其特征在于,所述训练目标包括图像像素损失目标和样本图像内物体的边缘损失目标,所述目标函数包括像素损失函数和边缘损失函数,所述根据所述目标函数,得到所述估计深度图像与所述实际深度图像之间的目标函数值的步骤,包括:
根据所述估计深度图像与所述实际深度图像的各像素的第一像素值,得到所述目标函数值的像素损失值;
根据所述估计深度图像对应的估计梯度图像和所述实际深度图像对应的实际梯度图像的各像素对应的第二像素值,得到所述目标函数值的边缘损失值。


6.根据权利要求5所述的图像处理方法,其特征在于,所述根据所述估计深度图像对应的估计梯度图像和所述实际深度图像对应的实际梯度图像的各像素的第二像素值,得到所述目标函数值的边缘损失值的步骤,包括:
根据梯度图像生成方式,得到所述估计深度图像对应的估计梯度图像和所述实际深度图像对应的实际梯度图像;
根据所述边缘损失函数,基于所述估计深度图像对应的估计梯度图像和所述实际深度图像对应的实际梯度图像的各像素的第二像素值,得到所述边缘损失值。


7.根据权利要求6所述的图像处理方法,其特征在于,所述梯度图像生成方式包括:
获取深度图像中各像素的第一像素值;
根据所述各像素的像素值,得到在预设方向上各像素与相邻像...

【专利技术属性】
技术研发人员:黄超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1