基于人工智能的模型训练方法和相关装置制造方法及图纸

技术编号:24093892 阅读:17 留言:0更新日期:2020-05-09 09:21
本申请实施例公开了一种基于人工智能的模型训练方法和相关装置,通过构造正负标签对,并对由正负标签对求得的第一损失和第二损失对输入求偏导,得到分别反映目标对象和背景内容的内生响应图,然后利用L2范数损失来度量两者的距离。通过最大化目标对象和背景内容对应的内生响应图的空间距离,得到背景扰动损失。在原始损失的基础上,增加背景扰动损失,对网络模型的参数进行更新,增强了网络模型对目标对象和背景内容的分辨能力,提高了网络性能。

Model training method and related devices based on Artificial Intelligence

【技术实现步骤摘要】
基于人工智能的模型训练方法和相关装置
本申请涉及人工智能领域,特别是涉及一种基于人工智能的模型训练方法和相关装置。
技术介绍
目标跟踪是一种神经网络模型应用的典型场景,通过神经网络模型可以实现识别视频帧中的目标,并在视频中对该目标进行跟踪。一种目标跟踪场景是无预定义目标的情况,例如安防中对可疑危险目标的跟踪,广告植入中对候选广告位的跟踪等。在这种目标跟踪场景中,神经网络模型在跟踪一个目标之前难以获知该目标的一切信息,由此,在跟踪过程中难以准确区分视频中跟踪的目标与背景干扰,尤其当干扰物与目标的特征相似时会造成严重的跟踪漂移。
技术实现思路
为了解决上述技术问题,本申请提供了一种基于人工智能的模型训练方法和相关装置,能够提高网络模型对图像中待识别对象和背景内容的分辨能力。本申请实施例公开了如下技术方案:一方面,本申请实施例提供了一种基于人工智能的模型训练方法,所述方法由处理设备执行,所述方法包括:根据标识目标对象的目标图像和包括所述目标对象的训练图像训练网络模型,得到所述训练图像对应的识别结果,所述识别结果用于标识所述训练图像中所述目标对象的预测位置,所述训练图像具有对应的正标签和负标签,所述正标签用于标识所述训练图像中所述目标对象的实际位置,所述负标签用于标识所述训练图像中背景内容的实际位置;确定所述识别结果相对于所述正标签的第一损失,以及相对于所述负标签的第二损失;根据所述第一损失和所述第二损失确定背景扰动损失,所述背景扰动损失用于标识所述背景内容对识别所述目标对象的影响;根据所述背景扰动损失对所述网络模型的参数进行更新。另一方面,本申请实施例提供了一种基于人工智能的模型训练装置,所述装置包括训练单元、确定单元和更新单元:所述训练单元,用于根据标识目标对象的目标图像和包括所述目标对象的训练图像训练网络模型,得到所述训练图像对应的识别结果,所述识别结果用于标识所述训练图像中所述目标对象的预测位置,所述训练图像具有对应的正标签和负标签,所述正标签用于标识所述训练图像中所述目标对象的实际位置,所述负标签用于标识所述训练图像中背景内容的实际位置;所述确定单元,用于确定所述识别结果相对于所述正标签的第一损失,以及相对于所述负标签的第二损失;所述确定单元,还用于根据所述第一损失和所述第二损失确定背景扰动损失,所述背景扰动损失用于标识所述背景内容对识别所述目标对象的影响;所述更新单元,用于根据所述背景扰动损失对所述网络模型的参数进行更新。另一方面,本申请实施例提供了一种基于人工智能的模型训练设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。由上述技术方案可以看出,在针对用于目标跟踪的网络模型的训练过程中,采用目标图像和训练图像进行训练,由于目标图像标识了需被跟踪的目标对象,训练图像中包含有目标对象,故网络模型可以得到训练图像对应的识别结果,该识别结果体现训练图像中目标对象的预测位置。训练图像被设置有标识训练图像中目标对象的实际位置的正标签和标识所述训练图像中背景内容的实际位置的负标签,可以根据前述识别结果确定出相对于正标签的第一损失和相对于负标签的第二损失。根据第一损失和第二损失确定背景扰动损失,以标识出在训练图像中,背景内容对识别所述目标对象带来的影响,通过使用背景扰动损失对该网络模型的参数进行更新,使得网络模型在对图像中对象识别时,降低图像中背景内容对识别所带来的负面影响,增强网络模型对图像中待识别对象和背景内容的分辨能力,提高网络模型的性能。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种基于人工智能的模型训练方法的应用场景示意图;图2为本申请实施例提供的一种基于人工智能的模型训练方法的流程示意图;图3为本申请实施例提供的另一种基于人工智能的模型训练方法的应用场景示意图;图4为本申请实施例提供的一种确定贡献信息的方法示意图;图5为本申请实施例提供的一种基于人工智能的模型训练装置的结构示意图;图6为本申请实施例提供的服务器的结构示意图;图7为本申请实施例提供的终端设备的结构示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。为了提高网络模型的性能,本申请实施例提供了一种基于人工智能的模型训练方法和相关装置,在该方法中,通过构建正负标签对,确定出背景扰动损失,从而利用该背景扰动损失对网络模型训练中的参数进行更新,增强了网络模型对图像中待识别对象的分辨能力,从而提高了网络模型的性能。本申请实施例提供的模型训练方法是基于人工智能实现的,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。在本申请实施例中,主要涉及的人工智能软件技术包括上述计算机视觉技术、机器学习/深度学习等方向。例如可以涉及计算机视觉(ComputerVision)中的图像处理(ImageProcessing)、图像语义理解(ImageSemanticUnderstanding,ISU)、视频处理(videoprocessing)、视频语义理解(videosemanticunderstanding,VSU)、人脸识别(facerecognition)等。例如可以涉及机器学习(Machinelearning,ML)中的深度学习(DeepLearning),包括各类人工神经网络(ArtificialNeuralNetwork,ANN)。为了便于理解本申请的技术方案,下面结合实际应用场景对本申请实施例提供的基于人工智能的模型训练方法进行介绍。本文档来自技高网...

【技术保护点】
1.一种基于人工智能的模型训练方法,其特征在于,所述方法由处理设备执行,所述方法包括:/n根据标识目标对象的目标图像和包括所述目标对象的训练图像训练网络模型,得到所述训练图像对应的识别结果,所述识别结果用于标识所述训练图像中所述目标对象的预测位置,所述训练图像具有对应的正标签和负标签,所述正标签用于标识所述训练图像中所述目标对象的实际位置,所述负标签用于标识所述训练图像中背景内容的实际位置;/n确定所述识别结果相对于所述正标签的第一损失,以及相对于所述负标签的第二损失;/n根据所述第一损失和所述第二损失确定背景扰动损失,所述背景扰动损失用于标识所述背景内容对识别所述目标对象的影响;/n根据所述背景扰动损失对所述网络模型的参数进行更新。/n

【技术特征摘要】
1.一种基于人工智能的模型训练方法,其特征在于,所述方法由处理设备执行,所述方法包括:
根据标识目标对象的目标图像和包括所述目标对象的训练图像训练网络模型,得到所述训练图像对应的识别结果,所述识别结果用于标识所述训练图像中所述目标对象的预测位置,所述训练图像具有对应的正标签和负标签,所述正标签用于标识所述训练图像中所述目标对象的实际位置,所述负标签用于标识所述训练图像中背景内容的实际位置;
确定所述识别结果相对于所述正标签的第一损失,以及相对于所述负标签的第二损失;
根据所述第一损失和所述第二损失确定背景扰动损失,所述背景扰动损失用于标识所述背景内容对识别所述目标对象的影响;
根据所述背景扰动损失对所述网络模型的参数进行更新。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一损失和所述第二损失确定背景扰动损失,包括:
根据所述第一损失确定第一贡献信息,以及根据所述第二损失确定第二贡献信息;所述第一贡献信息用于标识所述训练图像中特征点对预测所述目标对象所处位置的贡献程度,所述第二贡献信息用于标识所述训练图像中特征点对预测所述背景内容所处位置的贡献程度;
根据所述第一贡献信息和所述第二贡献信息之间的差异信息,确定所述背景扰动损失。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第一损失确定第一贡献信息,包括:
通过所述第一损失在所述网络模型中进行反向传播,通过中间层的输出确定所述第一贡献信息;
所述根据所述第二损失确定第二贡献信息,包括:
通过所述第二损失在所述网络模型中进行反向传播,通过中间层的输出确定所述第二贡献信息。


4.根据权利要求2所述的方法,其特征在于,所述根据所述第一贡献信息和所述第二贡献信息之间的差异信息,确定所述背景扰动损失,包括:
计算所述第一贡献信息和所述第二贡献信息间的特征距离;
将所述特征距离作为所述差异信息确定所述背景扰动损失。


5.根据权利要求1所述的方法,其特征在于,所述根据所述背景扰动损失对所述网络模型的参数进行更新,包括:
根据背景扰动损失和原始损失确定综合损失;
通过综合损失对所述网络模型的参数进行更新。


6.根据权利要求1所述的方法,其特征在于,所述网络模型为孪生网络模型。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过训练后的所述网络模型对待处理视频中的视频帧进行对象的跟踪识别。


8.一种基于人工智能的模型训练装置,其特征在于,所述装置包...

【专利技术属性】
技术研发人员:宋奕兵刘威
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1