模型训练方法和系统、数据处理方法和系统技术方案

技术编号:33361014 阅读:12 留言:0更新日期:2022-05-11 22:16
本申请公开了一种模型训练方法和系统、数据处理方法和系统。其中,该方法包括:接收模型训练请求;获取模型训练请求对应的目标数据和初始模型,其中,目标数据包含多个数据片段;对目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;利用多个训练样本对初始模型进行训练,得到处理模型;输出处理模型。本申请解决了相关技术中通过人工设计的变换模式对训练样本进行变换操作,导致训练过程容易对图像本身过拟合,导致泛化能力不佳的技术问题。泛化能力不佳的技术问题。泛化能力不佳的技术问题。

【技术实现步骤摘要】
模型训练方法和系统、数据处理方法和系统


[0001]本申请涉及数据处理领域,具体而言,涉及一种模型训练方法和系统、数据处理方法和系统。

技术介绍

[0002]在直播领域中,可以通过基于图像特征的视频搜索方法进行直播内容的搜索和推荐。随着时间的推移,积累了大量视频数据,而且其中大部分是没有标注的无监督数据。因此,可以利用图像自监督学习技术训练图像特征提取模型,并利用训练好的图像特征提取模型实现视频搜索的目的。
[0003]现有的图像自监督学习技术可以利用无监督数据,通过对单幅图像进行变换操作,生成正样本图像对,然后随机选取其他不相关图像作为负样本,通过构建三元组进行对比学习,得到通用的图像特征表达。
[0004]基于单幅图像的变换操作包括随机剪裁、随机缩放、随机翻转、颜色变换等,但是,上述变换操作都是人工设计的变换模式,实际上图像内容本质上并没有变化,因此训练过程容易对图像本身过拟合,导致实际泛化能力不佳。
[0005]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]本申请实施例提供了一种模型训练方法和系统、数据处理方法和系统,以至少解决相关技术中通过人工设计的变换模式对训练样本进行变换操作,导致训练过程容易对图像本身过拟合,导致泛化能力不佳的技术问题。
[0007]根据本申请实施例的一个方面,提供了一种模型训练方法,包括:接收模型训练请求;获取模型训练请求对应的目标数据和初始模型,其中,目标数据包含多个数据片段;对目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;利用多个训练样本对初始模型进行训练,得到处理模型;输出处理模型。
[0008]根据本申请实施例的另一方面,还提供了一种模型训练方法,包括:获取目标数据,其中,目标数据包含多个数据片段;对目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;利用多个训练样本对初始模型进行训练,得到处理模型。
[0009]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:接收第一数据;利用处理模型对第一数据进行处理,得到第一数据的第一特征向量,其中,处理模型是利用对第二数据进行处理得到的多个训练样本对初始模型进行训练得到的模型,第二数据包含多个数据片段,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;基于第一数据的第一
特征向量和多个第三数据的第二特征向量,确定多个第三数据中的目标数据;输出目标数据。
[0010]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取第一数据;利用处理模型对第一数据进行处理,得到第一数据的第一特征向量,其中,处理模型是利用对第二数据进行处理得到的多个训练样本对初始模型进行训练得到的模型,第二数据包含多个数据片段,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;基于第一数据的第一特征向量和多个第三数据的第二特征向量,确定多个第三数据中的目标数据。
[0011]根据本申请实施例的另一方面,还提供了一种模型训练方法,包括:通过调用第一接口获取模型训练请求,其中,第一接口包括:第一参数,第一参数的参数值为模型训练请求;获取模型训练请求对应的目标数据和初始模型,其中,目标数据包含多个数据片段;对目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;利用多个训练样本对初始模型进行训练,得到处理模型;通过调用第二接口输出处理模型,其中,第二接口包括:第二参数,第二参数的参数值为处理模型。
[0012]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:通过调用第一接口获取第一数据,其中,第一接口包括:第一参数,第一参数的参数值为第一数据;利用处理模型对第一数据进行处理,得到第一数据的第一特征向量,其中,处理模型是利用对第二数据进行处理得到的多个训练样本对初始模型进行训练得到的模型,第二数据包含多个数据片段,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;基于第一数据的第一特征向量和多个第三数据的第二特征向量,确定多个第三数据中的目标数据;通过调用第二接口输出目标数据,其中,第二接口包括:第二参数,第二参数的参数值为目标数据。
[0013]根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述的模型训练方法和数据处理方法。
[0014]根据本申请实施例的另一方面,还提供了一种计算机终端,包括:存储器和处理器,处理器用于运行存储器中存储的程序,其中,程序运行时执行上述的模型训练方法和数据处理方法。
[0015]根据本申请实施例的另一方面,还提供了一种模型训练系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收模型训练请求;获取模型训练请求对应的目标数据和初始模型,其中,目标数据包含多个数据片段;对目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;利用多个训练样本对初始模型进行训练,得到处理模型;输出处理模型。
[0016]根据本申请实施例的另一方面,还提供了一种数据处理系统,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:接收第一数据;利用处理模型对第一数据进行处理,得到第一数据的第一特征向量,其中,处理模型是利用对第二数据进行处理得到的多个训练样本对初始模型进行训练得到的模型,第二数据包含多个
数据片段,每个训练样本包括:第一样本、第二样本和第三样本,第一样本和第二样本位于同一个数据片段,第一样本和第三样本位于不同数据片段;基于第一数据的第一特征向量和多个第三数据的第二特征向量,确定多个第三数据中的目标数据;输出目标数据。
[0017]在本申请实施例中,在接收到模型训练请求之后,可以获取与该模型训练请求相对应的目标数据和初始模型,进一步对目标数据进行处理,得到多个训练样本,并利用多个训练样本对初始模型进行训练,实现处理模型训练的目的。容易注意到的是,训练样本中的第一样本、第二样本和第三样本均是从目标数据中抽取的数据帧,因此,第一样本和第三样本的差异来自于数据内容自然的变化,从而实现针对视频内容,充分利用视频上下文的相关性,构建训练样本并训练出来模型,相比于人工设计的图像变换操作,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,包括:接收模型训练请求;获取所述模型训练请求对应的目标数据和初始模型,其中,所述目标数据包含多个数据片段;对所述目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,所述第一样本和所述第二样本位于同一个数据片段,所述第一样本和所述第三样本位于不同数据片段;利用所述多个训练样本对所述初始模型进行训练,得到处理模型;输出所述处理模型。2.根据权利要求1所述的方法,其中,所述目标数据为视频数据,其中,对所述目标数据进行处理,得到所述多个训练样本包括:对所述视频数据进行划分,得到多个视频片段;从每个视频片段中抽取预设数量的目标视频帧;基于所述目标视频帧,确定所述多个训练样本。3.根据权利要求2所述的方法,其中,基于所述目标视频帧,确定所述多个训练样本包括:按照预设变换模式对所述目标视频帧进行处理,得到所述多个训练样本,其中,所述预设变换模式包括如下至少之一:裁剪操作、缩放操作、翻转操作、颜色变换操作。4.根据权利要求1所述的方法,其中,基于小批量随机梯度下降方法,利用所述多个训练样本对所述初始模型进行训练,得到所述处理模型。5.根据权利要求4所述的方法,其中,利用所述多个训练样本对所述初始模型进行训练包括:将所述每个训练样本输入至所述初始模型的图像编码网络中,得到所述每个训练样本的第一特征向量;将所述每个训练样本的第一特征向量输入至所述初始模型的映射头网络中,得到所述每个训练样本的第二特征向量;基于所述每个训练样本的第二特征向量,得到所述每个训练样本的损失值;在所述每个训练样本的损失值不满足训练条件的情况下,基于所述多个训练样本对所述初始模型的网络参数进行更新,直至所述每个训练样本的损失值满足所述训练条件。6.根据权利要求5所述的方法,其中,所述每个训练样本的第二特征向量包括:所述第一样本的第一向量、所述第二样本的第二向量和所述第三样本的第三向量,其中,基于所述每个训练样本的第二特征向量,得到所述每个训练样本的损失值包括:基于所述第一向量和所述第二向量,得到第一相似度;基于所述第一向量和所述第三向量,得到第二相似度;将所述第一相似度和所述第二相似度输入至预设损失函数中,得到所述每个训练样本的损失值。7.根据权利要求6所述的方法,其中,所述预设损失函数包括如下之一:三元组损失函数、对比损失函数、噪音对比估计损失函数。8.一种模型训练方法,包括:
获取目标数据,其中,所述目标数据包含多个数据片段;对所述目标数据进行处理,得到多个训练样本,其中,每个训练样本包括:第一样本、第二样本和第三样本,所述第一样本和所述第二样本位于同一个数据片段,所述第一样本和所述第三样本位于不同数据片段;利用所述多个训练样本对初始模型进行训练,得到处理模型。9.根据权利要求8所述的方法,其中,所述目标数据为视频数据,其中,对所述目标数据进行处理,得到所述多个训练样本包括:对所述视频数据进行划分,得到多个视频片段;从每个视频片段中抽取预设数量的目标视频帧;基于所述目标视频帧,确定所述多个训练样本。10.一种数据处理方法,包括:接收第一数据;利用处理模型对所述第一数据进行处理,得到所述第一数据的第一特征向量,其中,所述处理模型是利用对第二数据进行处理得到的多个训练样本对初始模型进行训练得到的模型,所述第二数据包含多个数据片段,每个训练样本包括:第一样本、第二样本和第三样本,所述第一样本和所述第二样本位于同一个数据片段,所述第一样本和所述第三样本位于不同数据片段;基于所述第一数据的第一特征向量和多个第三数据的第二特征向量,确定所述多个第三数据中的目标数据;输出所述目标数据。11.根据权利要求10所述的方法,其中,所述第一数据为第一视频数据,所述第二数据为第二视频数据,其中,利用所述处理模型对所述第一数据进行处理,得到所述第一数据的第一特征向量包括:抽取所述第一视频数据中的多个第一视频帧;利用所述处理模型中的图像编码网络对每个第一视频帧进行处理,得到所述每个第一视频帧的第三特征向量;确定所述多个第一视频帧的第三特征向量的集合为所述第一视频数据的第一特征向量。12.根据权利要求11所述的方法,其中,所述第三数据为第三视频数据,所述目标数据为目标视频数据,其中,基于所述第一数据的第一特征向量和多个第三数据的第二特征向量,确定所述多个第三数据中的目标数据包括:获取所述第一视频数据的第一特征向量与每个第三视频数据的第二特征向量的相似度,得到多个相似度;确定所述多个相似度中大于预设值的相似度对应的第三视频数据为所述目标视频数据。13.根据权利要求12所述的方法,其中,获取所述第一视频数据的第一特征向量与每个第三视频数据的第二特征向量的相似度,得到多个相似度包括:获取所述第一视频数据的第一特征向量中包含的所有特征向量的平均向量,得到第一平均向量;
获取所述每个第三视频数据的第二特征向量中包含的所有特征向量的...

【专利技术属性】
技术研发人员:利明刘宇王彬潘攀
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1