【技术实现步骤摘要】
模型训练方法、特征提取方法及装置
[0001]本申请涉及机器学习
,尤其涉及一种模型训练方法
、
特征提取方法及装置
。
技术介绍
[0002]目前,在机器学习领域中,有监督训练是一种常用的训练方法,在图像处理
、
语言模型等领域广泛使用
。
[0003]但是,许多场景和领域中的有标签数据较为稀少,而标注数据的成本较高,难以训练出有效深度学习算法模型
。
[0004]例如,对于机器视觉学习领域,往往难以获取到有标签的图像,对图像进行人工标注的成本也较高,难以训练出有效的机器视觉模型
。
技术实现思路
[0005]有鉴于此,本申请提供一种模型训练方法
、
特征提取方法及装置,以解决上述问题
。
[0006]根据本申请实施例的第一方面,提供一种模型训练方法,所述方法包括:
[0007]从所述视频流中提取至少两个视频帧,若提取的至少两个视频帧满足设定的帧关系条件,则将提取的所述至少两个视频帧确定为正样本图片;若提取的至少两个视频帧不满足设定的帧关系条件,则将提取的所述至少两个视频帧确定为负样本图片;
[0008]将所述正样本图片和
/
或所述负样本图片输入至机器视觉学习模型,以由所述机器视觉学习模型中的编码器对输入的正样本图片和
/
或负样本图片进行编码得到特征编码并输出给所述机器视觉学习模型中的帧间关系预测器,以由所述帧间关系预测器根据输入的 ...
【技术保护点】
【技术特征摘要】
1.
一种模型训练方法,其特征在于,所述方法包括:从视频流中提取至少两个视频帧,若提取的至少两个视频帧满足设定的帧关系条件,则将提取的所述至少两个视频帧确定为正样本图片;若提取的至少两个视频帧不满足设定的帧关系条件,则将提取的所述至少两个视频帧确定为负样本图片;将所述正样本图片和
/
或所述负样本图片输入至机器视觉学习模型,以由所述机器视觉学习模型中的编码器对输入的正样本图片和
/
或负样本图片进行编码得到特征编码并输出给所述机器视觉学习模型中的帧间关系预测器,以由所述帧间关系预测器根据输入的特征编码预测出所述正样本图片和
/
或负样本图片中至少两个视频帧之间的帧关系;根据所述正样本图片和
/
或所述负样本图片中至少两个视频帧之间的帧关系
、
所述帧间关系预测器预测出的至少两个视频帧之间的帧关系对所述机器视觉学习模型的模型参数进行调整得到第二目标模型,所述第二目标模型用于预测两个以上视频帧之间的帧关系
。2.
根据权利要求1所述的方法,其特征在于,所述根据正样本图片和
/
或负样本图片中至少两个视频帧之间的帧关系
、
所述帧间关系预测器预测出的至少两个视频帧之间的帧关系对所述机器视觉学习模型的模型参数进行调整得到第二目标模型,包括:根据正样本图片和
/
或负样本图片中至少两个视频帧之间的帧关系
、
所述帧间关系预测器预测出的至少两个视频帧之间的帧关系确定第二损失函数;根据所述第二损失函数对所述机器视觉学习模型的模型参数进行调整,并检查所述第二损失函数是否满足设定的训练停止条件;如果是,确定调整后的机器视觉学习模型为所述第二目标模型,如果否,获取正样本图片和
/
或负样本图片并返回将正样本图片和
/
或负样本图片输入至所述机器视觉学习模型的步骤
。3.
根据权利要求2所述的方法,其特征在于,所述设定的训练停止条件包括:本次训练过程中确定出的损失函数的值与上一次训练过程中确定出的损失函数的值之间的差值不超过设定阈值
。4.
根据权利要求1所述的方法,其特征在于,所述设定的帧关系条件包括:至少两个视频帧在视频流中的排列顺序连续
。5.
根据权利要求1所述的方法,其特征在于,所述第二损失函数用于衡量机器视觉学习模型中帧间关系预测器的帧关系预测性能
。6.
一种模型训练方法,其特征在于,所述方法包括:从视频流中提取至少两个视频帧,并按照设定的图片遮挡方式对提取的每一视频帧中设定的部分内容进行遮挡得到训练图片;将所述训练图片输入至机器视觉学习模型,以由机器视觉学习模型中的编码器对输入的训练图片中每一视频帧进行编码得到特征编码并输出给机器视觉学习模型中的解码器和帧间关系预测器,以由解码器根据输入的每一视频帧的特征编码重构出每一视频帧中被遮挡的内容,并由帧间关系预测器根据输入的每一视频帧的特征编码预测出训练图片中各视频帧之间的帧关系预测结果;根据帧关系预测结果
、
...
【专利技术属性】
技术研发人员:祝勇义,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。