样本数据的生成方法以及装置制造方法及图纸

技术编号:25551429 阅读:44 留言:0更新日期:2020-09-08 18:50
本发明专利技术公开了一种样本数据的生成方法以及装置,该方法包括:获取待处理样本数据;将待处理样本数据输入至预先训练好的特征提取模型中,得到与待处理样本数据对应的目标特征向量;将与所述当前状态对应的待处理样本数据以及所述目标特征向量输入至预先训练得到的一致性评估函数中,得到与当前状态相对应的当前动作;基于当前动作,确定与所述待处理样本数据对应的当前样本数据;当所述当前动作与前一时刻对应的动作满足预设终止条件时,将所述当前样本数据作为目标样本数据。本发明专利技术实施例的技术方案,通过对待处理样本数据进行处理得到目标样本数据,基于目标样本数据训练模型时,可以快速的训练机器模型以及模型准确性的技术效果。

【技术实现步骤摘要】
样本数据的生成方法以及装置
本专利技术实施例涉及信息处理
,尤其涉及一种样本数据的生成方法以及装置。
技术介绍
在训练机器学习模型时,通常是基于人工标注的样本数据来训练机器学习模型。由于是基于人工标注的样本来训练机器学习模型,因此存在人工标注的成本较高,准确率较低,导致模型的训练效率较低的技术问题。
技术实现思路
本专利技术提供一种样本生成方法以及装置,以实现确定样本数据的便捷性以及高效性的技术效果。第一方面,本专利技术实施例提供了一种样本数据的生成方法,该方法包括:获取待处理样本数据;将所述待处理样本数据输入至预先训练好的特征提取模型中,得到与所述待处理样本数据对应的目标特征向量;将与所述当前状态对应的待处理样本数据以及所述目标特征向量输入至预先训练得到的一致性评估函数中,得到与当前状态相对应的当前动作;基于当前动作,确定与所述待处理样本数据对应的当前样本数据;基于所述当前动作与前一时刻对应的动作,确定满足预设终止条件时,将所述当前样本数据作为目标样本数据。...

【技术保护点】
1.一种样本数据的生成方法,其特征在于,包括:/n获取待处理样本数据;/n将所述待处理样本数据输入至预先训练好的特征提取模型中,得到与所述待处理样本数据对应的目标特征向量;/n将与当前状态对应的待处理样本数据以及所述目标特征向量输入至预先训练得到的一致性评估函数中,得到与当前状态相对应的当前动作;/n基于当前动作,确定与所述待处理样本数据对应的当前样本数据;/n基于所述当前动作与前一时刻对应的动作,确定满足预设终止条件时,将所述当前样本数据作为目标样本数据。/n

【技术特征摘要】
1.一种样本数据的生成方法,其特征在于,包括:
获取待处理样本数据;
将所述待处理样本数据输入至预先训练好的特征提取模型中,得到与所述待处理样本数据对应的目标特征向量;
将与当前状态对应的待处理样本数据以及所述目标特征向量输入至预先训练得到的一致性评估函数中,得到与当前状态相对应的当前动作;
基于当前动作,确定与所述待处理样本数据对应的当前样本数据;
基于所述当前动作与前一时刻对应的动作,确定满足预设终止条件时,将所述当前样本数据作为目标样本数据。


2.根据权利要求1所述的方法,其特征在于,所述待处理样本数据中包括至少一个视频片段,相应的,所述将所述待处理样本数据输入至预先训练好的特征提取模型中,得到与所述待处理样本数据对应的目标特征向量;
将所述待处理样本数据输入至预先训练好的特征提取模型中,得到与所述至少一个视频片段相对应的目标特征向量,所述目标特征向量中包括声音特征向量和视觉特征向量。


3.根据权利要求1所述的方法,其特征在于,还包括:训练特征提取模型;
所述训练特征提取模型,包括;
获取多个训练样本数据;所述多个训练样本数据中包括正样本数据和负样本数据;每个训练样本数据中包括多个视频片段,与所述训练样本数据对应的样本目标特征向量;所述样本目标特征向量中包括样本声音特征向量和样本视觉特征向量;
针对多个训练样本数据中的每个训练样本数据,将所述训练样本数据输入至待训练特征提取模型中,得到与每个训练样本数据对应的训练目标特征向量;
基于所述样本目标特征向量和所述训练目标特征向量,计算预设损失函数的函数值,根据计算结果对所述待训练特征提取模型中的网络参数进行调整;所述损失函数与所述待训练特征提取模型相对应;
将所述损失函数达到收敛作为训练目标,对所述待训练特征提取模型进行训练,以得到所述特征提取模型;
所述特征提取模型,用于对待处理样本数据进行处理,以得到与待处理样本数据对应的目标特征向量。


4.根据权利要求3所述的方法,其特征在于,还包括:训练所述一致性评估函数;
所述训练所述一致性评估函数包括:
确定各个所述训练样本数据的初始状态;
针对多个训练样本数据中的每个训练样本数据,将所述初始状态、所述训练样本数据的样本目标特征向量输入至待训练一致性评估函数中,得到与所述初始状态相对应的初始动作;
基于所述初始动作确定所述待训练样本数据的样本第二状态;
将所述样本第二状态以及所述待训练样本数据的样本目标特征向量输入至所述训练一致性评估函数,得到与所述样本第二状态对应的第二动作;
基于所述初始动作与所述第二动作,确定与所述初始状态对应的初始评估值;
当所述初始评估值不满足预设条件时,基于所述初始评估值确定与初始状态对应的初始标准值;
基于所述初始评估值与所述初始标准值,更新所述一致性评估函数中的评估参...

【专利技术属性】
技术研发人员:杨诗宇张奕
申请(专利权)人:上海极链网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1