【技术实现步骤摘要】
特征学习模型的训练方法、装置、系统及存储介质
[0001]本公开涉及机器学习
,特别是一种特征学习模型的训练方法、装置、系统及存储介质。
技术介绍
[0002]随着深度学习的不断发展,视频特征学习有着稳定而快速的进步,这种进步主要依靠于大量的数据进行全监督视频特征学习。但在实际应用中,获得大量视频数据的标注十分困难。
[0003]相关技术中提出利用海量互联网视频数据,采用一种弱监督的方式进行视频特征学习,提高视频模型的泛用性,帮助下游动作分类,动作定位任务的性能提升。
技术实现思路
[0004]本公开的一个目的在于提高弱监督视频特征学习的准确度。
[0005]根据本公开的一些实施例的一个方面,提出一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,文本子类为通过对多个视频的标题的特征聚类分析确定,查询概率为通过查询概率模型获取;获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签;根据查询校正标签和查询概率确定查询损失函数值,并根据查询损失函数值修正查询概率模型的参数。
[0006]在一些实施例中,根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签包括:将查询概率作为权重,获取查询标签的加权值,作为对应查询标签的查询置信度;根据对应于相同查询标签的查询置信度与查询标签的校正值的和, ...
【技术保护点】
【技术特征摘要】
1.一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的所述特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,所述文本子类为通过对多个视频的标题的特征聚类分析确定,所述查询概率为通过查询概率模型获取;获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;根据所述查询概率和所述查询标签的校正值,修正所述查询标签,获取查询校正标签;根据所述查询校正标签和所述查询概率确定查询损失函数值,并根据所述查询损失函数值修正所述查询概率模型的参数。2.根据权利要求1所述的方法,其中,所述根据所述查询概率和所述查询标签的校正值,修正所述查询标签,获取查询校正标签包括:将所述查询概率作为权重,获取所述查询标签的加权值,作为对应所述查询标签的查询置信度;根据对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,获取所述查询校正标签。3.根据权利要求2所述的方法,其中,所述根据对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,获取所述查询校正标签包括:获取对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,确定查询校正标签初始值;将所述查询校正标签初始值除以所述查询校正标签初始值的L1范数,获取所述查询校正标签。4.根据权利要求1所述的方法,其中,所述根据所述查询校正标签和所述查询概率确定查询损失函数值包括:针对每个查询标签,获取查询概率的对数值,并确定所述查询概率的对数值与对应的查询校正标签的乘积;获取全部查询标签的所述查询概率的对数值与对应的查询校正标签的乘积的总和,确定所述查询损失函数值。5.一种特征学习模型的训练方法,包括:获取视频的特征信息;基于所述视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,所述文本子类为通过对多个视频的标题的特征聚类分析确定,所述文本概率为通过文本概率模型获取;将所述查询概率分配至对应的文本子类,作为对应的文本子类的校正值,其中,每个所述查询标签对应于一个或多个所述文本子类;根据所述文本概率和所述文本子类的校正值,修正所述文本子类的文本标签,获取文本校正标签;根据所述文本校正标签和所述文本概率确定文本损失函数值,并根据所述文本损失函数值修正所述文本概率模型的参数。
6.根据权利要求5所述的方法,其中,所述根据所述文本概率和所述文本子类的校正值,修正所述文本子类的文本标签,获取文本校正标签包括:将所述文本概率作为权重,获取所述文本标签的加权值,作为对应所述文本子类的文本置信度;根据对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,获取所述文本校正标签。7.根据权利要求6所述的方法,其中,所述根据对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,获取所述文本校正标签包括:获取对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,确定文本校正标签第一值;将所述文本校正标签第一值除以所述文本校正标签第一值的L1范数,获取文本校正标签第二值;根据基于动量的更新准则更新所述文本校正标签第二值,获取所述文本校正标签。8.根据权利要求5所述的方法,其中,所述根据所述文本校正标签和所述文本概率确定文本损失函数值包括:针对每个文本子类,获取文本概率的对数值,并确定所述文本概率的对数值与对应的文本校正标签的乘积;获取全部文本子类的所述文本概率的对数值与对应的文本校正标签的乘积的总和,确定所述文本损失函数值。9.一种特征学习模型的训练方法,包括:利用权利要求1~4的任意一种特征学习模型的训练方法训练查询概率模型;和利用权利要求5~8的任意一种特征学习模型的训练方法训练文本概率模型。10.根据权利要求9所述的方法,还包括:根据视频的特征信息确定视频的查询概率...
【专利技术属性】
技术研发人员:姚霆,龙拂尘,邱钊凡,梅涛,
申请(专利权)人:北京京东尚科信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。