特征学习模型的训练方法、装置、系统及存储介质制造方法及图纸

技术编号:32127798 阅读:24 留言:0更新日期:2022-01-29 19:20
本公开提出一种特征学习模型的训练方法、装置、系统及存储介质,涉及机器学习技术领域。本公开的一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率;获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签;根据查询校正标签和查询概率确定查询损失函数值,并根据查询损失函数值修正查询概率模型的参数。通过这样的方法,能够提高视频特征学习技术中对弱监督数据的利用,提高视频特征学习的准确度。度。度。

【技术实现步骤摘要】
特征学习模型的训练方法、装置、系统及存储介质


[0001]本公开涉及机器学习
,特别是一种特征学习模型的训练方法、装置、系统及存储介质。

技术介绍

[0002]随着深度学习的不断发展,视频特征学习有着稳定而快速的进步,这种进步主要依靠于大量的数据进行全监督视频特征学习。但在实际应用中,获得大量视频数据的标注十分困难。
[0003]相关技术中提出利用海量互联网视频数据,采用一种弱监督的方式进行视频特征学习,提高视频模型的泛用性,帮助下游动作分类,动作定位任务的性能提升。

技术实现思路

[0004]本公开的一个目的在于提高弱监督视频特征学习的准确度。
[0005]根据本公开的一些实施例的一个方面,提出一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,文本子类为通过对多个视频的标题的特征聚类分析确定,查询概率为通过查询概率模型获取;获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签;根据查询校正标签和查询概率确定查询损失函数值,并根据查询损失函数值修正查询概率模型的参数。
[0006]在一些实施例中,根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签包括:将查询概率作为权重,获取查询标签的加权值,作为对应查询标签的查询置信度;根据对应于相同查询标签的查询置信度与查询标签的校正值的和,获取查询校正标签。
[0007]在一些实施例中,根据对应于相同查询标签的查询置信度与查询标签的校正值的和,获取查询校正标签包括:获取对应于相同查询标签的查询置信度与查询标签的校正值的和,确定查询校正标签初始值;将查询校正标签初始值除以查询校正标签初始值的L1范数,获取查询校正标签。
[0008]在一些实施例中,根据查询校正标签和查询概率确定查询损失函数值包括:针对每个查询标签,获取查询概率的对数值,并确定查询概率的对数值与对应的查询校正标签的乘积;获取全部查询标签的查询概率的对数值与对应的查询校正标签的乘积的总和,确定查询损失函数值。
[0009]根据本公开的一些实施例的一个方面,提出一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,文本子类为通过对多个视频的标题的特征聚类分析确定,文本概率为通过文本概率模型获取;将查询概率分配至对应的文本子类,作为对应的文本子类的校正值,其中,每个查询标签对应于一个或多个文本子类;根据文本概率和文本
子类的校正值,修正文本子类的文本标签,获取文本校正标签;根据文本校正标签和文本概率确定文本损失函数值,并根据文本损失函数值修正文本概率模型的参数。
[0010]在一些实施例中,根据文本概率和文本子类的校正值,修正文本子类的文本标签,获取文本校正标签包括:将文本概率作为权重,获取文本标签的加权值,作为对应文本子类的文本置信度;根据对应于相同文本子类的文本置信度与文本子类的校正值的和,获取文本校正标签。
[0011]在一些实施例中,根据对应于相同文本子类的文本置信度与文本子类的校正值的和,获取文本校正标签包括:获取对应于相同文本子类的文本置信度与文本子类的校正值的和,确定文本校正标签第一值;将文本校正标签第一值除以文本校正标签第一值的L1范数,获取文本校正标签第二值;根据基于动量的更新准则更新文本校正标签第二值,获取文本校正标签。
[0012]在一些实施例中,根据文本校正标签和文本概率确定文本损失函数值包括:针对每个文本子类,获取文本概率的对数值,并确定文本概率的对数值与对应的文本校正标签的乘积;获取全部文本子类的文本概率的对数值与对应的文本校正标签的乘积的总和,确定文本损失函数值。
[0013]根据本公开的一些实施例的一个方面,提出一种特征学习模型的训练方法,包括:利用上文中任意一种针对查询概率模型的特征学习模型的训练方法训练查询概率模型;和利用上文中任意一种针对文本概率模型的特征学习模型的训练方法训练文本概率模型。
[0014]在一些实施例中,特征学习模型的训练方法还包括:根据视频的特征信息确定视频的查询概率的可信度和文本概率的可信度;若查询概率的可信度低于文本概率的可信度,则利用上文中任意一种针对查询概率模型的特征学习模型的训练方法训练查询概率模型;若查询概率的可信度高于文本概率的可信度,则利用上文中任意一种针对文本概率模型的特征学习模型的训练方法训练文本概率模型。
[0015]在一些实施例中,特征学习模型的训练方法还包括:在执行根据视频的特征信息确定视频的查询概率的可信度和文本概率的可信度之前,利用视频的特征信息训练查询概率初始模型,获取查询初始损失值函数值,并根据查询初始损失值修正查询概率初始模型的参数,获取查询概率模型;和利用视频的特征信息训练文本概率初始模型,获取文本初始损失值函数值,并根据文本初始损失值修正文本概率初始模型的参数,获取文本概率模型。
[0016]根据本公开的一些实施例的一个方面,提出一种第一特征学习装置,包括:第一信息获取单元,被配置为获取视频的特征信息;第一概率获取单元,被配置为基于视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,文本子类为通过对多个视频的标题的特征聚类分析确定,查询概率为通过查询概率模型获取;查询校正值获取单元,被配置为获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;查询校正标签获取单元,被配置为根据查询概率和查询标签的校正值,修正查询标签,获取查询校正标签;查询损失函数获取单元,被配置为根据查询校正标签和查询概率确定查询损失函数值,以便根据查询损失函数值修正查询概率模型的参数。
[0017]根据本公开的一些实施例的一个方面,提出一种第二特征学习装置,包括:第二信息获取单元,被配置为获取视频的特征信息;第二概率获取单元,被配置为基于视频的特征
信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,文本子类为通过对多个视频的标题的特征聚类分析确定,文本概率为通过文本概率模型获取;文本校正值获取单元,被配置为将查询概率分配至对应的文本子类,作为对应的文本子类的校正值,其中,每个查询标签对应于一个或多个文本子类;文本校正标签获取单元,被配置为根据文本概率和文本子类的校正值,修正文本子类的文本标签,获取文本校正标签;文本损失函数获取单元,被配置为根据文本校正标签和文本概率确定文本损失函数值,并根据文本损失函数值修正文本概率模型的参数。
[0018]根据本公开的一些实施例的一个方面,提出一种特征学习模型系统,包括:上文中任意一种第一特征学习装置;和上文中任意一种第二特征学习装置。
[0019]在一些实施例中,特征学习模型系统还包括:分类装置,被配置为根据视频的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特征学习模型的训练方法,包括:获取视频的特征信息;基于视频的所述特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,所述文本子类为通过对多个视频的标题的特征聚类分析确定,所述查询概率为通过查询概率模型获取;获取归属于同一个查询标签的文本子类的文本概率之和,作为对应查询标签的校正值;根据所述查询概率和所述查询标签的校正值,修正所述查询标签,获取查询校正标签;根据所述查询校正标签和所述查询概率确定查询损失函数值,并根据所述查询损失函数值修正所述查询概率模型的参数。2.根据权利要求1所述的方法,其中,所述根据所述查询概率和所述查询标签的校正值,修正所述查询标签,获取查询校正标签包括:将所述查询概率作为权重,获取所述查询标签的加权值,作为对应所述查询标签的查询置信度;根据对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,获取所述查询校正标签。3.根据权利要求2所述的方法,其中,所述根据对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,获取所述查询校正标签包括:获取对应于相同查询标签的所述查询置信度与所述查询标签的校正值的和,确定查询校正标签初始值;将所述查询校正标签初始值除以所述查询校正标签初始值的L1范数,获取所述查询校正标签。4.根据权利要求1所述的方法,其中,所述根据所述查询校正标签和所述查询概率确定查询损失函数值包括:针对每个查询标签,获取查询概率的对数值,并确定所述查询概率的对数值与对应的查询校正标签的乘积;获取全部查询标签的所述查询概率的对数值与对应的查询校正标签的乘积的总和,确定所述查询损失函数值。5.一种特征学习模型的训练方法,包括:获取视频的特征信息;基于所述视频的特征信息,获取视频针对每种查询标签的查询概率,以及针对每个文本子类的文本概率,其中,所述文本子类为通过对多个视频的标题的特征聚类分析确定,所述文本概率为通过文本概率模型获取;将所述查询概率分配至对应的文本子类,作为对应的文本子类的校正值,其中,每个所述查询标签对应于一个或多个所述文本子类;根据所述文本概率和所述文本子类的校正值,修正所述文本子类的文本标签,获取文本校正标签;根据所述文本校正标签和所述文本概率确定文本损失函数值,并根据所述文本损失函数值修正所述文本概率模型的参数。
6.根据权利要求5所述的方法,其中,所述根据所述文本概率和所述文本子类的校正值,修正所述文本子类的文本标签,获取文本校正标签包括:将所述文本概率作为权重,获取所述文本标签的加权值,作为对应所述文本子类的文本置信度;根据对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,获取所述文本校正标签。7.根据权利要求6所述的方法,其中,所述根据对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,获取所述文本校正标签包括:获取对应于相同文本子类的所述文本置信度与所述文本子类的校正值的和,确定文本校正标签第一值;将所述文本校正标签第一值除以所述文本校正标签第一值的L1范数,获取文本校正标签第二值;根据基于动量的更新准则更新所述文本校正标签第二值,获取所述文本校正标签。8.根据权利要求5所述的方法,其中,所述根据所述文本校正标签和所述文本概率确定文本损失函数值包括:针对每个文本子类,获取文本概率的对数值,并确定所述文本概率的对数值与对应的文本校正标签的乘积;获取全部文本子类的所述文本概率的对数值与对应的文本校正标签的乘积的总和,确定所述文本损失函数值。9.一种特征学习模型的训练方法,包括:利用权利要求1~4的任意一种特征学习模型的训练方法训练查询概率模型;和利用权利要求5~8的任意一种特征学习模型的训练方法训练文本概率模型。10.根据权利要求9所述的方法,还包括:根据视频的特征信息确定视频的查询概率...

【专利技术属性】
技术研发人员:姚霆龙拂尘邱钊凡梅涛
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1