标签生成模型的训练方法、生成标签的方法及相关设备技术

技术编号:35644368 阅读:16 留言:0更新日期:2022-11-19 16:37
本公开提供一种标签生成模型的训练方法、生成标签的方法及相关设备。该标签生成模型的训练方法,包括:获取多个训练样本,所述训练样本包括产生时间;根据所述多个训练样本对应的多个产生时间,构建损失函数;以及根据所述多个训练样本,结合所述损失函数,训练初始模型以得到所述标签生成模型。以得到所述标签生成模型。以得到所述标签生成模型。

【技术实现步骤摘要】
标签生成模型的训练方法、生成标签的方法及相关设备


[0001]本公开涉及计算机
,尤其涉及一种标签生成模型的训练方法、生成标签的方法及相关设备。

技术介绍

[0002]对内容生成相应的标签(Tag),可以使用户基于该标签确定该内容的大致分类,从而有助于用户对内容进行选择。在相关技术中,对内容生成标签的一种实现方式是,利用机器学习模型来基于内容生成标签。
[0003]然而,本公开的专利技术人发现,相关技术中采用的机器学习模型,其生成标签的效果一般。

技术实现思路

[0004]本公开提出一种标签生成模型的训练方法、生成标签的方法及相关设备,以解决或部分解决上述问题。
[0005]本公开第一方面,提供了一种标签生成模型的训练方法,包括:
[0006]获取多个训练样本,所述训练样本包括产生时间;
[0007]根据所述多个训练样本对应的多个产生时间,构建损失函数;以及
[0008]根据所述多个训练样本,结合所述损失函数,训练初始模型以得到所述标签生成模型。
[0009]本公开第二方面,提供了一种生成标签的方法,包括:
[0010]获取目标数据;以及
[0011]将所述目标数据输入采用第一方面所述的方法训练得到的标签生成模型,得到所述目标数据的标签。
[0012]本公开第三方面,提供了一种标签生成模型的训练装置,包括:
[0013]获取模块,被配置为:获取多个训练样本,所述训练样本包括产生时间;
[0014]构建模块,被配置为:根据所述多个训练样本对应的多个产生时间,构建损失函数;以及
[0015]训练模块,被配置为:根据所述多个训练样本,结合所述损失函数,训练初始模型以得到所述标签生成模型。
[0016]本公开第四方面,提供了一种生成标签的装置,包括:
[0017]获取模块,被配置为:获取目标数据;以及
[0018]生成模块,被配置为:将所述目标数据输入采用第一方面所述的方法训练得到的标签生成模型,得到所述目标数据的标签。
[0019]本公开第五方面,提供了一种计算机设备,包括一个或者多个处理器、存储器;和一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被所述一个或多个处理器执行,所述程序包括用于执行根据第一方面或第二方面所述的方法的指令。
[0020]本公开第六方面,提供了一种包含计算机程序的非易失性计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,使得所述处理器执行第一方面或第二方面所述的方法。
[0021]本公开第七方面,提供了一种提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行第一方面或第二方面所述的方法。
[0022]本公开提供的标签生成模型的训练方法、生成标签的方法及相关设备,通过在模型训练过程进行样本粒度的损失加权,在考虑数据分布更新的情况下充分利用历史数据,从而提升了样本标签识别的准确率。
附图说明
[0023]为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1示出了本公开实施例所提供的示例性系统的示意图。
[0025]图2A示出了本公开实施例所提供的一种示例性方法的流程示意图。
[0026]图2B示出了根据本公开实施例的一种示例性方法的流程示意图。
[0027]图3示出了根据本公开实施例的示例性模型训练流程的示意图。
[0028]图4示出了本公开实施例所提供的另一种示例性方法的流程示意图。
[0029]图5示出了本公开实施例所提供的示例性计算机设备的硬件结构示意图。
[0030]图6示出了本公开实施例所提供的一种示例性装置的示意图。
[0031]图7示出了本公开实施例所提供的另一种示例性装置的示意图。
具体实施方式
[0032]为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
[0033]需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
[0034]随着互联网技术的不断发展,内容生产平台不断涌现、升级。由于各种内容生产平台中的内容层出不穷,使得用户在选择内容时眼花缭乱。为了方便用户在选择内容时可以更容易对内容的分类进行了解,一种方式是基于内容生成相应的标签(Tag)。这样,用户可以通过识别标签来初步确定该内容是否为自己所想查看的内容。
[0035]在相关技术中,一种内容生产平台是多媒体数据生产平台。多媒体数据可以是,例如,视频、音频等。其中,视频的拍摄手法、拍摄风格、拍摄内容等都可能随着时间的推移具有比较大的变化。因此,视频内容的数学分布也会随之有比较大变动。而在视频内容标签识别的场景中,标签生成模型一旦被训练完成,就难以将这种随时间变化的信息体现到模型中,对于识别的准确率会有比较大的负面影响。
[0036]在工业场景中,当前数据分布的模型效果是最受关注的信息,而历史数据分布下模型的效果则相对并不重要。因此,该问题可以被抽象为在一个时序训练数据流下,最优化当前测试效果。
[0037]在相关技术中,一种解决办法是利用新的数据对模型定期做迭代更新,从而让模型适应新的数据分布。这种方法通过定期在新标注的训练数据上对模型进行重新训练,帮助模型快速适应新的数据分布,确保模型效果。
[0038]但是,这类方法由于需要重新训练模型,因此需要的新数据分布的数据量往往较大,成本较高。并且,这样的方法仅利用新数据对模型进行更新,无法很好地利用历史数据,会遗忘掉历史数据分布的信息。
[0039]另一种方法是利用历史数据对模型进行预训练,然后利用新数据进行微调。
[0040]正如上文所述,如果定期训练模型都是从零开始,自然更适用于当前分布,但是需要的数据量往往比较大。因此,另一种做法是以上一个周期的模型为预训练模型,在此基础上利用更新的数据进行微调。
[0041]但是,这类做法需要流程相对繁琐,同时还需要对参数敏感,依赖于大量的经验和调参。并且,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标签生成模型的训练方法,包括:获取多个训练样本,所述训练样本包括产生时间;根据所述多个训练样本对应的多个产生时间,构建损失函数;以及根据所述多个训练样本,结合所述损失函数,训练初始模型以得到所述标签生成模型。2.如权利要求1所述的方法,其中,根据所述多个训练样本对应的多个产生时间,构建损失函数,包括:根据所述多个训练样本对应的多个产生时间,确定所述多个训练样本对应的多个权重;以及根据所述多个权重,构建所述损失函数。3.如权利要求2所述的方法,其中,所述损失函数包括与所述多个训练样本对应的多个子函数,所述损失函数是通过将所述多个权重与所述多个子函数对应相乘而得到的。4.如权利要求2所述的方法,其中,所述多个权重与所述多个训练样本的产生时间之间的关系为线性关系或者变速衰减关系。5.如权利要求2所述的方法,其中,根据所述多个训练样本的产生时间,确定所述多个训练样本对应的多个权重,包括:确定第一时间节点和第二时间节点对应的第一标签生成模型和第二标签生成模型;确定所述第一标签生成模型的第一准确率和所述第二标签生成模型的第二准确率;根据所述第一准确率和所述第二准确率、所述第一时间节点和所述第二时间节点,按照预设函数进行拟合,得到目标函数;以及根据所述目标函数,结合所述训练样本的产生时间,确定所述多个训练样本对应的多个权重。6.如权利要求2

5任一项所述的方法,其中,所述权重与所述训练样本的淘汰周期相关。7.如权利要求1所述的方法,其中,所述训练样本为多媒体数据,所述多媒体数据被标注有标签。8.一种...

【专利技术属性】
技术研发人员:杜正印侯林凯马航航袁泽寰卢靓妮
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1