元素识别模型的获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:34645654 阅读:18 留言:0更新日期:2022-08-24 15:22
本申请涉及一种元素识别模型的获取方法、装置、计算机设备、存储介质和计算机程序产品,本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:获取样本数据,以及样本数据的真实元素标签;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值;根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率;根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型。采用本方法能够提升训练效率以及可靠性。采用本方法能够提升训练效率以及可靠性。采用本方法能够提升训练效率以及可靠性。

【技术实现步骤摘要】
元素识别模型的获取方法、装置、计算机设备和存储介质


[0001]本申请涉及互联网应用
,特别是涉及一种元素识别模型的获取方法、装置、计算机设备和存储介质。

技术介绍

[0002]近些年来互联网发展迅速,用户会花费大量的时间接收互联网信息,得益于此,推荐信息也取得了长足的发展,然而素材视频往往包含一些特定元素,例如填充形式以及转场等,那么识别素材中的元素标签既可以用于推荐信息的推送,也可以用于推荐信息的创意,因此对推荐信息中所包括的元素标签进行识别十分重要。而素材视频中的一个样本可能包含多个标签,而不同标签之间会因为训练样本分布和学习难度不同存在标签挤压的情况,因此可能出现预测分数很高但错误的情况,并且过拟合情况也是需要考虑的问题。
[0003]专利技术人发现,对推荐信息中所包括的元素标签进行识别的通常做法是,使用图像分类网络提取图像特征后直接加多标签分类支路,通过二分类交叉熵计算分类损失以得到多标签分类的解说。然而,在实际业务场景,不同标签的数据集质量不同以及不同标签对数据的要求不同,并且由于数据分布存在差异导致模型训练可能产生较多分高错误,分高错误会影响模型的表征能力,因此模型在训练时某个标签的预测分数较高但属于错误情况,往往通过损失加权等方法进行改善,但这依赖于人工观察与调整,从而导致元素识别模型训练的效率低下以及可靠性不高的问题。因此,如何提升元素识别模型训练的效率以及可靠性亟需解决的问题。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提升训练效率以及可靠性的元素识别模型的获取方法、装置、计算机设备和存储介质。
[0005]第一方面,本申请提供了一种元素识别模型的获取方法。所述方法包括:获取样本数据,以及样本数据的真实元素标签;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
[0006]在其中一个实施例中,对第一预测值进行掩码处理,获取样本数据的第二预测值,包括:对样本数据的类型属于各元素标签的预测值进行排序,得到各预测值的排序结
果;根据各预测值的排序结果,对各预测值进行掩码处理;基于进行掩码处理后的各预测值,获得第二预测值。
[0007]在其中一个实施例中,根据各预测值的排序结果,对各预测值进行掩码处理,包括:根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预设数量;对各待掩码值进行掩码处理。
[0008]在其中一个实施例中,根据各预测值的排序结果,对各预测值进行掩码处理,包括:根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预测值的数量的预设比例;对各待掩码值进行掩码处理。
[0009]在其中一个实施例中,初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,包括:通过特征处理层提取样本数据的数据特征;通过第一池化层对数据特征进行第一池化处理,并基于第一池化处理后的数据特征,获取第一预测值;通过二次学习模块对第一预测值进行掩码处理,获取第二预测值。
[0010]在其中一个实施例中,根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型,包括:根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值;根据第二预测概率与各真实元素标签,计算得到样本数据的第二损失值,第一损失值与第二损失值的损失类型不同;基于第一损失值与第二损失值,更新初始元素识别模型的模型参数。
[0011]在其中一个实施例中,根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值,包括:对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理,维度调整处理后的第一预测概率的维度,与维度调整处理后的各真实元素标签的维度一致;根据维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签,计算得到第一损失值。
[0012]在其中一个实施例中,初始元素识别模型还包括第二池化层;方法还包括:通过第二池化层对数据特征进行第二池化处理,并基于第二池化处理后的数据特征,获取样本数据的第三预测概率,第一池化处理与第二池化处理的池化类型不同;基于第一损失值与第二损失值,更新初始元素识别模型的模型参数,包括:
根据第三预测概率与各真实元素标签,计算得到样本数据的第三损失值;基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数。
[0013]在其中一个实施例中,初始元素识别模型还包括丢弃层;基于第二池化处理后的数据特征,获取样本数据的第三预测概率,包括:通过丢弃层对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
[0014]在其中一个实施例中,初始元素识别模型还包括对比正则模块;基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数,包括:通过对比正则模块根据第二预测概率与第三预测概率,计算得到样本数据的第四损失值;基于第一损失值、第二损失值、第三损失值、以及第四损失值,更新初始元素识别模型的模型参数。
[0015]在其中一个实施例中,基于初始元素识别模型获得元素识别模型,包括:基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。
[0016]第二方面,本申请还提供了一种元素识别模型的获取装置。所述装置包括:获取模块,用于获取样本数据,以及样本数据的真实元素标签;并基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;并根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;模型训练模块,用于根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
[0017]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取样本数据,以及样本数据的真实元素标签;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种元素识别模型的获取方法,其特征在于,所述方法包括:获取样本数据,以及所述样本数据的真实元素标签;基于所述样本数据,通过初始元素识别模型获取所述样本数据的第一预测值,并对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,所述第一预测值包括所述样本数据的类型属于各元素标签的预测值;根据所述第一预测值得到第一预测概率,并根据所述第二预测值得到第二预测概率,所述第一预测概率包括所述样本数据的类型属于各元素标签的预测概率;根据所述第一预测概率与各所述真实元素标签,以及所述第二预测概率与各所述真实元素标签,更新所述初始元素识别模型的模型参数,并在模型训练结束时,基于所述初始元素识别模型获得元素识别模型,所述元素识别模型用于识别数据的元素标签。2.根据权利要求1所述的方法,其特征在于,所述对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,包括:对所述样本数据的类型属于各元素标签的预测值进行排序,得到各所述预测值的排序结果;根据各所述预测值的排序结果,对各所述预测值进行掩码处理;基于进行掩码处理后的各所述预测值,获得所述第二预测值。3.根据权利要求2所述的方法,其特征在于,所述根据各所述预测值的排序结果,对各所述预测值进行掩码处理,包括:根据各所述预测值的排序结果,将排序靠后的所述预测值确定为待掩码值,所述待掩码值的数量为预设数量或者所述预测值的数量的预设比例;对各所述待掩码值进行掩码处理。4.根据权利要求1至3任一项所述的方法,其特征在于,所述初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;所述基于所述样本数据,通过初始元素识别模型获取所述样本数据的第一预测值,并对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,包括:通过所述特征处理层提取所述样本数据的数据特征;通过所述第一池化层对所述数据特征进行第一池化处理,并基于第一池化处理后的所述数据特征,获取所述第一预测值;通过所述二次学习模块对所述第一预测值进行掩码处理,获取所述第二预测值。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一预测概率与各所述真实元素标签,以及所述第二预测概率与各所述真实元素标签,更新所述初始元素识别模型,包括:根据所述第一预测概率与各所述真实元素标签,计算得到所述样本数据的第一损失值;根据所述第二预测概率与各所述真实元素标签,计算得到所述样本数据的第二损失值,所述第一损失值与所述第二损失值的损失类型不同;基于所述第一损失值与所述第二损失值,更新所述初始元素识别模型的模型参数。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一预测概率与各所述真实元素标签,计算得到所述样本数据的第一损失值,包括:
对所述第一预测概率进行维度调整处理,以及对各所述真实元素标签进行维度调整处理,维度调整处理后的所述第一预测概率的维度,与维度调整处理后的各所述真实元素标签的维度一致;根据维度调整处理后...

【专利技术属性】
技术研发人员:王赟豪余亭浩陈少华刘浩侯昊迪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1