元素识别模型的获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：34645654 阅读：18 留言：0更新日期：2022-08-24 15:22

本申请涉及一种元素识别模型的获取方法、装置、计算机设备、存储介质和计算机程序产品，本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括：获取样本数据，以及样本数据的真实元素标签；基于样本数据，通过初始元素识别模型获取样本数据的第一预测值，并对第一预测值进行掩码处理，获取样本数据的第二预测值；根据第一预测值得到第一预测概率，并根据第二预测值得到第二预测概率；根据第一预测概率与各真实元素标签，以及第二预测概率与各真实元素标签，更新初始元素识别模型的模型参数，并在模型训练结束时，基于初始元素识别模型获得元素识别模型。采用本方法能够提升训练效率以及可靠性。采用本方法能够提升训练效率以及可靠性。采用本方法能够提升训练效率以及可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
元素识别模型的获取方法、装置、计算机设备和存储介质

[0001]本申请涉及互联网应用
，特别是涉及一种元素识别模型的获取方法、装置、计算机设备和存储介质。

技术介绍

[0002]近些年来互联网发展迅速，用户会花费大量的时间接收互联网信息，得益于此，推荐信息也取得了长足的发展，然而素材视频往往包含一些特定元素，例如填充形式以及转场等，那么识别素材中的元素标签既可以用于推荐信息的推送，也可以用于推荐信息的创意，因此对推荐信息中所包括的元素标签进行识别十分重要。而素材视频中的一个样本可能包含多个标签，而不同标签之间会因为训练样本分布和学习难度不同存在标签挤压的情况，因此可能出现预测分数很高但错误的情况，并且过拟合情况也是需要考虑的问题。
[0003]专利技术人发现，对推荐信息中所包括的元素标签进行识别的通常做法是，使用图像分类网络提取图像特征后直接加多标签分类支路，通过二分类交叉熵计算分类损失以得到多标签分类的解说。然而，在实际业务场景，不同标签的数据集质量不同以及不同标签对数据的要求不同，并且由于数据分布存在差异导致模型训练可能产生较多分高错误，分高错误会影响模型的表征能力，因此模型在训练时某个标签的预测分数较高但属于错误情况，往往通过损失加权等方法进行改善，但这依赖于人工观察与调整，从而导致元素识别模型训练的效率低下以及可靠性不高的问题。因此，如何提升元素识别模型训练的效率以及可靠性亟需解决的问题。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提升训练效率以及可靠...

【技术保护点】

【技术特征摘要】
1.一种元素识别模型的获取方法，其特征在于，所述方法包括：获取样本数据，以及所述样本数据的真实元素标签；基于所述样本数据，通过初始元素识别模型获取所述样本数据的第一预测值，并对所述第一预测值进行掩码处理，获取所述样本数据的第二预测值，所述第一预测值包括所述样本数据的类型属于各元素标签的预测值；根据所述第一预测值得到第一预测概率，并根据所述第二预测值得到第二预测概率，所述第一预测概率包括所述样本数据的类型属于各元素标签的预测概率；根据所述第一预测概率与各所述真实元素标签，以及所述第二预测概率与各所述真实元素标签，更新所述初始元素识别模型的模型参数，并在模型训练结束时，基于所述初始元素识别模型获得元素识别模型，所述元素识别模型用于识别数据的元素标签。2.根据权利要求1所述的方法，其特征在于，所述对所述第一预测值进行掩码处理，获取所述样本数据的第二预测值，包括：对所述样本数据的类型属于各元素标签的预测值进行排序，得到各所述预测值的排序结果；根据各所述预测值的排序结果，对各所述预测值进行掩码处理；基于进行掩码处理后的各所述预测值，获得所述第二预测值。3.根据权利要求2所述的方法，其特征在于，所述根据各所述预测值的排序结果，对各所述预测值进行掩码处理，包括：根据各所述预测值的排序结果，将排序靠后的所述预测值确定为待掩码值，所述待掩码值的数量为预设数量或者所述预测值的数量的预设比例；对各所述待掩码值进行掩码处理。4.根据权利要求1至3任一项所述的方法，其特征在于，所述初始元素识别模型包括特征处理层、第一池化层以及二次学习模块；所述基于所述样本数据，通过初始元素识别模型获取所述样本数据的第一预测值，并对所述第一预测值进行掩码处理，获取所述样本数据的第二预测值，包括：通过所述特征处理层提取所述样本数据的数据特征；通过所述第一池化层对所述数据特征进行第一池化处理，并基于第一池化处理后的所述数据特征，获取所述第一预测值；通过所述二次学习模块对所述第一预测值进行掩码处理，获取所述第二预测值。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一预测概率与各所述真实元素标签，以及所述第二预测概率与各所述真实元素标签，更新所述初始元素识别模型，包括：根据所述第一预测概率与各所述真实元素标签，计算得到所述样本数据的第一损失值；根据所述第二预测概率与各所述真实元素标签，计算得到所述样本数据的第二损失值，所述第一损失值与所述第二损失值的损失类型不同；基于所述第一损失值与所述第二损失值，更新所述初始元素识别模型的模型参数。6.根据权利要求5所述的方法，其特征在于，所述根据所述第一预测概率与各所述真实元素标签，计算得到所述样本数据的第一损失值，包括：
对所述第一预测概率进行维度调整处理，以及对各所述真实元素标签进行维度调整处理，维度调整处理后的所述第一预测概率的维度，与维度调整处理后的各所述真实元素标签的维度一致；根据维度调整处理后...

【专利技术属性】
技术研发人员：王赟豪，余亭浩，陈少华，刘浩，侯昊迪，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人