资源审核模型的训练方法、装置、服务器和存储介质制造方法及图纸

技术编号：27202458 阅读：23 留言：0更新日期：2021-01-31 12:15

本发明专利技术实施例公开了一种资源审核模型的训练方法、装置、服务器和存储介质。其中，该方法包括：确定预先训练的基准审核模型；采用基准审核模型的原训练样本，以及从候选资源集中动态挖掘的调优样本，对基准审核模型不断进行调优，直至调优后的基准审核模型满足预设调优收敛条件，则将最终调优后的基准审核模型作为资源审核模型，调优样本为对基准审核模型的高违规审核存在正向影响的候选资源。本发明专利技术实施例提供的技术方案，通过对该基准审核模型不断进行高违规审核下的调优，逐步避免基准审核模型在高违规审核下的审核误差，从而提升资源审核模型在高违规审核下的高准确性，保证资源审核模型在高违规审核下的审核可信度。核模型在高违规审核下的审核可信度。核模型在高违规审核下的审核可信度。

全部详细技术资料下载

【技术实现步骤摘要】
资源审核模型的训练方法、装置、服务器和存储介质

[0001]本专利技术实施例涉及视频处理
，尤其涉及一种资源审核模型的训练方法、装置、服务器和存储介质。

技术介绍

[0002]随着短视频、直播和新闻资讯等多媒体平台的迅速崛起，面向用户传播的多媒体资源与日俱增，此时为了确保多媒体资源传播的内容安全性，对于涉及暴力、血腥、黄赌毒以及危及青少年健康成长等不良导向内容的监管力度也不断提升，通常会采用预先训练的资源审核模型过滤出大量正常的多媒体资源，然后将可能违规的多媒体资源推送给人工审核平台，以协助人工审核。
[0003]此时，为了进一步减轻人工审核的负担，资源审核模型还可以将违规得分较高的多媒体资源直接判定为违规资源，无需人工审核，然而由于训练样本中部分资源数据的标签模糊不容易界定，或者标注含有噪声，使得所训练出的资源审核模型无法保证违规审核的高准确率，因此资源审核模型输出的违规得分较高的多媒体资源中可能仍然存在与违规内容极为相似的正常资源，因此为了保证资源审核模型进行违规审核的高准确率，现有技术中通常会在模型训练过程中通过调整用于计算样本损失的权重来着重关注训练样本中的正样本，或者通过从训练样本中挖掘困难样本，来对资源审核模型进行增强训练，然而上述方案仍无法从违规得分较高的多媒体资源准确区分出难负样本和易正样本，也就无法保证资源审核模型对于高违规得分下多媒体资源进行审核的高准确率。

技术实现思路

[0004]本专利技术实施例提供了一种资源审核模型的训练方法、装置、服务器和存储介质，提高资源审...

【技术保护点】

【技术特征摘要】
1.一种资源审核模型的训练方法，其特征在于，包括：确定预先训练的基准审核模型；采用所述基准审核模型的原训练样本，以及从候选资源集中动态挖掘的调优样本，对所述基准审核模型不断进行调优，直至调优后的基准审核模型满足预设调优收敛条件，则将最终调优后的基准审核模型作为资源审核模型，所述调优样本为对所述基准审核模型的高违规审核存在正向影响的候选资源。2.根据权利要求1所述的方法，其特征在于，所述采用所述基准审核模型的原训练样本，以及从候选资源集中动态挖掘的调优样本，对所述基准审核模型不断进行调优，包括：针对每次调优后的基准审核模型，基于该基准审核模型内动态设置的高违规阈值，从所述候选资源集中挖掘对应的调优样本；采用该基准审核模型的原训练样本和动态挖掘出的调优样本，继续对该基准审核模型进行高违规审核下的调优。3.根据权利要求2所述的方法，其特征在于，所述基于该基准审核模型内动态设置的高违规阈值，从所述候选资源集中挖掘对应的调优样本，包括：将所述候选资源集输入到该基准审核模型中，得到各候选资源的违规得分；将所述违规得分大于等于该基准审核模型内动态设置的高违规阈值的候选资源作为所述调优样本，并确定所述调优样本的标签类别。4.根据权利要求3所述的方法，其特征在于，所述确定所述调优样本的标签类别，包括：按照所述调优样本的候选标签设置对应的标签类别；或者，将所述调优样本推送给人工审核平台，以人工设置所述调优样本的标签类别。5.根据权利要求2所述的方法，其特征在于，在基于该基准审核模型内动态设置的高违规阈值，从所述候选资源集中挖掘对应的调优样本之前，还包括：针对每次调优后的基准审核模型，按照前次挖掘出的调优样本数量自适应动态调整该基准审核模型内的高违规阈值。6.根据权利要求2所述的方法，其特征在于，在基于该基准审核模型内动态设置的高违规阈值，从所述候选资源集中挖掘对应的调优样本之后，还包括：针对每次调优后的基准审核模型，将当前挖掘出的调优样本添加到预先构建的样本挖掘库中；相应的，采用该基准审核模型的原训练样本和动态挖掘出的调优样本，继续对该基准审核模型进行高违规审核下的调优，包括：采用由该基准审核模型的原训练样本和所述样本挖掘库共同组成的混合样本，继续对该基准审核模型进行高违规审核下的调优。7.根据权利要求1-6任一项所述的方法，其特征在于，所述预设调优收敛条件为利用调优后的基准审核模型当前挖掘出的调优样本数量低于预设挖掘阈值，或者调优后的基准审核模型在高违规审核下的训练损失达...

【专利技术属性】
技术研发人员：易帆，张壮辉，
申请(专利权)人：有半岛北京信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人