识别的方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:24758879 阅读:33 留言:0更新日期:2020-07-04 09:46
本申请实施例提供了一种识别的方法、装置、设备及可读存储介质,该方法包括:获取待识别视频包括的第一信息;将第一信息输入至训练后的视觉模型,确定第一预测广告概率,并将第一信息输入至训练后的文本特征模型,确定第二预测广告概率;将待识别视频对应的视频发布者在预设第一时间范围内所发布的各视频进行分类,确定为广告视频类型的视频的第一数量,以及确定为非广告视频类型的视频的第二数量;将第一预测广告概率、第二预测广告概率、第一数量和第二数量输入至训练后的融合模型,确定第三预测广告概率;当第三预测广告概率大于预设第一阈值,确定待识别视频为广告视频。该方法提升了识别广告视频的准确率,降低了误拦截非广告视频的几率。

Identification method, device, equipment and computer-readable storage medium

【技术实现步骤摘要】
识别的方法、装置、设备及计算机可读存储介质
本申请涉及计算机
,具体而言,本申请涉及一种识别的方法、装置、设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,某些微商等非正常用户,频繁发布恶意推广的销售相关的广告视频,但是现有技术中推荐系统使用建库的方式,收集广告视频关键特征入库,对于新的备选样本,使用撞库的方式进行判断,建库撞库的方式容易受建库的完整性的影响,若建库不够全面,则未在库里的目标样本容易被漏识别,降低了推荐系统识别广告视频的准确率,且推荐系统未采取措施避免拦截普通用户的分享视频,容易导致对普通用户视频的误拦截。现有技术中推荐系统使用深度学习的方式,但是使用的模态信息有限,同样会导致推荐系统识别广告视频的准确度低,一方面导致普通用户经常刷到这些广告视频,另一方面推荐系统还误拦截普通用户的生活分享视频,从而使普通用户的体验度下降。
技术实现思路
本申请针对现有的方式的缺点,提出一种识别的方法、装置、电子设备及计算机可读存储介质,用以解决如何提升识别广告视频的准确率的问题。第一方面,本申请提供了本文档来自技高网...

【技术保护点】
1.一种识别的方法,其特征在于,包括:/n获取待识别视频包括的第一信息;/n将所述第一信息输入至训练后的视觉模型,确定第一预测广告概率,并将所述第一信息输入至训练后的文本特征模型,确定第二预测广告概率,所述第一预测广告概率用于表征通过所述训练后的视觉模型将所述待识别视频识别为广告视频的预测概率,所述第二预测广告概率用于表征通过所述训练后的文本特征模型将所述待识别视频识别为广告视频的预测概率;/n将所述待识别视频对应的视频发布者在预设第一时间范围内所发布的各视频进行分类,确定为广告视频类型的视频的第一数量,以及确定为非广告视频类型的视频的第二数量;/n将所述第一预测广告概率、所述第二预测广告概率...

【技术特征摘要】
1.一种识别的方法,其特征在于,包括:
获取待识别视频包括的第一信息;
将所述第一信息输入至训练后的视觉模型,确定第一预测广告概率,并将所述第一信息输入至训练后的文本特征模型,确定第二预测广告概率,所述第一预测广告概率用于表征通过所述训练后的视觉模型将所述待识别视频识别为广告视频的预测概率,所述第二预测广告概率用于表征通过所述训练后的文本特征模型将所述待识别视频识别为广告视频的预测概率;
将所述待识别视频对应的视频发布者在预设第一时间范围内所发布的各视频进行分类,确定为广告视频类型的视频的第一数量,以及确定为非广告视频类型的视频的第二数量;
将所述第一预测广告概率、所述第二预测广告概率、所述第一数量和所述第二数量输入至训练后的融合模型,确定第三预测广告概率;
当所述第三预测广告概率大于预设第一阈值,确定所述待识别视频为广告视频。


2.根据权利要求1所述的方法,其特征在于,所述第一信息,包括以下至少一项:
关键帧、所述待识别视频对应的视频发布者的标识信息、视频文本描述信息、语音文本信息、视频帧图像文本信息、关键帧图像集。


3.根据权利要求1所述的方法,其特征在于,所述视觉模型包括时间段网络TSN、时间位移模型TSM、深度残差网络ResNet50中的至少一项;所述文本特征模型包括双向长短期记忆的循环神经网络Bi-LSTM、自注意力机制self-attention中的至少一项;所述融合模型包括提升树可扩展的机器学习系统xgboost。


4.根据权利要求1所述的方法,其特征在于,确定所述训练后的视觉模型的方式包括:
将第一训练视频包括的图像帧集合输入至预设的视觉模型,对所述预设的视觉模型的第一参数的进行调整,当达到第一预定训练收敛条件时,得到所述训练后的视觉模型,所述第一预定训练收敛条件包括将所述预设的视觉模型进行训练,直至将所述第一训练视频识别为广告视频的预测准确度大于预设第二阈值,所述第一参数包括网络的层数、每层节点数、学习率中至少一项。


5.根据权利要求1所述的方法,其特征在于,确定所述训练后的文本特征模型的方式包括:
将第二训练视频包括的所述待识别视频对应的视频发布者的标识信息、视频描述、语音文本信息、视频帧图像文本信息中至少一项输入至预设的文本特征模型,通过注意力机制attention对所述预设的文本特征模型进行训练,当达到第二预定训练收敛条件时,得到所述训练后的文本特征模型,所述第二预定训练收敛条件包括将所述预设的文本特征模型进行训练,直至将所述第二训练视频识别为广告视频的预测准确度大于预设第三阈值。


6.根据权利要求1所述的方法,其特征在于,确定所述训练后的融合模型的方式包括:
将第三训练视频输入至...

【专利技术属性】
技术研发人员:张浩王思聪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1