【技术实现步骤摘要】
一种违规广告检测方法、装置和电子设备
[0001]本专利技术涉及计算机
,具体而言,涉及一种违规广告检测方法、装置和电子设备。
技术介绍
[0002]目前,在广告中常常会出现虚假宣传以及夸大效果等不规范用语,这些不规范用语会导致广告会触犯广告投放所在国家的规定而导致广告被下架,造成广告主的损失。
技术实现思路
[0003]为解决上述问题,本专利技术实施例的目的在于提供一种违规广告检测方法、装置和电子设备。
[0004]第一方面,本专利技术实施例提供了一种违规广告检测方法,包括:
[0005]获取不规范用语,并利用所述不规范用语对已投放广告的广告文本进行遍历,查询出包含所述不规范用语的广告文本以及正规广告文本;其中,所述正规广告文本,是未包含所述不规范用语的广告文本;
[0006]将所述包含所述不规范用语的广告文本作为训练负样本、将所述正规广告文本作为训练正样本,对BERT模型进行训练,得到不规范用语广告文本预测模型;
[0007]获取待检测的广告,提取所述广告中的广告文本 ...
【技术保护点】
【技术特征摘要】
1.一种违规广告检测方法,其特征在于,包括:获取不规范用语,并利用所述不规范用语对已投放广告的广告文本进行遍历,查询出包含所述不规范用语的广告文本以及正规广告文本;其中,所述正规广告文本,是未包含所述不规范用语的广告文本;将所述包含所述不规范用语的广告文本作为训练负样本、将所述正规广告文本作为训练正样本,对BERT模型进行训练,得到不规范用语广告文本预测模型;获取待检测的广告,提取所述广告中的广告文本,并通过所述不规范用语广告文本预测模型对所述广告中的广告文本进行处理,得到所述广告的广告文本具有不规范用语的第一概率值;获取所述广告的广告图像,对所述广告的广告图像进行处理,得到所述广告的广告图像具有不规范用语的第二概率值;获取所述广告的广告视频,对所述广告的广告视频进行处理,得到所述广告的广告视频具有不规范用语的第三概率值;根据得到的所述第一概率值、所述第二概率值以及所述第三概率值,对所述广告的违规参数进行计算;当所述广告的违规参数大于违规参数阈值时,将所述广告确定为违规广告。2.根据权利要求1所述的方法,其特征在于,将所述包含所述不规范用语的广告文本作为训练负样本、将所述正规广告文本作为训练正样本,对BERT模型进行训练,得到不规范用语广告文本预测模型,包括:将所述包含所述不规范用语的广告文本翻译成各种语言的第一翻译文本,将所述第一翻译文本作为训练负样本,并将所述正规广告文本翻译成各种语言的第二翻译文本,将所述第二翻译文本作为训练正样本;从所述训练负样本和所述训练正样本中随机抽取预设比例的样本组成第一训练集;利用所述第一训练集对BERT模型进行训练,得到不规范用语广告文本预测模型。3.根据权利要求1所述的方法,其特征在于,所述获取所述广告的广告图像,对所述广告的广告图像进行处理,得到所述广告的广告图像具有不规范用语的第二概率值,包括:从违规广告数据库中获取包含所述不规范用语的广告图片,并从正规广告数据库中获取正规广告所使用的正规广告图片;其中,所述正规广告图片,是未包含所述不规范用语的广告图片;从所述包含所述不规范用语的广告图片和所述正规广告图片中随机抽取预设比例的图片组成第二训练集,并将所述第二训练集中图片的分辨率转换到预设分辨率;利用具有所述预设分辨率图片的第二训练集对ResNet34模型进行训练,得到不规范用语广告图片预测模型;获取所述广告的广告图像,将所述广告的广告图像输入到所述不规范用语广告图片预测模型中,通过所述不规范用语广告图片预测模型对所述广告的广告图像进行处理,得到所述广告的广告图像具有不规范用语的第二概率值。4.根据权利要求3所述的方法,其特征在于,获取所述广告的广告视频,对所述广告的广告视频进行处理,得到所述广告的广告视频具有不规范用语的第三概率值,包括:获取所述广告的广告视频,利用关键帧提取技术对所述广告视频中的视频关键帧进行
提取;将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除,并按照预设时间间隔从已删除位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧的剩余的视频关键帧中提取出待检测的多个视频关键帧;将所述广告视频的多个视频关键帧输入到所述不规范用语广告图片预测模型中,通过所述不规范用语广告图片预测模型对广告视频的多个视频关键帧进行处理,得到所述广告的广告视频具有不规范用语的第三概率值。5.根据权利要求1所述的方法,...
【专利技术属性】
技术研发人员:陈文海,沈菁,康单,张聪,张天生,陆璐,熊家治,
申请(专利权)人:飞书深诺数字科技上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。