【技术实现步骤摘要】
一种广告处理方法、装置和电子设备
[0001]本专利技术涉及计算机
,具体而言,涉及一种广告处理方法、装置和电子设备。
技术介绍
[0002]目前,在线广告投放活动中,广告平台对广告内容都有一定的审核,以使广告可以在不违规的情况下投放出来。但由于广告主对平台规则的不了解、以及平台规则本身的模糊性,使得新上架的广告常常因为各种原因违规遭到平台的下架,从而产生损失。
技术实现思路
[0003]为解决上述问题,本专利技术实施例的目的在于提供一种广告处理方法、装置和电子设备。
[0004]第一方面,本专利技术实施例提供了一种广告处理方法,包括:
[0005]获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
[0006]通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
[0007]获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;
[0008]当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违 ...
【技术保护点】
【技术特征摘要】
1.一种广告处理方法,其特征在于,包括:获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。2.根据权利要求1所述的方法,其特征在于,还包括:当获取到待检测的广告图像时,利用光学字符识别技术OCR提取所述广告图像中的文字,将提取出的文字确定为广告图像的文本;将所述广告图像的文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的品牌名称时,确定所述广告图像中包含违规词语;当从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告图像的文本进行处理,得到所述广告图像的文本包含违规词语的违规概率值;当所述违规概率值大于概率阈值时,确定所述广告图像中包含违规词语。3.根据权利要求2所述的方法,其特征在于,还包括:当利用广告文本分类模型确定广告图像未包含违规词语时,获取带有品牌标志的图片和带有所述品牌标志的图片的图片信息,所述带有所述品牌标志的图片的图片信息,包括:所述图片中的品牌标志所属的品牌名称和品牌标志在图片中的位置信息;利用带有品牌标志的图片和带有所述品牌标志的图片的图片信息对目标检测模型进行训练,得到品牌标志的检测器;将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,得到未包含违规词语的广告图像中具有品牌标志的第二概率值;获取品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像以及正常投放广告中的图像,利用所述品牌款式图像类型的违规图像、所述著名人物图像类型的违规图像、所述漫画人物图像类型的违规图像和所述正常投放广告中的图像对图像分类模型进行训练,得到图片分类器;将未包含违规词语的广告图像输入到所述图片分类器中进行处理,得到所述未包含违规词语的广告图像的图像类型以及第三概率值;所述图像类型,包括:品牌款式图像类型、著名人物图像类型和漫画人物图像类型;通过以下公式对未包含违规词语的广告图像的违规概率值进行计算:
S=2*S1*S2/(S1+S2)其中,S表示违规概率值;S1表示第二概率值;S2表示第三概率值;当计算得到的所述违规概率值大于所述概率阈值时,判定所述未包含违规词语的广告图像是违规广告。4.根据权利要求3所述的方法,其特征在于,还包括:当获取到待检测的广告视频时,利用关键帧提取技术对所述广告视频中的视频关键帧进行提取;将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除,并按照预设时间间隔从已删除位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧的剩余的视频关键帧中提取出待检测的多个视频关键帧;对待检测的多个视频关键帧中的各视频关键帧进行违规判定,得到各视频关键帧的违规判定结果;其中,所述违规判定结果,包括:包含违规词语的视频关键帧以及被判定为违规广告的视频关键帧;当所述违规判定结果指示各视频关键帧中具有包含违规词语的视频关键帧或者各视频关键帧中具有被判定为违规广告的视频关键帧时,确定所述广告视频为违规广告。5.一种广告处理装置,其特征在于,包括:获取模块,用于获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;训练模块,用于通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分...
【专利技术属性】
技术研发人员:张聪,沈菁,康单,陈文海,张天生,陆璐,熊家治,
申请(专利权)人:飞书深诺数字科技上海股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。