一种广告处理方法、装置和电子设备制造方法及图纸

技术编号:33924803 阅读:19 留言:0更新日期:2022-06-25 21:34
本发明专利技术提供了一种广告处理方法、装置和电子设备,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。提高广告投放效率。提高广告投放效率。

【技术实现步骤摘要】
一种广告处理方法、装置和电子设备


[0001]本专利技术涉及计算机
,具体而言,涉及一种广告处理方法、装置和电子设备。

技术介绍

[0002]目前,在线广告投放活动中,广告平台对广告内容都有一定的审核,以使广告可以在不违规的情况下投放出来。但由于广告主对平台规则的不了解、以及平台规则本身的模糊性,使得新上架的广告常常因为各种原因违规遭到平台的下架,从而产生损失。

技术实现思路

[0003]为解决上述问题,本专利技术实施例的目的在于提供一种广告处理方法、装置和电子设备。
[0004]第一方面,本专利技术实施例提供了一种广告处理方法,包括:
[0005]获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
[0006]通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
[0007]获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;
[0008]当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
[0009]当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
[0010]第二方面,本专利技术实施例还提供了一种广告处理装置,包括:
[0011]获取模块,用于获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;
[0012]训练模块,用于通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;
[0013]检测模块,用于获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的
词语;
[0014]处理模块,用于当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;
[0015]判定模块,用于当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。
[0016]第三方面,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。
[0017]第四方面,本专利技术实施例还提供了一种电子设备,所述电子设备包括有存储器,处理器以及一个或者一个以上的程序,其中所述一个或者一个以上程序存储于所述存储器中,且经配置以由所述处理器执行上述第一方面所述的方法的步骤。
[0018]本专利技术实施例上述第一方面至第四方面提供的方案中,通过利用违规广告得到模型训练负样本以及正常投放广告得到模型训练正样本,通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本,与相关技术中广告主无法对广告是否违规进行判断的方式相比,可以在广告上架之前通过训练得到的广告文本分类模型,对广告文本是否违规进行判断,从而可以自动对广告是否违规进行判断,尽可能避免广告因违规而遭到下架而遭受的损失,使经过违规判定的广告可以顺利通过广告平台审核,提高广告投放效率。
[0019]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1示出了本专利技术实施例1所提供的一种广告处理方法的流程图;
[0022]图2示出了本专利技术实施例2所提供的一种广告处理装置的结构示意图;
[0023]图3示出了本专利技术实施例3所提供的一种电子设备的结构示意图。
具体实施方式
[0024]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、

厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0025]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0026]在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。
[0027]目前,在线广告投放活动中,广告平台对广告内容都有一定的审核,以使广告可以在不违规的情况下投放出来。但由于广告主对平台规则的不了解、以及平台规则本身的模糊性,使得新上架的广告常常因为各种原因违规遭到平台的下架,从而产生损失。
[0028]基于此,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种广告处理方法,其特征在于,包括:获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分类模型;获取品牌名称集合和待检测的广告文本,将待检测的所述广告文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与广告文本中词语一致的品牌名称时,将所述广告文本判定为违规广告文本;其中,所述品牌名称集合,包括:品牌名称和多含义词语;所述多含义词语,是指具有品牌以及非品牌双重含义的词语;当从所述品牌名称集合中查询出与广告文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告文本进行处理,得到所述广告文本是违规广告文本的第一概率值;当所述第一概率值大于概率阈值时,将所述广告文本判定为违规广告文本。2.根据权利要求1所述的方法,其特征在于,还包括:当获取到待检测的广告图像时,利用光学字符识别技术OCR提取所述广告图像中的文字,将提取出的文字确定为广告图像的文本;将所述广告图像的文本中的词语在品牌名称集合中进行查询,当能够从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的品牌名称时,确定所述广告图像中包含违规词语;当从所述品牌名称集合中查询出与所述广告图像的文本中词语一致的多含义词语时,利用广告文本分类模型对所述广告图像的文本进行处理,得到所述广告图像的文本包含违规词语的违规概率值;当所述违规概率值大于概率阈值时,确定所述广告图像中包含违规词语。3.根据权利要求2所述的方法,其特征在于,还包括:当利用广告文本分类模型确定广告图像未包含违规词语时,获取带有品牌标志的图片和带有所述品牌标志的图片的图片信息,所述带有所述品牌标志的图片的图片信息,包括:所述图片中的品牌标志所属的品牌名称和品牌标志在图片中的位置信息;利用带有品牌标志的图片和带有所述品牌标志的图片的图片信息对目标检测模型进行训练,得到品牌标志的检测器;将未包含违规词语的广告图像输入到所述品牌标志的检测器进行处理,得到未包含违规词语的广告图像中具有品牌标志的第二概率值;获取品牌款式图像类型的违规图像、著名人物图像类型的违规图像、漫画人物图像类型的违规图像以及正常投放广告中的图像,利用所述品牌款式图像类型的违规图像、所述著名人物图像类型的违规图像、所述漫画人物图像类型的违规图像和所述正常投放广告中的图像对图像分类模型进行训练,得到图片分类器;将未包含违规词语的广告图像输入到所述图片分类器中进行处理,得到所述未包含违规词语的广告图像的图像类型以及第三概率值;所述图像类型,包括:品牌款式图像类型、著名人物图像类型和漫画人物图像类型;通过以下公式对未包含违规词语的广告图像的违规概率值进行计算:
S=2*S1*S2/(S1+S2)其中,S表示违规概率值;S1表示第二概率值;S2表示第三概率值;当计算得到的所述违规概率值大于所述概率阈值时,判定所述未包含违规词语的广告图像是违规广告。4.根据权利要求3所述的方法,其特征在于,还包括:当获取到待检测的广告视频时,利用关键帧提取技术对所述广告视频中的视频关键帧进行提取;将提取到的视频关键帧中位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧删除,并按照预设时间间隔从已删除位于广告视频开头的视频关键帧和位于广告视频结尾的视频关键帧的剩余的视频关键帧中提取出待检测的多个视频关键帧;对待检测的多个视频关键帧中的各视频关键帧进行违规判定,得到各视频关键帧的违规判定结果;其中,所述违规判定结果,包括:包含违规词语的视频关键帧以及被判定为违规广告的视频关键帧;当所述违规判定结果指示各视频关键帧中具有包含违规词语的视频关键帧或者各视频关键帧中具有被判定为违规广告的视频关键帧时,确定所述广告视频为违规广告。5.一种广告处理装置,其特征在于,包括:获取模块,用于获取违规广告和正常投放广告,利用所述违规广告得到模型训练负样本,并利用所述正常投放广告得到模型训练正样本;其中,所述模型训练负样本和所述模型训练正样本均是广告文本;训练模块,用于通过所述模型训练负样本和模型训练负样本对文本分类算法模型进行训练,得到广告文本分...

【专利技术属性】
技术研发人员:张聪沈菁康单陈文海张天生陆璐熊家治
申请(专利权)人:飞书深诺数字科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1