【技术实现步骤摘要】
用于构建分类器、广告流量异常检测的方法及装置
[0001]本申请涉及计算机
,例如涉及一种用于构建分类器、广告流量异常检测的方法及装置。
技术介绍
[0002]近年来,随着移动互联网的普及,联网人数和联网时长都在屡创新高,与网络广告市场繁荣相伴相生的广告欺诈问题时有出现,有些广告主、广告经营者和广告发布者在广告活动中,会故意制造商品、服务的假相,或者隐瞒事实真相所采取的一系列不法活动。因此需要进行广告流量异常检测,同时,随着大数据技术与人工智能技术的快速发展,基于人工智能技术的广告流量异常检测成为近年来研究的热点。广告流量包括广告浏览和广告点击等,现有技术中通常是以全监督的训练方式进行采集样本,并通过人工对采集到的所有样本进行类别标签标注,根据带有类别标签的样本对机器学习模型进行训练获得广告流量异常检测模型,从而利用广告流量异常检测模型实现广告流量异常检测。
[0003]在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
[0004]现有技术中通过人工对采集到的所有样本进行标签标注会耗费大量的 ...
【技术保护点】
【技术特征摘要】
1.一种用于构建广告流量分类器的方法,其特征在于,包括:获取第一预设时间段内的多个第一广告流量数据;根据各所述第一广告流量数据进行聚类获得多个类型的广告流量数据特征分布;所述类型包括正常类型和异常类型;分别获取用于表征各所述广告流量数据特征分布的聚类中心的原型;根据各所述原型构建广告流量分类器。2.根据权利要求1所述的方法,其特征在于,根据各所述第一广告流量数据进行聚类获得多个类型的广告流量数据特征分布,包括:对各所述第一广告流量数据进行特征提取,获得各所述第一广告流量数据分别对应的第一流量数据特征;对各所述第一流量数据特征进行聚类,获得多个类型的广告流量数据特征分布。3.根据权利要求1或2所述的方法,其特征在于,分别获取用于表征各所述广告流量数据特征分布的聚类中心的原型,包括:分别获取各所述第一广告流量数据为各所述广告流量数据特征分布生成的后验概率;根据各所述后验概率获取各所述广告流量数据特征分布的均值向量;根据各所述均值向量获取各所述广告流量数据特征分布对应的原型。4.根据权利要求3所述的方法,其特征在于,根据各所述后验概率获取各所述广告流量数据特征分布的均值向量,包括:循环进行均值向量更新操作,所述均值向量更新操作包括:根据各所述后验概率获取备选均值向量;并在每次均值向量更新操作时,获取所述备选均值向量对应的对数似然函数增加值;在所述对数似然函数增加值收敛到预设数值范围内的情况下,将所述对数似然函数增加值对应的备选均值向量确定为均值向量;或,在所述均值向量更新操作的循环次数等于预设次数的情况下,将在所述预设次数对应的备选均值向量确定为均值向量。5.根据权利要求2所述的方法,其特征在于,根据各所述原型构建广告流量分类器,包括:根据各所述广告流量数据特征分布获取各所述第一广告流量数据属于各所述类型的第一概率;利用预设的分类器获取各所述第一概率与各所述原型之间的距离向量;利用所述分类器根据各所述距离向量获取各所述第一广告流量数据属于各所述类型的第二概率;将各所述第一概率确定为软标签,将各所述第二概率确定为预测标签;获取各所述软标签和各所述预测标签之间的交叉熵;根据各所述交叉熵对所述分类器进行训练,获得所述广告流量分类器。6.一种用于广告流量异常检测的方法,其特征在于,利用权利要求1至5任一项所述的用于构建广告流量分类器的方法获得的广告流量分类器进行广告流量异常检测。7.根据权利要求6所述的方法,其...
【专利技术属性】
技术研发人员:姜娜,王硕,杨康,孙泽懿,徐凯波,
申请(专利权)人:北京明略昭辉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。