【技术实现步骤摘要】
一种用户检测方法、装置、设备及介质
[0001]本申请涉及营销智能
,尤其涉及一种用户检测方法、装置、设备及介质。
技术介绍
[0002]从广告的发展历史来看,广告业正是随着媒介和技术的进步向前推进的,随着媒体行业的发展,广告推广衍生出越来越多的办法,网络也提供了很多推广平台供广告商投放宣传,但是随着推广的广告愈来愈多,广告推广市场也就变得鱼龙混杂,甚至出现利用广告进行欺诈的用户行为出现。如何在大规模数据下检测欺诈用户就变得尤为重要,目前也出现很多检测欺诈用户的方法,比如从用户的点击和曝光行为中分析流量的异常与否,但是由于广告欺诈的形式多样且不断变化,很难准确检测流量是否异常。
[0003]针对上述“由于广告欺诈的形式多样且不断变化,很难准确检测流量是否异常”的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本申请提供了一种用户检测方法、装置、设备及介质,以解决上述“由于广告欺诈的形式多样且不断变化,很难准确检测流量是否异常”的技术问题。
[0005]根据本申请实施例的一个 ...
【技术保护点】
【技术特征摘要】
1.一种用户检测方法,其特征在于,包括:基于多个用户在预设时间段的行为数据构建每个用户对应的时序行为序列,其中,所述行为数据为每个用户在广告推广平台中产生的行为信息,所述时序行为序列用于表示每个用户的行为的时序特征;将每个用户的所述时序行为序列输入预设自编码模型,以提取每个用户的所述时序行为序列的深度特征;将所有所述深度特征输入预设检测模型对所述多个用户进行检测,并将检测结果中满足孤立条件的用户确定为具有欺诈行为的目标用户。2.根据权利要求1所述的方法,其特征在于,所述基于多个用户在预设时间段的行为数据构建每个用户对应的时序行为序列包括:在所述预设时间段内按照预设采样间隔采集所述多个用户的所述行为数据;以每个用户的用户识别标识为索引,按照发生时间的排序建立每个用户与各自所述行为数据的时间关系映射表;确定行为字段并基于所述时间关系映射表将每个用户的所述行为数据按照所述行为字段进行匹配,以获得所述多个用户的所述时序行为序列。3.根据权利要求2所述的方法,其特征在于,所述确定行为字段并基于所述时间关系映射表将每个用户的所述行为数据按照所述行为字段进行匹配,包括按照如下方式处理缺失值:在每个用户的所述时序行为序列中的所述缺失值数量未超过缺失值阈值的情况下,选用预设缺失值进行填充;在每个用户的所述时序行为序列中的所述缺失值数量超过缺失值阈值的情况下,直接删除所述缺失值所属用户的所述时序行为序列。4.根据权利要求1
‑
3任意一项所述的方法,其特征在于,所述方法还包括按照如下方式训练所述预设自编码模型:获取样本集,其中,所述样本集包括训练集和验证集,所述训练集和所述验证集中均包括多个时序行为序列样本;将所述训练集输入初始自编码模型进行训练,得到中间自编码模型,其中,所述初始自编码模型包括初始编码模块和初始解码模块;利用所述验证集对所述中间自编码模型进行验证,并在所述中间自编码模型对所述验证集的验证结果指示所述中间自编码模型的特征识别准确率达到目标阈值时,将所述中间自编码模型确定为所述自编码器模型;在所述中间自编码模型对所述验证集的验证结果指示所述中间自编码模型的特征识别准确率未达到所述目标阈值时,继续使用所述验证集训练所述中间自编码模型,直至所述中间自编码模型的所述特征识别准确率达到所述目标阈值时,将所述中间模型确定为所述自编码器模型。5.根据权利要求4所述的方法,其特征在于,所述将所述训练集输入初始自编码器模型进行训练,得到中间自编码模型,包括:将所述训练集中的第一时序行为序列输入第一全连接层,得到第一输出向量;将所述第一输出向量输入初始编码器进行编码,得到第一隐藏层状态,其中,所述初始
编码模块包括所述第一全连接层和所述初始编码器;将所述第一隐藏层状态输入初始解码器进行解码,得到第二隐藏层状态;将所述第二隐藏层状态输入第二全连接层,以将所述第二隐藏层状态映射为第二时序行为序列,其中,所述初始解码模块包括所述初始解码器和所述第二全连接层;利用所述第一时序行为序列与所述第二时序行为序列的差异值确定目标函数的损失值;按照所述损失值调整所述第一全连接层...
【专利技术属性】
技术研发人员:王硕,姜娜,杨康,孙泽懿,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。