【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
目前,存在恶意用户(例如,黄牛、恶意经销商等)利用模拟器、软件下单等手段模拟用户访问网站行为,实现批量操作(例如,批量生成订单或者批量发布虚假评价信息),破坏了网站的正常运营(例如,对于电商网站,恶意用户的这种行为大量抢占了优质商品资源,破坏正常交易秩序,实现恶意攻击电商网站及非法牟利的目的)。为此,需要识别哪些用户访问网站的行为是正常用户行为,哪些用户访问网站的行为是非正常用户行为(也称作恶意用户行为)。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:响应于接收到终端设备发送的用户标识和点击信息,用所收到的用户标识和点击信息以及当前时间生成当前用户点击信息并添加到用户点击信息序列中,用户点击信息包括用户标识、点击信息和点击时间;将用户点击信息序列中用户标识为所收到的用户标识,且点击时间为从当前时间开始往前预设时长内的用户点击信息组成的序列确定为目标用户点击信息序列;对目标用户点击信息序列进行特征提取,得到预设维数的目标用户点击信息序列特征向量;将目标用户点击信息序列特征向量输入预先训练的贝叶斯信念网络,得到所收到的用户标识所指示的用户为预设类型用户的概率,其中,贝叶斯信念网络用于表征预设维数的特征向量与概率之间的对应关系。在一些实施例中,对目标用户点击信息序列进行特征提取,得到预设维数的目标用户点击信息 ...
【技术保护点】
1.一种用于生成信息的方法,包括:/n响应于接收到终端设备发送的用户标识和点击信息,用所收到的用户标识和点击信息以及当前时间生成当前用户点击信息并添加到用户点击信息序列中,用户点击信息包括用户标识、点击信息和点击时间;/n将所述用户点击信息序列中用户标识为所收到的用户标识,且点击时间为从当前时间开始往前预设时长内的用户点击信息组成的序列确定为目标用户点击信息序列;/n对所述目标用户点击信息序列进行特征提取,得到预设维数的目标用户点击信息序列特征向量;/n将所述目标用户点击信息序列特征向量输入预先训练的贝叶斯信念网络,得到所收到的用户标识所指示的用户为预设类型用户的概率,其中,所述贝叶斯信念网络用于表征所述预设维数的特征向量与概率之间的对应关系。/n
【技术特征摘要】
1.一种用于生成信息的方法,包括:
响应于接收到终端设备发送的用户标识和点击信息,用所收到的用户标识和点击信息以及当前时间生成当前用户点击信息并添加到用户点击信息序列中,用户点击信息包括用户标识、点击信息和点击时间;
将所述用户点击信息序列中用户标识为所收到的用户标识,且点击时间为从当前时间开始往前预设时长内的用户点击信息组成的序列确定为目标用户点击信息序列;
对所述目标用户点击信息序列进行特征提取,得到预设维数的目标用户点击信息序列特征向量;
将所述目标用户点击信息序列特征向量输入预先训练的贝叶斯信念网络,得到所收到的用户标识所指示的用户为预设类型用户的概率,其中,所述贝叶斯信念网络用于表征所述预设维数的特征向量与概率之间的对应关系。
2.根据权利要求1所述的方法,其中,所述对所述目标用户点击信息序列进行特征提取,得到预设维数的目标用户点击信息序列特征向量,包括:
对所述目标用户点击信息序列进行特征提取,得到初始特征向量;
对所述初始特征向量进行标准化处理,得到所述目标用户点击信息序列特征向量。
3.根据权利要求2所述的方法,其中,所述贝叶斯信念网络是通过如下训练步骤得到的:
获取历史用户点击信息序列;
对于历史用户标识集合中的每个用户标识,按照点击时间以所述预设时长为周期,对于所述历史用户点击信息序列中用户标识为该用户标识的各个历史用户点击信息进行划分,得到与该用户标识对应的至少一个历史用户点击信息子序列,其中,所述历史用户标识集合包括所述历史用户点击信息序列所包括的各个用户标识;
对于历史用户标识集合中的每个用户标识对应的至少一个历史用户点击信息子序列中的每个历史用户点击信息子序列,执行以下标注和特征提取操作:确定该历史用户点击信息子序列对应的标注结果,标注结果包括用于表征非预设类型用户点击信息序列的正样本标签和用于表征预设类型用户点击信息序列的负样本标签;对该历史用户点击信息子序列进行特征提取,得到与该历史用户点击信息子序列对应的点击信息序列特征向量;将所得到的点击信息序列特征向量和所确定的标注结果作为训练样本对应存储在训练样本集中;
分别将所述训练样本集中的训练样本中的点击信息序列特征向量和标注结果作为初始贝叶斯信念网络的输入和期望输出,利用机器学习方法训练得到贝叶斯信念网络。
4.根据权利要求3所述的方法,其中,点击信息包括点击坐标;以及
所述确定该历史用户点击信息子序列对应的标注结果,包括:
将该历史用户点击信息子序列中点击时间在同一时间窗口内的历史用户点击信息中的点击信息中的点击坐标合并,得到与该历史用户点击信息子序列和各时间窗口对应的点击坐标集,以及按照对应的时间窗口的时间先后顺序,用所得到的与各个点击坐标集生成与该历史用户点击信息子序列对应的点击坐标集序列;
对于所述历史用户标识集合中的每个历史用户标识,将与该用户标识对应的至少一个历史用户点击信息子序列中每个历史用户点击信息子序列对应的点击坐标集序列确定为与该用户标识对应的至少一个点击坐标集序列;
用所述历史用户标识集合中各个历史用户标识对应的点击坐标集序列生成点击坐标集序列样本集;
对所述点击坐标集序列样本集进行序列模式挖掘,得到频繁点击坐标集序列集;
对于所述历史用户标识集合中的每个用户标识,确定该用户标识对应的至少一个点击坐标集序列中是否包括所述频繁点击坐标集序列集中的点击坐标集序列;响应于确定是,将该用户标识对应的至少一个历史用户点击信息子序列中的每个历史用户点击信息子序列的标注结果确定为负样本标签;响应于确定否,将该用户标识对应的至少一个历史用户点击信息子序列中的每个历史用户点击信息子序列的标注结果确定为正样本标签。
5.根据权利要求1-4中任一所述的方法,其中,所述点击信息还包括以下至少一项:浏览器信息、终端设备信息、访问IP地址、所点击的页面元素标识、鼠标/手指移动距离、鼠标/手指移动像素数量、鼠标/手指移动直线段数量、触控点数、页面跳转信息、鼠标/手指移动速度、鼠标/手指轨迹坐标横向速度、鼠标/手指轨迹坐标纵向速度、鼠标/手指轨迹坐标横向加速度、鼠标/手指轨迹坐标纵向加速度、是否页面刷新操作、是否有屏幕滚动、是否有输入行为、输入行为对应的页面元素标识、输入行为对应的页面元素坐标。
6.根据权利要求5所述的方法,其中,所述对所述目标用户点击信息序列进行特征提取,得到初始特征向量,包括:
提取所述目标用户点击信息序列的以下至少一项特征作为所述初始特征向量中的特征分量:点击信息个数、单点控操作总次数、移动速度标准差、平均移动速度、最大移动速度、最小移动速度、移动距离和、移动的总次数、滚动的总次数、移动像素总和、移动像素最大值、移动像素最小值、移动直线点总和、移动直线点最大值、移动直线点最小值、单点控的次数、多点控的次数、鼠标/手指轨迹坐标横向速度平均值、鼠标/手指轨迹坐标横向加速度平均值、鼠标/手指轨迹坐标纵向速度平均值、鼠标/手指轨迹坐标纵向加速度平均值、鼠标/手指滑动纵向距离、鼠标/手指滑动横向距离、鼠标/手指活动面积、输入行为次数、输入行为对应的页面元素标识集合、输入行为对应的页面元素坐标集合、页面刷新次数和页面停留时间。
7.根据权利要求6所述的方法,其中,所述方法还包括:
确定所得到的概率是否大于预设概率阈值;
响应于确定大于,生成用于指示所收到的用户标识所指示的用户为预设类型用户的提示信息,以及将所述提示信息发送给所述终端设备;
响应于确定不大于,执行所收到的点击信息所指示的页面点击操作所关联的操作。
8.一种用于生成信息的装置,包括:
信息添加单元,被配置成响应于接收到终端设备发送的用户标识和点击信息,用所收到的用户标识和点击信息以及当前时间生成当前用户点击信息并添加到用户点击信息序列中,用户点击信息包括用户标识、点击信息和点...
【专利技术属性】
技术研发人员:李欣,王晓勤,罗尚勇,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。