【技术实现步骤摘要】
本申请涉及大数据处理
,尤其涉及一种用户关联处理方法和装置。
技术介绍
目前,为对可疑团伙成员进行圈定,很重要的一个手段是从可以团伙的一个已知成员入手,通过该已知成员所使用的设备信息关联出其他用户,其中用户与设备的关系强度决定了最终关联哪些用户以及用户之间的关联强度。传统的对可疑团伙成员进行圈定方法将各个用户与设备的关系强度看成等值进行计算,这样最终可能会关联出来一批非强关联用户,关联结果膨胀严重,无法圈定可疑团伙成员,需要借助其他手段进行最终结果筛选。
技术实现思路
本申请实施例提出了一种用户关联处理方法和装置,用以优化目前的用户关联处理。在一个方面,本申请实施例提供了一种用户关联处理方法,包括:确定特定用户的关联设备集合和关联用户集合;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。在另一个方面,本申请实施例提供了一种用户关联处理装置,包括:关联集合确定模块,用于确定特定用户的关联设备集合和关联用户集合;设备权重确定模块,用于根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;用户访问权重确定模块,用于根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;关联强度确定模块,用于根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关 ...
【技术保护点】
一种用户关联处理方法,其特征在于,包括:确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。
【技术特征摘要】
1.一种用户关联处理方法,其特征在于,包括:确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。2.如权利要求1所述的方法,其特征在于,所述确定所述各用户与所述各设备的关联强度之后,确定所述关联强度高于或不低于第一阈值的用户为目的关联用户。3.如权利要求1所述的方法,其特征在于,所述确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系包括:根据用户访问应用的日志信息统计用户访问设备的痕迹,导入数据仓库,保存用户访问设备的记录数据;在所述记录数据中,查找出与所述特定用户关联的设备集合;遍历所述设备集合,查找出所述设备集合关联的用户集合;循环查找,直到所述用户集合和/或所述设备集合不再增长或循环查找的迭代次数达到第二阈值,以当前的设备集合作为所述特定用户的关联设备集合,以当前的用户集合作为所述特定用户的关联用户集合,构建所述关联用户集合和所述关联设备集合的二部图。4.如权利要求3所述的方法,其特征在于,所述根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重包括:根据如下公式分别计算出各设备的设备关联权重:h(dj)=-log10k(dj)*或 h ( d i ) = log 10 1 k ( d j ) * ]]>其中,k(dj)*为对所述二部图中的设备j的度进行归一化得到的归一化值,k(dj)*为0到1之间的值。5.如权利要求1所述的方法,其特征在于,所述根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重,包括如下任意一种或其组合:根据所述关联用户集合中各用户访问所述各设备的次数信息,确定所述各用户针对各设备的访问次数权重;根据所述关联用户集合中各用户访问所述各设备的时间信息,确定所述各用户针对各设备的和访问时间权重。6.如权利要求5所述的方法,其特征在于,所述确定所述各用户针对各设备的访问次数权重包括:根据如下公式进行计算: f ( u i , d j ) = log 10 d ( u i , d j ) + 1 ]]>其中,d(ui,dj)代表用户i访问设备j的次数。7.如权利要求5所述的方法,其特征在于,所述确走所述各用户针对各设备的访问时间权重包括如下任意一种:根据各用户最后一次访问各设备的时间分别计算得到的第一时间权重;根据各用户访问各设备的最长一次时间分别计算得到的第二时间权重;根据所述第一时间权重和第二时间权重计算得到的第三时间权重。8.如权利要求7所述的方法,其特征在于,根据如下公式计算第一时间权重: p ( u i , d j ) = 1 1 + log 10 ( T ( d j ) - T ( u i , d j ) ) + 1 ]]>其中,T(dj)为设备j最近一次被访问的时间,T(ui,dj)为用户i最近一次访问设备j的时间。9.如权利要求7所述的方法,其特征在于,根据如下公式计算第二时间权重: q ( u i , d ...
【专利技术属性】
技术研发人员:周刚,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。