一种用户关联处理方法和装置制造方法及图纸

技术编号:14290686 阅读:35 留言:0更新日期:2016-12-25 20:59
本申请提供了一种用户关联处理方法和装置,该方法包括:确定特定用户的关联设备集合和关联用户集合;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。本申请通过区分关联设备集合中各个不同设备的关联权重,以及根据关联用户集合中各个用户对各个设备的访问程度的不同区分用户访问权重,可以清楚地计算出各用户与各设备的关联强度,使得关联结果是可处理的。

【技术实现步骤摘要】

本申请涉及大数据处理
,尤其涉及一种用户关联处理方法和装置
技术介绍
目前,为对可疑团伙成员进行圈定,很重要的一个手段是从可以团伙的一个已知成员入手,通过该已知成员所使用的设备信息关联出其他用户,其中用户与设备的关系强度决定了最终关联哪些用户以及用户之间的关联强度。传统的对可疑团伙成员进行圈定方法将各个用户与设备的关系强度看成等值进行计算,这样最终可能会关联出来一批非强关联用户,关联结果膨胀严重,无法圈定可疑团伙成员,需要借助其他手段进行最终结果筛选。
技术实现思路
本申请实施例提出了一种用户关联处理方法和装置,用以优化目前的用户关联处理。在一个方面,本申请实施例提供了一种用户关联处理方法,包括:确定特定用户的关联设备集合和关联用户集合;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。在另一个方面,本申请实施例提供了一种用户关联处理装置,包括:关联集合确定模块,用于确定特定用户的关联设备集合和关联用户集合;设备权重确定模块,用于根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;用户访问权重确定模块,用于根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;关联强度确定模块,用于根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。有益效果如下:在本申请中,引入了设备关联权重和用户访问权重的概念,通过区分关联设备集合中各个不同设备的关联权重,以及根据关联用户集合中各个用户对各个设备的访问程度的不同区分用户访问权重,不再如现有技术中将各个用户与设备的关系强度看成等值,可以清楚地计算出各用户与各设备的关联强度,从而不仅给出关联关系,并且给出了每个用户与每个设备的关联强度,从而增加了关联结果中的信息量,使得关联结果是可处理的。进一步地,在确定所述各用户与所述各设备的关联强度之后,可以确定所述关联强度高于或不低于第一阈值的用户为目的关联用户,从而去掉了大量的非强关联用户,增强了关联处理结果的准确性,避免了关联结果过分膨胀的后果。附图说明下面将参照附图描述本申请的具体实施例,其中:图1示出了本申请实施例的用户关联处理流程图;图2示出了本申请实施例一中对数据仓库中保存的用户访问设备的记录数
据的处理流程图;图3示出了本申请实施例一中关联用户集合和关联设备集合的二部图;图4示出了本申请实施例二中如何进行关联强度的计算的一个实例的流程图;图5示出了本申请实施例中的用户关联处理装置的结构示意图;图6示出了本申请中一个示例的用户关联处理装置的结构示意图;图7示出了本申请中一个示例的用户关联处理装置的结构示意图。具体实施方式为了使本申请的技术方案及优点更加清楚明白,以下结合附图对本申请的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本申请的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本说明中的实施例及实施例中的特征可以互相结合。专利技术人在专利技术过程中注意到:传统的对可疑团伙成员进行圈定方法将各个用户与设备的关系强度看成等值进行计算,这样最终可能会关联出来一批非强关联用户,关联结果膨胀严重,无法圈定可疑团伙成员,且这些关联用户与可以团伙的关联强度并未标识,为后续处理带来了很大的困难,甚至在数据极度膨胀的情况下,用传统方法得到的关联处理结果是毫无意义的。针对上述不足,本申请实施例提出了一种用户关联处理方法和装置,下面进行说明。图1示出了本申请实施例的用户关联处理流程图,如图所示,包括:步骤101,确定特定用户的关联设备集合和关联用户集合,以及关联设备集合中各设备与关联用户集合中各用户间的关联关系;步骤102,根据关联设备集合中各设备的关联用户数,确定各设备的设备关联权重;步骤103,根据关联用户集合中各用户访问各设备的信息,确定各用户针
对各设备的用户访问权重;步骤102和步骤103没有一定的先后顺序。步骤104,根据各用户针对各设备的用户访问权重,以及各设备的设备关联权重,确定各用户与各设备的关联强度。有益效果:在本申请实施例通过区分关联设备集合中各个不同设备的关联权重,以及根据关联用户集合中各个用户对各个设备的访问程度的不同区分用户访问权重,不再如现有技术中将各个用户与设备的关系强度看成等值,可以清楚地计算出各用户与各设备的关联强度,从而不仅给出关联关系,并且给出了每个用户与每个设备的关联强度,从而增加了关联结果中的信息量,使得关联结果是可处理的。可以看出,虽然专利技术人是从对可疑团伙成员进行圈定的方案出发,发现了现有的用户间关联关系计算中存在的问题,但从专利技术人得出的解决方案来看,并不局限在对可疑团伙成员进行圈定的应用场景,只要是对特定用户通过使用的设备的关联来确定其与其他用户的关联关系,均可以采用本申请实施例的方案,该特定用户可以是可疑团伙的一个或者多个已知成员,也可以是其他需要进行圈子挖掘的已知用户。进一步地,为了去掉大量的非强关联用户,增强关联处理结果的准确性,避免关联结果过分膨胀的后果,还可以按以下方式实施。实施中,确定所述各用户与所述各设备的关联强度之后,确定所述关联强度高于或不低于第一阈值的用户为目的关联用户。有益效果:通过确定关联强度高于或不低于第一阈值的用户为目的关联用户,从而去掉了大量的非强关联用户,增强了关联处理结果的准确性,避免了关联结果过分膨胀的后果。进一步地,在具体实现中,确定与特定用户关联的设备集合和用户集合,以及所述设备集合中各设备与所述用户集合中各用户间的关联关系的方法可
以包括:根据用户访问应用的日志信息统计用户访问设备的痕迹,导入数据仓库,保存用户访问设备的记录数据;在所述记录数据中,查找出与所述特定用户关联的设备集合;遍历所述设备集合,查找出所述设备集合关联的用户集合;循环查找,直到所述用户集合和/或所述设备集合不再增长或循环查找的迭代次数达到第二阈值,以当前的设备集合作为所述特定用户的关联设备集合,以当前的用户集合作为所述特定用户的关联用户集合,构建关联用户集合和关联设备集合的二部图,二部图是图论中的一种特殊模型,模型中的每条边所关联的两个顶点分别属于两个不相交的顶点集,用户集合和设备集合的二部图可以反映设备集合中各设备与用户集合中各用户间的关联关系。通过上述方法,可以比较方便且全面地确定特定用户的关联设备集合和关联用户集合,在本申请中,不限定确定特定用户的关联设备集合和关联用户集合的具体方案,本申请的改进主要在于对特定用户的关联设备集合和关联用户集合的处理,以明确各用户和特定用户之间的关联关系。进一步地,根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重,包括如下任意一种或其组合:根据所述关联用户集合中各用户访问所述各设备的次数信息,确定所述各用户针对各设备的访问次数权重;根据所述关联用户集合中各用户访问所述各设备的时间信息,确定所述各用户针对各设本文档来自技高网
...
一种用户关联处理方法和装置

【技术保护点】
一种用户关联处理方法,其特征在于,包括:确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。

【技术特征摘要】
1.一种用户关联处理方法,其特征在于,包括:确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系;根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重;根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重;根据所述各用户针对各设备的用户访问权重,以及所述各设备的设备关联权重,确定所述各用户与所述各设备的关联强度。2.如权利要求1所述的方法,其特征在于,所述确定所述各用户与所述各设备的关联强度之后,确定所述关联强度高于或不低于第一阈值的用户为目的关联用户。3.如权利要求1所述的方法,其特征在于,所述确定特定用户的关联设备集合和关联用户集合,以及所述关联设备集合中各设备与所述关联用户集合中各用户间的关联关系包括:根据用户访问应用的日志信息统计用户访问设备的痕迹,导入数据仓库,保存用户访问设备的记录数据;在所述记录数据中,查找出与所述特定用户关联的设备集合;遍历所述设备集合,查找出所述设备集合关联的用户集合;循环查找,直到所述用户集合和/或所述设备集合不再增长或循环查找的迭代次数达到第二阈值,以当前的设备集合作为所述特定用户的关联设备集合,以当前的用户集合作为所述特定用户的关联用户集合,构建所述关联用户集合和所述关联设备集合的二部图。4.如权利要求3所述的方法,其特征在于,所述根据所述关联设备集合中各设备的关联用户数,确定所述各设备的设备关联权重包括:根据如下公式分别计算出各设备的设备关联权重:h(dj)=-log10k(dj)*或 h ( d i ) = log 10 1 k ( d j ) * ]]>其中,k(dj)*为对所述二部图中的设备j的度进行归一化得到的归一化值,k(dj)*为0到1之间的值。5.如权利要求1所述的方法,其特征在于,所述根据所述关联用户集合中各用户访问所述各设备的信息,确定所述各用户针对各设备的用户访问权重,包括如下任意一种或其组合:根据所述关联用户集合中各用户访问所述各设备的次数信息,确定所述各用户针对各设备的访问次数权重;根据所述关联用户集合中各用户访问所述各设备的时间信息,确定所述各用户针对各设备的和访问时间权重。6.如权利要求5所述的方法,其特征在于,所述确定所述各用户针对各设备的访问次数权重包括:根据如下公式进行计算: f ( u i , d j ) = log 10 d ( u i , d j ) + 1 ]]>其中,d(ui,dj)代表用户i访问设备j的次数。7.如权利要求5所述的方法,其特征在于,所述确走所述各用户针对各设备的访问时间权重包括如下任意一种:根据各用户最后一次访问各设备的时间分别计算得到的第一时间权重;根据各用户访问各设备的最长一次时间分别计算得到的第二时间权重;根据所述第一时间权重和第二时间权重计算得到的第三时间权重。8.如权利要求7所述的方法,其特征在于,根据如下公式计算第一时间权重: p ( u i , d j ) = 1 1 + log 10 ( T ( d j ) - T ( u i , d j ) ) + 1 ]]>其中,T(dj)为设备j最近一次被访问的时间,T(ui,dj)为用户i最近一次访问设备j的时间。9.如权利要求7所述的方法,其特征在于,根据如下公式计算第二时间权重: q ( u i , d ...

【专利技术属性】
技术研发人员:周刚
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1