可疑团伙识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:20221694 阅读:21 留言:0更新日期:2019-01-28 20:13
本公开实施例提供可疑团伙识别方法、装置、设备及计算机可读存储介质。可疑团伙识别方法包括:获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙,从而可以通过利用包括与目标地址的相似的地址集合的介质建立关联关系来关联多个账号,并且根据关联关系来对账号进行聚类以将一些聚类的账号识别为可疑团伙。根据本公开的方案进行可疑团伙识别的效率高,周期短。

【技术实现步骤摘要】
可疑团伙识别方法、装置、设备及计算机可读存储介质
本公开实施例涉及互联网
,尤其涉及可疑团伙识别方法、装置、设备及计算机可读存储介质。
技术介绍
在国际上经常会出现一些犯罪团伙,在黑市里面大量购买被盗银行卡和支付密码,然后在电商网站中进行注册账户并且绑定盗来的卡。在账号和支付方式都准备完毕后,他们就会大规模进行支付消费,从而消耗盗来的卡中钱。在被盗用户发现了自己卡被盗用之后,会向银行和电商进行投诉。通常,电商会承担对这些被盗的卡的消费,赔偿被盗卡的支出。近年来,这样的盗卡或盗账户的团伙性犯案,造成的资损量级非常之大。针对这种国际团伙方案的手段进行了分析,发现存在非常强的关联关系特征,可以总结为以下几点:第一:多个支付账号一般会重复使用一张或者几张盗来的卡或银行账号;第二:多个支付账号一般会重复使用一个或者多个相同的电话号码或者IP地址;第三:多个支付账号一般会重复使用一个或者多个相似的交易和邮寄地址。相关技术中,没有针对国际场景进行深入研究。虽然考虑过用户与电话、IP地址、银行卡的关系,但是这样错误抓取犯罪团伙的场景还是存在,例如,多个用户使用同一个公司的IP地址进行购物的场景。在国际场景中,一些犯罪团伙为了躲过地址的关联,经常会改变收货地址的顺序,例如,他们会将地址“美国、加州、好莱坞”写成“加州、好莱坞、美国”。这样的写法可以被快递人员认可,但是相关技术的可疑团伙识别方案会判断这是两个不同的地址。因此,相关技术的方案进行可疑团伙识别的效率不高,周期太长。
技术实现思路
有鉴于此,本公开第一方面提供了一种可疑团伙识别方法,包括:获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。本公开第二方面提供了一种可疑团伙识别装置,包括:获取模块,被配置为获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;建立模块,被配置为利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;聚类模块,被配置为针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。本公开第三方面提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面所述的方法。本公开第四方面提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面所述的方法。在本公开实施方式中,通过获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙,从而可以通过利用包括与目标地址的相似的地址集合的介质建立关联关系来关联多个账号,并且根据关联关系来对账号进行聚类以将一些聚类的账号识别为可疑团伙。根据本公开的方案进行可疑团伙识别的效率高,周期短。本公开的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明为了更清楚地说明本公开实施例或相关技术中的技术方案,下面将对示例性实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些示例性实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出根据本公开一实施方式的可疑团伙识别方法的流程图;图2示出根据本公开一实施方式的可疑团伙识别方法中的步骤S101的流程图;图3示出根据本公开一实施方式的可疑团伙识别装置的结构框图;图4示出根据本公开一实施方式的可疑团伙识别装置中的获取模块301的结构框图;图5示出根据本公开一实施方式的可疑团伙识别方法的建立关联关系的一个示例的示意图;图6示出根据本公开一实施方式的设备的结构框图;图7是适于用来实现根据本公开一实施方式的可疑团伙识别方法的计算机系统的结构示意图。具体实施方式为了使本
的人员更好地理解本公开方案,下面将结合本公开示例性实施例中的附图,对本公开示例性实施例中的技术方案进行清楚、完整地描述。在本公开的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。下面将结合本公开示例性实施例中的附图,对本公开示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。.图1示出根据本公开一实施方式的可疑团伙识别方法的流程图。该方法可以包括步骤S101、S102和S103。在步骤S101中,获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合。在步骤S102中,利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,至少一种介质包括地址集合中的地址。在步骤S103中,针对关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。在本公开的一个实施例中,在风险控制系统中,会有非常多的事件类型,事件类型包含的属性各不相同。在实时的风险控制场景中,需要从各种事件中抽取出关键的关系作为实时关系数据。例如,当用户进行交易的时候,可以从交易事件中累积出“用户->卡”的关系。因此,对于本公开实施方式中的实时关系数据,可以通过一个累积系统来对各种事件抽取关系并且将抽取的关系累积进数据库。在本公开的一个实施例中,由于线上实时事件属性因为系统性能考虑不会带有太多的属性,所以很多关键的属性需要通过离线关系数据进行导入,例如:用户黑名单数据、IP地址、电话黑名单数据等。在一个实施例中,在第一次初始化时,可以离线导入之前的离线关系数据,使得分析的时候不会缺少部分关系,以使得分析继续进行。在本公开的一个实施例中,至少一种介质包括账号的银行账号、账号的IP地址、账号的手机号和账号的目标地址。例如,目标地址可以是网上交易的收货地址。在本公开的一个实施例中,特定账号指的是与目标地址存在关联关系的账号,当确定与目标地址相似的地址的地址集合时,可以认为该地址集合中的地址所关联的账号与特定账号可能是一个可疑团伙。根据本公开的教导,本领域技术人员可以理解,通过账号与地址的关联关系来确定团伙仅仅是本公开的识别可疑团伙的方案的一部分,本公开可以基于账号与多介质之间的关联关系来聚类可疑团伙。另外,特定账号可以本文档来自技高网
...

【技术保护点】
1.一种可疑团伙识别方法,其特征在于,包括:获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。

【技术特征摘要】
1.一种可疑团伙识别方法,其特征在于,包括:获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合;利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,其中,所述至少一种介质包括所述地址集合中的地址;针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。2.根据权利要求1所述的方法,其特征在于,所述获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合,包括:利用学习算法对组成地址的词汇进行学习来生成具有多个维度的向量;利用分词算法对地址进行分词,将组成地址的各个词汇分别映射到所述向量的相应维度以生成相应的地址向量;计算生成的地址向量之间的相似度以确定一个地址与另一地址之间的相似度,从而获取包括与特定账号使用的目标地址的相似度大于预设值的地址的地址集合。3.根据权利要求2所述的方法,其特征在于,所述利用分词算法对地址进行分词,将组成地址的各个词汇分别映射到所述向量的相应维度以生成相应的地址向量,包括:为地址向量的每一维度分配相应的权重。4.根据权利要求2所述的方法,其特征在于,所述计算生成的地址向量之间的相似度以确定一个地址与另一地址之间的相似度,包括:计算每两个地址向量之间的余弦相似度以确定一个地址与另一地址之间的相似度。5.根据权利要求2所述的方法,其特征在于,所述利用账号的实时关系数据和离线关系数据建立账号与至少一种介质之间的关联关系,包括:获取使用所述地址集合中的地址作为目标地址的关联账号,以建立特定账号、目标地址、地址集合中的地址以及关联账号之间的关联关系。6.根据权利要求5所述的方法,其特征在于,所述针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙,包括:针对所述特定账号、所述目标地址、所述地址集合中的地址以及所述关联账号之间的所述关联关系进行算法聚类以获得聚类出的特定账号和关联账号作为可疑团伙。7.根据权利要求1所述的方法,其特征在于,所述至少一种介质包括账号的银行账号、账号的IP地址、账号的手机号和账号的目标地址。8.根据权利要求1所述的方法,其特征在于,所述针对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙,包括:利用社区发现算法对所述关联关系进行算法聚类以获得聚类出多个账号作为可疑团伙。9.一种可疑团伙识别装置,其特征在于,包括:获...

【专利技术属性】
技术研发人员:王兴驰
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1