异常对象的识别方法、装置及设备制造方法及图纸

技术编号:20926610 阅读:18 留言:0更新日期:2019-04-20 11:56
本说明书实施例提供一种异常对象的识别方法、装置及设备,在异常对象的识别方法中,获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息。根据存储信息,获取各个对象的静态的统计数据以及动态的存储行为序列。根据预设的编码算法,对存储行为序列进行编码。将编码后的存储行为序列与统计数据进行拼接,以得到各个对象的拼接后的数据。将拼接后的数据输入分类器,以识别各个对象是否为异常对象。

Identification Method, Device and Equipment of Abnormal Objects

The embodiment of this specification provides a method, device and device for identifying anomalous objects. In the method of identifying anomalous objects, the storage information generated by multiple users when performing storage behavior for each object in their respective object set is obtained. According to the storage information, the static statistical data of each object and the dynamic storage behavior sequence are obtained. According to the preset encoding algorithm, the storage behavior sequence is coded. The coded storage behavior sequence is joined with the statistical data to obtain the joined data of each object. The spliced data are input into the classifier to identify whether the objects are abnormal objects or not.

【技术实现步骤摘要】
异常对象的识别方法、装置及设备
本说明书一个或多个实施例涉及风控
,尤其涉及一种异常对象的识别方法、装置及设备。
技术介绍
近年来,随着信息技术的飞速发展,与之对立的黑色产业也在不断的进行技术更新,各种诈骗手法越来越隐蔽,攻防对抗也越来越激烈。在这样的大背景下,如何识别出各种各样的异常对象,以保证用户的安全就成为要解决的问题。传统技术中,通常是基于用户的网上行为(如,交易行为)的行为信息,来统计一些静态数据,之后基于统计的静态数据,来识别异常用户或者异常行为。然而,上述静态数据通常不能对异常对象的特征进行准确刻画。因此,需要提供一种更准确、更全面地异常对象识别方案。
技术实现思路
本说明书一个或多个实施例描述了一种异常对象的识别方法、装置及设备,可以实现异常对象的准确识别。第一方面,提供了一种异常对象的识别方法,包括:获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;根据预设的编码算法,对所述存储行为序列进行编码;将编码后的存储行为序列与所述统计数据进行拼接,以得到各个对象的拼接后的数据;将所述拼接后的数据输入分类器,以识别所述各个对象是否为异常对象。第二方面,提供了一种异常对象的识别装置,包括:获取单元,用于获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;所述获取单元,还用于根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;编码单元,用于根据预设的编码算法,对所述获取单元获取的所述存储行为序列进行编码;拼接单元,用于将所述编码单元编码后的存储行为序列与所述统计数据进行拼接,以得到各个对象的拼接后的数据;识别单元,用于将所述拼接单元得到的所述拼接后的数据输入分类器,以识别所述各个对象是否为异常对象。第三方面,提供了一种异常对象的识别设备,包括:存储器;一个或多个处理器;以及一个或多个程序,其中所述一个或多个程序存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序被所述处理器执行时实现以下步骤:获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;根据预设的编码算法,对所述存储行为序列进行编码;将编码后的存储行为序列与所述统计数据进行拼接,以得到各个对象的拼接后的数据;将所述拼接后的数据输入分类器,以识别所述各个对象是否为异常对象。本说明书一个或多个实施例提供的异常对象识别方法、装置及设备,获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息。根据存储信息,获取各个对象的静态的统计数据以及动态的存储行为序列。根据预设的编码算法,对存储行为序列进行编码。将编码后的存储行为序列与统计数据进行拼接,以得到各个对象的拼接后的数据。将拼接后的数据输入分类器,以识别各个对象是否为异常对象。由此可以看出,本说明书提供的方案是基于两方面的数据:静态数据和动态数据,来进行异常对象的识别的,从而可以提高异常对象识别的准确性。附图说明为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明书提供的异常对象的识别方法示意图;图2为本说明书一个实施例提供的异常对象的识别方法流程图;图3为本说明书提供的诈骗电话的识别方法流程图;图4为本说明书一个实施例提供的异常对象的识别装置示意图;图5为本说明书一个实施例提供的异常对象的识别设备示意图。具体实施方式下面结合附图,对本说明书提供的方案进行描述。在介绍说明书一个或多个实施例提供的异常对象的识别方法之前,先对该方法的专利技术构思进行描述。首先,电话诈骗的识别和管控一直是风控领域的重点和难点。因此,本方案将对异常的电话号码进行识别。此外,还可以将与电话号码具有类似特性,且通常也能够对用户实施诈骗行为的网站网址以及app也进行识别。其次,传统技术中通常是基于静态数据来进行异常对象识别。虽然这些静态数据可以刻画出异常对象在历史上的某种行为偏好或者行为在统计意义上的显著性,揭示行为潜在的风险。但是,这些静态数据通常是基于单个行为的统计。单独统计某个行为的次数这样的特征会带来比较大的打扰,因为用户在不同的环境或者场景下会有不同的行为动机。从而仅仅基于静态数据,来对异常对象进行识别通常是不准确的。为提高异常对象识别的准确性,本方案尝试将所有的行为组合在一起,以识别行为组合所对应的行为动机和风险。而行为序列更好得结合了“上下文”,从用户所在的一系列行为出发。因此,本方案在识别异常对象时,将对象的行为序列作为相关的特征。需要说明的是,行为序列是指将用户的操作行为历史按照时间发生顺序排列后组成的序列。其包含了行为事件本身以及某段时间窗口内行为事件发生的顺序信息等。例如,过去1小时内的行为序列可以表达为:“A->B->C->D”,其中,A-D可以用于表示不同用户针对某一对象所存储的备注名称。需要说明的是,虽然“B->C->A->D”与“A->B->C->D”都包含了同样的行为事件,但因发生顺序不同而成为两种完全不同的行为模式。最后,由于本方案同时将行为序列作为输入特征,因此,在异常对象识别时,考虑采用用于刻画具有序列特性的输入特征的循环神经网络(RecurrentNeuralNetwork,RNN)模型进行异常对象的分类。而由于行为序列中可能会包含对象的备注名称,无法直接输入计算机。因此,可以考虑对行为序列进行编码或者向量化。具体地,可以采用词向量化算法(如,word2vector或者cw2vec等)或者文本分类(fasttext)算法对行为序列进行编码或者向量化。上述就是本说明书提供的方案的专利技术构思,基于该专利技术构思,就可以得到本说明书提供的方案。以下对本说明书提供的方案进行进一步地详细阐述:图1为本说明书提供的异常对象的识别方法示意图。图1中,首先收集N个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息。这里的对象可以包括但不限于电话号码、网站网址以及app等。以对象为电话号码为例来说,对应的对象集合可以为通讯录。通讯录的内容是对现有风控数据的非常重要的补充。上述存储信息可以包括但不限于各个对象的备注名称以及存储时间等。之后,基于收集的存储信息,获取各个对象的静态的统计数据以及动态的存储行为序列。根据预设的编码算法,对存储行为序列进行编码。最后将编码后的存储行为序列与统计数据进行拼接后输入分类器,以识别各个对象是否为异常对象。图2为本说明书一个实施例提供的异常对象的识别方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图2所示,所述方法具体可以包括:步骤202,获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息。这里的对象可以包括但不限于电话号码、网站网址以及app等。以对象为电话号码为例来说,对应的对象集合可以为通讯本文档来自技高网...

【技术保护点】
1.一种异常对象的识别方法,包括:获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;根据预设的编码算法,对所述存储行为序列进行编码;将编码后的存储行为序列与所述统计数据进行拼接,以得到各个对象的拼接后的数据;将所述拼接后的数据输入分类器,以识别所述各个对象是否为异常对象。

【技术特征摘要】
1.一种异常对象的识别方法,包括:获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;根据预设的编码算法,对所述存储行为序列进行编码;将编码后的存储行为序列与所述统计数据进行拼接,以得到各个对象的拼接后的数据;将所述拼接后的数据输入分类器,以识别所述各个对象是否为异常对象。2.根据权利要求1所述的方法,所述存储信息包括所述各个对象的备注名称以及存储时间;所述根据所述存储信息,获取所述各个对象的动态的存储行为序列,包括:对所述各个对象中的每个对象,从所述各个对象的备注名称以及存储时间中筛选出所述对象的备注名称以及存储时间;根据所述对象的存储时间,对所述对象的备注名称进行排序;根据排序后的备注名称,生成所述对象的存储行为序列。3.根据权利要求1所述的方法,所述静态的统计数据包括以下一种或多种:对象在过去若干天被多少个用户存储、对象在过去若干天被存储天数、对象在过去若干天是否被存储为目标名称以及对象在过去若干天被删除次数。4.根据权利要求1所述的方法,所述预设的编码算法包括以下任一种:词向量化算法以及文本分类算法。5.根据权利要求1-4任一项所述的方法,所述对象包括以下任一种:电话号码、网站地址以及app。6.一种异常对象的识别装置,包括:获取单元,用于获取多个用户针对各自对象集合中的各个对象执行存储行为时所产生的存储信息;所述获取单元,还用于根据所述存储信息,获取所述各个对象的静态的统计数据以及动态的存储行为序列;编码单元,用于根据预设的编码算法,对所述获取单元获取的所述存储行为序列进行编码;拼接单元,用于将...

【专利技术属性】
技术研发人员:彭求应
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1