交易行为风险识别方法及装置制造方法及图纸

技术编号:18446227 阅读:26 留言:0更新日期:2018-07-14 10:55
本申请涉及计算机技术领域,尤其涉及一种交易行为风险识别方法及装置,在一种交易行为风险识别方法中,获取用户的当前交易行为的行为数据,并从行为数据中提取关键文本。对关键文本进行预处理,得到用户对应的第一词语集合。根据预设的词语集合中各个词语以及对应的权重值,确定第一词语集合中各个词语的权重值。根据第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定用户的当前交易行为与历史交易行为之间的偏移度;根据偏移度,对用户的当前交易行为进行风险识别。由此,可以提高交易行为风险识别的准确性。

Identification method and device of transaction behavior risk

This application relates to the field of computer technology, especially a method and device for identifying the risk of transaction behavior. In a transaction behavior risk identification method, the behavior data of the user's current transaction behavior is obtained, and the key text is extracted from the behavior data. The key words are preprocessed to get the first set of words corresponding to the user. According to each word in the preset word set and the corresponding weight value, the weight value of each word in the first word set is determined. According to the weight value of each word in the set of words and the weight values of each word set in the set of words, the offset degree between the current transaction behavior and the historical transaction behavior of the user is determined, and the user's current transaction behavior is identified according to the offset. Therefore, the accuracy of transaction risk identification can be improved.

【技术实现步骤摘要】
交易行为风险识别方法及装置
本申请涉及计算机
,尤其涉及一种交易行为风险识别方法及装置。
技术介绍
传统技术中,一般通过如下两种方法来对用户的交易行为进行风险识别:第一种方法是,基于个体行为参照的方法,即通过分析用户历史的交易行为的设备环境信息,如,用户过去常用的设备、无线网络(如,wifi)、IP地址、用户过去的实物交易笔数、虚拟交易笔数或者用户过去支付资金来源于余额、银行卡以及余额宝的比例等,来对用户当前的交易行为进行风险识别。如,当用户当前的交易行为的设备与用户过去常用的设备不一致时,也即当用户当前的交易行为的设备不是常用设备时,将该交易行为识别为有风险的交易行为。然而,该方法过于依赖用户的设备环境信息,如,当用户更换设备或者工作生活城市时,用户的设备环境信息会发生变化,上述方法会将用户的交易行为识别为有风险的交易行为,而事实上,该交易行为是安全的交易行为。由此可见,根据第一种方法,对用户的交易行为进行风险识别是不准确的。第二种方法是,基于群体行为参照的方法,即通过分析用户所在群体的行为特征,如,交易地点,交易时间,交易金额等,来对用户的交易行为进行风险识别。当用户的交易行为与其所在群体的行为特征不一致时,将该交易行为识别为有风险的交易行为。举例来说,假设用户所在群体为学生,该群体的行为特征包括:交易金额比较小且交易时间比较规律,一般集中在周末的白天。如果用户交易行为的交易金额巨大,且交易时间为上学时间时,将该用户的交易行为识别为有风险的交易行为。然而,该方法要求将用户划分到准确的群体中,且需要枚举出群体所有的行为特征。一旦用户被划分到错误的群体中,或者用户的交易行为为未被枚举到的行为特征时,则会误将安全的交易行为识别为有风险的交易行为,从而影响了用户的体验。
技术实现思路
本申请描述了一种交易行为风险识别方法及装置,可以提高交易行为风险识别的准确性。第一方面,提供了一种交易行为风险识别方法,包括:获取用户的当前交易行为的行为数据;从所述行为数据中提取关键文本;对所述关键文本进行预处理,得到所述用户对应的第一词语集合;根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;根据所述偏移度,对所述用户的当前交易行为进行风险识别。第二方面,提供了一种交易行为风险识别装置,包括:获取单元,用于获取用户的当前交易行为的行为数据;提取单元,用于从所述获取单元获取的所述行为数据中提取关键文本;预处理单元,用于对所述提取单元提取的所述关键文本进行预处理,得到所述用户对应的第一词语集合;确定单元,用于根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;所述确定单元,还用于根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;识别单元,用于根据所述确定单元确定的所述偏移度,对所述用户的当前交易行为进行风险识别。本申请提供的交易行为风险识别方法及装置,获取用户的当前交易行为的行为数据,并从行为数据中提取关键文本。对关键文本进行预处理,得到用户对应的第一词语集合。根据预设的词语集合中各个词语以及对应的权重值,确定第一词语集合中各个词语的权重值。根据第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定用户的当前交易行为与历史交易行为之间的偏移度;根据偏移度,对用户的当前交易行为进行风险识别。也即本申请是根据用户的当前交易行为与历史交易行为之间的偏移度,来对用户的交易行为进行风险识别,在偏移度不符合要求时,才将用户的交易行为识别为有风险的交易行为。由此,可以提高交易行为风险识别的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本申请提供的交易行为风险识别方法的应用场景示意图;图2为本申请一种实施例提供的交易行为风险识别方法流程图;图3为本申请提供的偏移度的示意图;图4为本申请另一种实施例提供的交易行为风险识别装置示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。本申请提供的交易行为风险识别方法可以应用于如图1所示的场景中,图1中,可以向交易行为偏移度计算模块中输入多个用户的当前交易行为的行为数据,以输入一个用户的当前交易行为的行为数据为例来说,交易行为偏移度计算模块可以预先搜集该用户历史购买商品的行为习惯,如,可以搜集该用户的历史交易行为的行为数据。之后,可以根据当前交易行为的行为数据和历史交易行为的行为数据,计算用户的当前交易行为的偏移度。最后,将用户的当前交易行为的偏移度输入到风险识别模块中,由风险识别模块根据该偏移度、该偏移度与基于个体行为参照的方法或者该偏移度与基于群体行为参照的方法,来对用户的当前交易行为的风险进行识别。需要说明的是,图1中,当用户的交易行为为用户购买商品的购买行为(也即支付行为)时,上述行为数据可以包括用户当前所购买商品的商品标题、交易时间以及交易金额等信息,其中,商品标题可以包括商品的商品名称和/或商品类目等。图2为本申请一种实施例提供的交易行为风险识别方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如图2所示,所述方法具体可以包括:步骤210,获取用户的当前交易行为的行为数据。此处,当用户的当前交易行为为用户购买商品的购买行为时,在用户在购物网站上下单并通过第三方支付系统请求支付时,服务器就可以获取到上述行为数据。该行为数据可以包括:用户当前所购买商品的商品标题、交易时间以及交易金额等信息,其中,商品标题可以包括商品的商品名称和/或商品类目等。当然,在实际应用中,商品类目也可以不包含在商品标题中。步骤220,从行为数据中提取关键文本。此处的关键文本可以包括购买的商品信息,如,商品的商品标题,或者,在商品标题中不包括商品类目时,上述商品信息也可以为商品类目。在本申请中,以关键文本为商品的商品标题为例来说。步骤230,对关键文本进行预处理,得到用户对应的第一词语集合。此处,对关键文本进行预处理可以包括:对关键文本进行分词处理和/或去除停用词和/或去除特殊字符等,其中,特殊字符可以包括:数字、英文字符以及标点符号等。由于上述行分词处理、去除停用词以及去除特殊字符的处理过程属于传统常规技术,本申请在此不复赘述。以关键文本为“网易一卡通30元卡密/梦幻西游30元点卡克寄售网易官方卡密自动”为例来说,得到的第一词语集合可以为:W={“网易”、“一卡通”、“梦幻西游”、“点卡”、“寄售”、“网易”、“官方”、“卡密”、“自动”}。步骤240,根据预设的词语集合中各个词语以及对应的权重值,确定第一词语集合中各个词语的权重值本文档来自技高网
...

【技术保护点】
1.一种交易行为风险识别方法,其特征在于,包括:获取用户的当前交易行为的行为数据;从所述行为数据中提取关键文本;对所述关键文本进行预处理,得到所述用户对应的第一词语集合;根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;根据所述偏移度,对所述用户的当前交易行为进行风险识别。

【技术特征摘要】
1.一种交易行为风险识别方法,其特征在于,包括:获取用户的当前交易行为的行为数据;从所述行为数据中提取关键文本;对所述关键文本进行预处理,得到所述用户对应的第一词语集合;根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;根据所述偏移度,对所述用户的当前交易行为进行风险识别。2.根据权利要求1所述的方法,其特征在于,在所述获取用户的当前交易行为的行为数据之前,还包括:确定所述预设的词语集合中各个词语对应的权重值的步骤,包括:获取与所述用户相关联的至少一个其它用户的历史交易行为的行为数据;根据各个其它用户的历史交易行为的行为数据,确定所述各个其它用户对应的词语集合;对所述预设的词语集合中的每个词语,确定所述词语在所述预设的词语集合中出现的次数;统计所述预设的词语集合中所包含词语的个数;根据所述各个其它用户对应的词语集合是否包含所述词语,从所述各个其它用户中选取目标用户;根据所述次数、所述词语的个数、总用户数以及所述目标用户的个数,确定所述词语的权重值。3.根据权利要求1或2所述的方法,其特征在于,所述根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,包括:对所述第一词语集合中的每个词语,将所述词语与预设的词语集合中的各个词语进行比对,若与所述预设的词语集合任一词语比对一致,则将所述任一词语对应的权重值确定为所述词语的权重值;否则将预设数值确定为所述词语的权重值。4.根据权利要求3所述的方法,其特征在于,所述预设数值为0。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度,包括:根据所述第一词语集合中各个词语的权重值,将所述用户的当前交易行为的行为数据表示为向量空间中的第一向量;根据所述预设的词语集合中各个词语的权重值,将所述用户的历史交易行为的行为数据表示为所述向量空间中的第二向量;确定所述第一向量与所述第二向量之间的夹角;将所述夹角确定为所述用户的当前交易行为与历史交易行为之间的偏移度。6.根据权利要求5所述的方法,其特征在于,所述确定所述第一向量与所述第二向量之间的夹角,包括:计算所述第一向量与所述第二向量之间的余弦距离;根据所述余弦距离,确定所述夹角。7.根据权利要求1-6任一项所述的方法,其特征在于,所述用户的当前交易行为为用户购买商品的购买行为,所述用户的历史交易行为的行为数据为...

【专利技术属性】
技术研发人员:郑霖
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1