This application relates to the field of computer technology, especially a method and device for identifying the risk of transaction behavior. In a transaction behavior risk identification method, the behavior data of the user's current transaction behavior is obtained, and the key text is extracted from the behavior data. The key words are preprocessed to get the first set of words corresponding to the user. According to each word in the preset word set and the corresponding weight value, the weight value of each word in the first word set is determined. According to the weight value of each word in the set of words and the weight values of each word set in the set of words, the offset degree between the current transaction behavior and the historical transaction behavior of the user is determined, and the user's current transaction behavior is identified according to the offset. Therefore, the accuracy of transaction risk identification can be improved.
【技术实现步骤摘要】
交易行为风险识别方法及装置
本申请涉及计算机
,尤其涉及一种交易行为风险识别方法及装置。
技术介绍
传统技术中,一般通过如下两种方法来对用户的交易行为进行风险识别:第一种方法是,基于个体行为参照的方法,即通过分析用户历史的交易行为的设备环境信息,如,用户过去常用的设备、无线网络(如,wifi)、IP地址、用户过去的实物交易笔数、虚拟交易笔数或者用户过去支付资金来源于余额、银行卡以及余额宝的比例等,来对用户当前的交易行为进行风险识别。如,当用户当前的交易行为的设备与用户过去常用的设备不一致时,也即当用户当前的交易行为的设备不是常用设备时,将该交易行为识别为有风险的交易行为。然而,该方法过于依赖用户的设备环境信息,如,当用户更换设备或者工作生活城市时,用户的设备环境信息会发生变化,上述方法会将用户的交易行为识别为有风险的交易行为,而事实上,该交易行为是安全的交易行为。由此可见,根据第一种方法,对用户的交易行为进行风险识别是不准确的。第二种方法是,基于群体行为参照的方法,即通过分析用户所在群体的行为特征,如,交易地点,交易时间,交易金额等,来对用户的交易行为进行风险识别。当用户的交易行为与其所在群体的行为特征不一致时,将该交易行为识别为有风险的交易行为。举例来说,假设用户所在群体为学生,该群体的行为特征包括:交易金额比较小且交易时间比较规律,一般集中在周末的白天。如果用户交易行为的交易金额巨大,且交易时间为上学时间时,将该用户的交易行为识别为有风险的交易行为。然而,该方法要求将用户划分到准确的群体中,且需要枚举出群体所有的行为特征。一旦用户被划分到错误的群 ...
【技术保护点】
1.一种交易行为风险识别方法,其特征在于,包括:获取用户的当前交易行为的行为数据;从所述行为数据中提取关键文本;对所述关键文本进行预处理,得到所述用户对应的第一词语集合;根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;根据所述偏移度,对所述用户的当前交易行为进行风险识别。
【技术特征摘要】
1.一种交易行为风险识别方法,其特征在于,包括:获取用户的当前交易行为的行为数据;从所述行为数据中提取关键文本;对所述关键文本进行预处理,得到所述用户对应的第一词语集合;根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,其中,所述预设的词语集合是根据所述用户的历史交易行为的行为数据得到的;根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度;根据所述偏移度,对所述用户的当前交易行为进行风险识别。2.根据权利要求1所述的方法,其特征在于,在所述获取用户的当前交易行为的行为数据之前,还包括:确定所述预设的词语集合中各个词语对应的权重值的步骤,包括:获取与所述用户相关联的至少一个其它用户的历史交易行为的行为数据;根据各个其它用户的历史交易行为的行为数据,确定所述各个其它用户对应的词语集合;对所述预设的词语集合中的每个词语,确定所述词语在所述预设的词语集合中出现的次数;统计所述预设的词语集合中所包含词语的个数;根据所述各个其它用户对应的词语集合是否包含所述词语,从所述各个其它用户中选取目标用户;根据所述次数、所述词语的个数、总用户数以及所述目标用户的个数,确定所述词语的权重值。3.根据权利要求1或2所述的方法,其特征在于,所述根据预设的词语集合中各个词语以及对应的权重值,确定所述第一词语集合中各个词语的权重值,包括:对所述第一词语集合中的每个词语,将所述词语与预设的词语集合中的各个词语进行比对,若与所述预设的词语集合任一词语比对一致,则将所述任一词语对应的权重值确定为所述词语的权重值;否则将预设数值确定为所述词语的权重值。4.根据权利要求3所述的方法,其特征在于,所述预设数值为0。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一词语集合中各个词语的权重值以及预设的词语集合中各个词语的权重值,确定所述用户的当前交易行为与历史交易行为之间的偏移度,包括:根据所述第一词语集合中各个词语的权重值,将所述用户的当前交易行为的行为数据表示为向量空间中的第一向量;根据所述预设的词语集合中各个词语的权重值,将所述用户的历史交易行为的行为数据表示为所述向量空间中的第二向量;确定所述第一向量与所述第二向量之间的夹角;将所述夹角确定为所述用户的当前交易行为与历史交易行为之间的偏移度。6.根据权利要求5所述的方法,其特征在于,所述确定所述第一向量与所述第二向量之间的夹角,包括:计算所述第一向量与所述第二向量之间的余弦距离;根据所述余弦距离,确定所述夹角。7.根据权利要求1-6任一项所述的方法,其特征在于,所述用户的当前交易行为为用户购买商品的购买行为,所述用户的历史交易行为的行为数据为...
【专利技术属性】
技术研发人员:郑霖,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。