一种融合用户埋点行为信息的欺诈用户识别算法框架制造技术

技术编号：36551113 阅读：11 留言：0更新日期：2023-02-04 17:04

本发明专利技术公开了一种融合用户埋点行为信息的欺诈用户识别算法框架，包括以下步骤：(1)记录用户申请授信前一小时内客户端的点击行为及停留时长，生成页面(p)+点击按钮(b)+停留时长(t)三元组合。本发明专利技术相比传统的RFM特征衍生方式，改用当下流行的词向量表征，可以在减少信息损失的同时更好表征序列行为；利用随机游走算法解决短期样本量不足的情况，从而生成更多的随机序列行为用于词向量的训练；对于序列行为信息中比较关注的时间间隔特征，将行为信息的组合从页面+按钮转换成页面+按钮+停留时长分级，从而更精准的区分正常用户和异常用户的区别即使两人在相同的页面相同的点击行为，但是停留时长不同。但是停留时长不同。但是停留时长不同。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合用户埋点行为信息的欺诈用户识别算法框架

[0001]本专利技术涉及信贷反欺诈领域，特别涉及一种融合了埋点行为序列的特征工程算法。

技术介绍

[0002]信贷反欺诈系统是指通过收集用户的各种行为表现，申请信息，评估用户是否为欺诈用户的一整套系统。目前已经广泛应用在线上线下的金融支付风控体系中。
[0003]反欺诈系统中的概率预估指的是根据用户的属性、历史行为、物料的属性等信息判断用户未来是否是欺诈用户。当系统将欺诈概率较高的用户识别出后，会交给策略信审通过电话等方式做二次核验，确认用户的真实性。
[0004]埋点行为序列信息指的是用户在客户端申请借贷时，在一个sessionid内时间序列上的一连串行为，通常由所在页面+点击按钮+停留时长三要素组合；
[0005]用户的埋点序列行为作为对于识别欺诈用户行为能起到一定的识别作用。比如欺诈用户可能批量输入地址信息，或者操作流程全程没有任何跳转停顿，或者对于团伙欺诈可能存在短期内同一个IP或者同一个时段有很多人有着相同的行为序列信息，就存在团伙欺诈的可能性；
[0006]传统的序列行为特征工程方法是按照过去XX时间在XX页面的点击次数，停留时长等聚合统计的方式做衍生，这种方法可解释性强，特征定义直观，但是缺点则是缺乏对埋点行为前后关系的衍生；二是统计方法相对宽泛，容易出现特征相似性高导致最终特征预测效果差；
[0007]所以如何用数据建模的方法量化这类行为信息，又能比传统方法效果更好是本次专利技术的出发点。

技术实现思路
<...

【技术保护点】

【技术特征摘要】
1.一种融合用户埋点行为信息的欺诈用户识别算法框架，其特征在于，包括以下步骤：(1)记录用户申请授信前一小时内客户端的点击行为及停留时长，生成页面(p)+点击按钮(b)+停留时长(t)三元组合，其中停留时长需要根据历史数据分析按照正常，太快，太慢三种情况分类，三元组合可以重复出现，比如点击后返回又再次点击，最终行为序列以用户退出授信流程或者提交申请为截止标志；同时记入用户特征信息(如年龄、性别、地域等)、申请时段(几点，星期几等)；(2)将用户行为数据转换成<p1b1t1,p2b2t2....pnbntn>的三元序列文本形式，一共N类三元组合；(3)将每个用户行为序列都拆分成<p1b1t1,p2b2t2>...<p
n
‑1b
n
‑1t
n
‑1,p
n
b
n
t
n
&g...

【专利技术属性】
技术研发人员：朱力波，钟艳明，
申请(专利权)人：天翼电子商务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人