互联网信贷场景下的实时欺诈检测方法及装置制造方法及图纸

技术编号:19009877 阅读:26 留言:0更新日期:2018-09-22 09:39
本发明专利技术提供了一种互联网信贷场景下的实时欺诈检测方法及装置,该方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据;基于授权数据构建目标用户的特征向量;通过K‑MEANS算法对特征向量进行训练,得到无监督反欺诈机器学习模型;通过无监督反欺诈机器学习模型对特征向量进行欺诈概率计算,得到目标用户的欺诈概率。该方法充分利用了目标用户的授权数据,对授权数据向量化得到特征向量,进而通过K‑MEANS算法建模得到无监督反欺诈机器学习模型,无监督反欺诈机器学习模型再对特征向量进行欺诈概率计算,得到目标用户的欺诈概率,该方法能够实时发现新式的欺诈模式,缓解了现有的欺诈检测方法无法在较短时间内识别出新式的欺诈模式的技术问题。

Real time fraud detection method and device under Internet credit scenario

The present invention provides a real-time fraud detection method and device in Internet credit scenario. The method includes: obtaining the authorization data sent by the target user after authorization through the Internet credit APP; constructing the feature vector of the target user based on the authorization data; training the feature vector through the K_MEANS algorithm, and obtaining the unsupervised. Supervised anti-fraud machine learning model; through unsupervised anti-fraud machine learning model to calculate the fraud probability of feature vectors, the fraud probability of the target user is obtained. This method makes full use of the authorized data of the target user, vectorizes the authorized data to get the eigenvector, and then builds the unsupervised anti-fraud machine learning model by K_MEANS algorithm. The unsupervised anti-fraud machine learning model calculates the fraud probability of the eigenvector and obtains the fraud probability of the target user. The method can discover new fraud patterns in real time and alleviate the technical problem that existing fraud detection methods can not identify new fraud patterns in a relatively short time.

【技术实现步骤摘要】
互联网信贷场景下的实时欺诈检测方法及装置
本专利技术涉及互联网信贷风控的
,尤其是涉及一种互联网信贷场景下的实时欺诈检测方法及装置。
技术介绍
互联网信贷产业,近几年得到了飞速发展,呈现出百家争鸣、百花齐放的局面,伴随着产业的欣荣发展,欺诈黑色产业链也在不断地渗透到该领域,各种新颖的欺诈模式层出不穷,对互联网信贷产业的健康发展蒙上了一层阴影。据不完全统计,每年因欺诈导致的损失在500亿—1000亿,欺诈风险已成为互联网信贷产业风险的重中之重。信贷产业防范欺诈的主要方法是基于规则引擎的方法和基于监督机器学习模型的方法,基于规则引擎的方法是通过将风控专家的经验知识转化为欺诈防范规则,通过规则引擎的方式进行匹配。基于监督机器学习模型的方法,通过将有欺诈行为的人群和没有欺诈行为的人群组合为样本数据,通过选取相应的特征,利用监督机器学习方法,构建模型,用以识别欺诈风险。上述两种方法在传统的信贷行业中,效果较为明显,然而在互联网信贷场景下,在互联网的大背景下,创新业务发展迅速,因此,针对各种业务场景下的欺诈手段和技术也在不断更新,基于规则引擎和监督机器学习模型的方法都是根据现有的欺诈模式得到的模型,只能识别现有的欺诈模式,无法在较短时间内识别新式的欺诈模式。综上,现有的信贷产业防范欺诈的方法无法在较短时间内识别出新式的欺诈模式。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种互联网信贷场景下的实时欺诈检测方法及装置,以缓解现有的信贷产业防范欺诈的方法无法在较短时间内识别出新式的欺诈模式的技术问题。第一方面,本专利技术实施例提供了一种互联网信贷场景下的实时欺诈检测方法,所述方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,基于所述授权数据构建所述目标用户的特征向量包括:对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量,操作行为特征向量。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量包括:获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次,IP的申请频次,设备电量占比,陀螺仪的平均加速度;结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;基于所述目标用户所属的人群分布计算所述统计特征向量。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量包括:将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据得到的关系图谱;通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,对所述目标用户的行为数据进行计算,得到所述行为特征向量包括:在所述目标用户的行为数据中提取输入行为数据;根据所述输入行为数据计算输入行为的输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差,其中,所述输入行为包括:输入身份证号的行为,输入手机号的行为,输入银行卡号的行为,所述方差用于表示输入字符间隔的波动情况;将所述输入总耗时,所述输入平均耗时,所述输入字符的平均间隔耗时,所述方差作为所述目标用户的所述输入行为特征向量;在所述目标用户的行为数据中提取操作行为数据;对所述操作行为数据进行分析,得到操作行为的操作时延序列,其中,所述操作行为为操作所述互联网信贷APP的行为;将所述操作时延序列作为所述操作行为特征向量。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,所述方法还包括:通过所述无监督反欺诈机器学习模型对所述目标用户所属的群体进行欺诈概率计算,得到所述群体的欺诈概率。结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,所述方法还包括:通过统计分析方法对所述目标用户所属的群体的操作行为进行计算,得到所述群体的行为模式向量;对所述行为模式向量进行实时监控;当所述行为模式向量出现显著变化时,确定所述群体为具有潜伏期的欺诈群体。第二方面,本专利技术实施例还提供了一种互联网信贷场景下的实时欺诈检测装置,所述装置包括:获取模块,用于获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;构建模块,用于基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;训练模块,用于通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;第一欺诈概率计算模块,用于通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,所述构建模块包括:第一计算单元,用于对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;第二计算单元,用于对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;第三计算单元,用于对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量,操作行为特征向量。结合第二方面,本专利技术实施例提供了第二方面的第二种可能的实施方式,其中,所述第一计算单元包括:获取子单元,用于获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;第一提取子单元,用于基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次,IP的申请频本文档来自技高网...
互联网信贷场景下的实时欺诈检测方法及装置

【技术保护点】
1.一种互联网信贷场景下的实时欺诈检测方法,其特征在于,所述方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;通过K‑MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。

【技术特征摘要】
1.一种互联网信贷场景下的实时欺诈检测方法,其特征在于,所述方法包括:获取目标用户通过互联网信贷APP授权后发送的授权数据,其中,所述授权数据包括:所述目标用户的设备数据,所述目标用户的行为数据,所述目标用户的社交数据,所述目标用户的申请业务数据;基于所述授权数据构建所述目标用户的特征向量,其中,所述特征向量包括:统计特征向量,关系特征向量,行为特征向量;通过K-MEANS算法对所述特征向量进行训练,得到无监督反欺诈机器学习模型;通过所述无监督反欺诈机器学习模型对所述特征向量进行欺诈概率计算,得到所述目标用户的欺诈概率。2.根据权利要求1所述的方法,其特征在于,基于所述授权数据构建所述目标用户的特征向量包括:对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量;对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量;对所述目标用户的行为数据进行计算,得到所述行为特征向量,其中,所述行为特征向量包括:输入行为特征向量,操作行为特征向量。3.根据权利要求2所述的方法,其特征在于,对所述目标用户的行为数据和所述目标用户的设备数据进行计算,得到所述统计特征向量包括:获取非欺诈人群的目标特征范围和欺诈人群的目标特征范围;基于所述目标用户的行为数据和所述目标用户的设备数据提取所述目标用户的目标特征,其中,所述目标用户的目标特征包括:地理信息申请频次,IP的申请频次,设备电量占比,陀螺仪的平均加速度;结合所述非欺诈人群的目标特征范围,所述欺诈人群的目标特征范围以及所述目标用户的目标特征,确定所述目标用户所属的人群分布;基于所述目标用户所属的人群分布计算所述统计特征向量。4.根据权利要求2所述的方法,其特征在于,对所述目标用户的社交数据,所述目标用户的申请数据和所述目标用户的设备数据进行计算,得到所述关系特征向量包括:将所述目标用户的设备数据,所述目标用户的社交数据以及所述目标用户的申请数据与历史关系图谱建立关联,其中,所述历史关系图谱为根据历史授权数据得到的关系图谱;通过社区发现算法对所述历史关系图谱进行计算,得到所述目标用户所属的社交群体;通过所述社交群体的欺诈风险更新所述历史关系图谱中边的权重值,得到更新后的关系图谱,其中,所述社交群体的欺诈风险为根据所述历史授权数据获得的;通过随机游走算法和node2vector对所述更新后的关系图谱进行计算,得到所述关系特征向量。5.根据权利要求2所述的方法,其特征在于,对所述目标用户的行为数据进行计算,得到所述行为特征向量包括:在所述目标用户的行为数据中提取输入行为数据;根据所述输入行为数据计算输入行为的输入总耗时,输入平均耗时,输入字符的平均间隔耗时,方差,其中,所述输入行为包括:输入身份证号的行为,...

【专利技术属性】
技术研发人员:于皓张杰李犇张涧张卓博
申请(专利权)人:阳光财产保险股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1