一种基于LOF算法的互联网金融申请反欺诈识别方法技术

技术编号：26068117 阅读：11 留言：0更新日期：2020-10-28 16:41

本发明专利技术提供了一种基于LOF算法的互联网金融申请反欺诈识别方法，包括采集数据并对其进行预处理；进行数据特征选择，获得LOF算法的数据集并将数据集随机划分为不同的数据子集；计算数据点的局部可达距离、局部密度可达密度以及局部离群因子LOF值；利用LOF值来判断数据点是不是离群点来作为该申请行为是否属于欺诈行为。实施本发明专利技术技术方案，有效缩短了异常点检测的运行时间，提高了高维大数据集异常值检测的效率，能够对互联网申请行为实时监控，及时准确检测发现申请异常欺诈行为，减少信贷损失，更加适合当前大数据风控的需要。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于LOF算法的互联网金融申请反欺诈识别方法
本专利技术涉及互联网金融行业的风控
，特别涉及。
技术介绍
随着互联网金融的发展，灰产、黑产等欺诈行为的种类和方式也越来越多，据不完全统计，每年因欺诈导致的损失可达到500亿—1000亿，欺诈风险已成为互联网金融防范风险的重中之重。从统计学来说，欺诈行为相对正常行为属于离群点，在数据的散布图中，它们远离其它数据点，其属性值显著地偏离期望或常见的属性值，离群点检测是成为金融反欺诈的一种常用方法，如何有效地检测出在高度可能性的欺诈行为，成为各大金融机构的反欺诈的主要工作。现有技术中，离群点检测方法主要有三种：基于统计的离群点检测方法(HBOS:基于直方图的异常值得分)、基于距离的离群点检测方法(如K最近邻KNN)及基于聚类的离群点检测方法(如K均值聚类K-means、DBSCAN)等，但现有技术的算法均较复杂、运算量大、时间复杂度大及精度不高等问题，对于高维大数据检测效率较低。如何减少离群点检测的计算量及运行时长成为亟待解决的技术问题。LOF算法(LocalOutlierFactor，局部离群因子)是基于密度的异常数据检测方法，该算法引入每一个数据对象的可达距离和可达密度的概念，来判断一个数据对象是否是离群点，针对数据集中的每个数据计算一个局部异常因子LOF，来反映一个数据的异常程度，因为LOF算法对密度的衡量是通过点的第k邻域来计算，仅对可能出现离群点的边界单元进行离群点的挖掘，而不是全局计算，且在样本空间数据分布不均匀的情况下也可以准确发...

【技术保护点】
1.一种基于LOF算法的互联网金融申请反欺诈识别方法，其特征在于，包括以下步骤：/n步骤一：采集客户端上客户申请提现的操作埋点数据、个人基本信息以及客户授权的第三方数据；/n步骤二：数据预处理，包括异常值处理和归一化处理；/n步骤三：针对信贷欺诈的行为特征类型，进行数据特征选择，获得LOF算法的数据集，并将数据集随机划分为不同的数据子集；/n步骤四：基于数据子集，通过LOF算法先计算数据子集中对象p的第K距离领域，然后计算出对象p的局部可达距离；/n步骤五：根据局部可达距离，计算对象p的局部可达密度；/n步骤六：根据局部可达密度，计算对象p的局部异常因子LOF值；/n步骤七：递归步骤一至步骤六，在循环计算中，将获得的LOF值与设定的阈值ψ比较，LOF值小于阈值ψ的对象判定为正常点，不断剔除，LOF值大于阈值ψ的对象判定为异常点，将异常点输出。/n

【技术特征摘要】
1.一种基于LOF算法的互联网金融申请反欺诈识别方法，其特征在于，包括以下步骤：
步骤一：采集客户端上客户申请提现的操作埋点数据、个人基本信息以及客户授权的第三方数据；
步骤二：数据预处理，包括异常值处理和归一化处理；
步骤三：针对信贷欺诈的行为特征类型，进行数据特征选择，获得LOF算法的数据集，并将数据集随机划分为不同的数据子集；
步骤四：基于数据子集，通过LOF算法先计算数据子集中对象p的第K距离领域，然后计算出对象p的局部可达距离；
步骤五：根据局部可达距离，计算对象p的局部可达密度；
步骤六：根据局部可达密度，计算对象p的局部异常因子LOF值；
步骤七：递归步骤一至步骤六，在循环计算中，将获得的LOF值与设定的阈值ψ比较，LOF值小于阈值ψ的对象判定为正常点，不...

【专利技术属性】
技术研发人员：江远强，
申请(专利权)人：百维金科上海信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人