【技术实现步骤摘要】
一种互联网金融欺诈行为在线检测方法及其装置
本专利技术涉及互联网金融行业的风控
,特别涉及一种互联网金融欺诈行为在线检测方法及其装置。
技术介绍
传统的反欺诈检测方法主要是依赖先验知识制定的基于预先定义的反欺诈规则和有监督的机器学习算法,但对于日新月异的欺诈手段和缺乏足够的先验知识情况下,这种传统的反欺诈检测方法,还是存在一定的滞后性,不能实时检测识别新型的欺诈行为而造成大量信贷损失。传统的K-means算法的步骤如下:(1)输入数据集D,类的数目k;(2)从数据集X中任选(即随机选取)k个对象作为类的初始中心;(3)根据类的初始中心与数据集X中每个对象的距离,将对象指派到最近的类中;(4)重新计算每个类的中心(即每个类的均值);(5)重复(3)和(4),直到每个类的中心不再变化。K-Means算法能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类,需要调参的参数仅仅是簇数k,收敛速度快,实现容易,聚类效果较好,可解释度比较强。
技术实现思路
为了解决上述技术问题,本专利技术中披露 ...
【技术保护点】
1.一种互联网金融欺诈行为在线检测方法,其特征在于,包括以下步骤:/n步骤一:采集模型数据及切分样本:采集已成功放款的用户的申请、操作及还款行为数据,根据欺诈行为特征,提取具有代表性的欺诈行为属性,并随机切分为训练样本和验证样本;/n步骤二:数据预处理:对所述训练样本中的数据进行统计性描述和校验,剔除无关维度及与实际业务不符的异常数据,然后对相同属性数据进行标准化处理,得到标准化样本;/n步骤三:确定聚类种类及选取聚心:基于标准化样本,通过计算Calinski-HarabaszIndex的方法确定聚类的种类K的最优值,并随机选取标准化样本的K个聚心;/n步骤四:计算欧式距离 ...
【技术特征摘要】
1.一种互联网金融欺诈行为在线检测方法,其特征在于,包括以下步骤:
步骤一:采集模型数据及切分样本:采集已成功放款的用户的申请、操作及还款行为数据,根据欺诈行为特征,提取具有代表性的欺诈行为属性,并随机切分为训练样本和验证样本;
步骤二:数据预处理:对所述训练样本中的数据进行统计性描述和校验,剔除无关维度及与实际业务不符的异常数据,然后对相同属性数据进行标准化处理,得到标准化样本;
步骤三:确定聚类种类及选取聚心:基于标准化样本,通过计算Calinski-HarabaszIndex的方法确定聚类的种类K的最优值,并随机选取标准化样本的K个聚心;
步骤四:计算欧式距离及分簇:计算每个标准化样本点到K个聚心的欧氏距离,从中找出欧式距离最小值所对应的聚心,并将该标准化样本划分到该聚心所对应的簇中;
步骤五:收敛聚心:重新计算簇的聚心,并与之前的聚心比较,若聚心改变,则重复步骤三和步骤四,直到聚心保持不变,完成聚类训练;
步骤六:分簇判定正常异常分类及模型优化:采用少数服从多数原则,判定K个簇各自属于正常类还是异常类,得到无监督模型,将所述无监督模型应用于验证样本,分类结果结合用户的贷后表现进行比对,判定模型的异常检测的准确率,并重新拟合优化模型;
步骤七:在线欺诈行为检测:将步骤六优化后的无监督模型部署至金融平台,通过最近邻规则、边界规则和阈值规则来对用户在线实时欺诈检测,监控到异常信息后进行自动推送,实现对客户的实时监控和异常预警处理。
2.根据权利要求1所述的一种互联网金融欺诈行为在线检测方法,其特征在于,步骤二中所述的准化处理具体包括:
首先计算每个特征的均值为:
然后计算每个特征的平均绝对偏差为:
最后进行标准化计算为:
上述式中,Zif表示第i个训练样本的f特征的值,xif表示第i个训练样本的f特征的归一化之后的值,其中i=1,2,3,4,…,n,n表示训练样本的个数。
3.根据权利要求1所述的一种互联网金融欺诈行为在线检测方法,其特征在于,步骤三中所述的通过计算Calinski-HarabaszIndex的方法确定聚类的种类K的最优值包括:首先将K设为或log(n),然后通过采用Calinski-HarabaszIndex,对K的取值进行验证优化,根据Calinski-HarabaszIndex值越大聚类效果越好的原则,确定K的最优值,所述Calinski-HarabaszIndex的计算公式为:
在...
【专利技术属性】
技术研发人员:江远强,
申请(专利权)人:百维金科上海信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。