【技术实现步骤摘要】
一种基于搜索引擎的实时识别欺诈团伙的方法及系统
本专利技术涉及数据搜索
,特别是涉及一种基于搜索引擎的实时识别欺诈团伙的方法及系统。
技术介绍
在金融领域,尤其是在互联网金融领域,由于存在线上交易的特性,线上团伙欺诈的风险比较高。同时随着互联网技术的发展,欺诈行为逐渐专业化,出现了很多的“新型手段”的金融欺诈的行为,并且团伙作案的趋势越来越明显。在现有技术中,一般基于传统数据库架构,即先将交易数据存储于数据库中,然后建立索引对数据进行分析查询,这样的架构不能对可疑事件进行及时响应,不具有实时性。同时由于缺乏对团伙欺诈类风险识别的有效手段,很难将欺诈份子一网打尽。因此,如何提供一种能够实时识别线上交易存在的欺诈风险成为本领域亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种基于搜索引擎的实时识别欺诈团伙的方法及系统,针对金融领域在线交易场景中面临的风险,对交易行为进行逐笔的事中监控,基于用户的历史交易行为数据,结合反欺诈风险数据,通过搜索引擎的强大搜索能力以及强大的地理空间分析能力,实 ...
【技术保护点】
1.一种基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述方法包括:/n获取交易事件中的历史交易数据和实时交易数据,所述历史交易数据和所述实时交易数据均包含埋点数据、业务数据和三方数据,所述埋点数据包括用户操作行为数据和用户所用设备信息;所述业务数据包括生成的商品订单的订单数据;所述三方数据包括用户征信信息;/n根据所述历史交易数据和实时交易数据,利用Elasticsearch搜索引擎提取用户特征数据,构建核心数据索引库和地理坐标索引库;所述用户特征数据包括用户基本特征数据、用户操作行为数据和用户衍生特征数据;所述用户衍生特征数据根据所述所述历史交易数据和实时交易数据衍 ...
【技术特征摘要】
1.一种基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述方法包括:
获取交易事件中的历史交易数据和实时交易数据,所述历史交易数据和所述实时交易数据均包含埋点数据、业务数据和三方数据,所述埋点数据包括用户操作行为数据和用户所用设备信息;所述业务数据包括生成的商品订单的订单数据;所述三方数据包括用户征信信息;
根据所述历史交易数据和实时交易数据,利用Elasticsearch搜索引擎提取用户特征数据,构建核心数据索引库和地理坐标索引库;所述用户特征数据包括用户基本特征数据、用户操作行为数据和用户衍生特征数据;所述用户衍生特征数据根据所述所述历史交易数据和实时交易数据衍生得到;
利用所述历史交易数据和实时交易数据构建用户生命周期的动态更新的关系图谱,所述用户生命周期为从注册、交易请求、交易中、交易后至交易结束的完整生命时间;
构建反欺诈引擎:所述反欺诈引擎由反欺诈规则和反欺诈模型组成;所述反欺诈规则为依据历史交易数据生成的用于比对所述实时交易数据的一部分数据确定是否存在欺诈风险的信息规则;所述反欺诈模型为依据历史交易数据利用机器学习算法生成的用于识别所述实时交易数据的另一部分数据是否存在欺诈风险的智能分类模型;
利用所述反欺诈引擎在所述核心数据索引库、所述地理坐标索引库和所述关系图谱实时在线识别所述实时交易数据存在的进行欺诈交易的用户。
2.根据权利要求1所述的基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述根据所述历史交易数据和实时交易数据,利用Elasticsearch搜索引擎提取用户特征数据,构建核心数据索引库和地理坐标索引库,具体包括:
提取所述历史交易数据和实时交易数据中用户基本特征,得到用户基本特征数据;所述用户基本特征包括用户的性别、年龄、婚姻状况、工作年限和最高学历的身份基本信息;
提取所述历史交易数据和实时交易数据中用户完成一笔交易所经历的行为特征,得到用户操作行为数据;所述行为特征包括用于从注册、登陆、申请、认证、审核、交易请求、交易生成以及交易后继续操作的操作过程中的时间信息、所用设备信息、请求信息、订单信息和地址信息;
根据所述历史交易数据和实时交易数据利用Elasticsearch搜索引擎进行变量衍生,得到衍生变量,即用户衍生特征数据;所述衍生变量包括用于基本信息衍生变量、黑名单类衍生变量和地理坐标衍生变量;
对所述用户特征数据进行实时流式处理,并进行倒排序,得到核心数据索引库;
抽取所述用户特征数据中的地理空间数据,转换成地理坐标导入Elasticsearch搜索引擎,建立以地理坐标为核心的地理坐标索引库。
3.根据权利要求1所述的基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述利用所述历史交易数据和实时交易数据构建用户生命周期的动态更新的关系图谱,具体包括:
抽取所述历史交易数据和实时交易数据中的不同数据源的用户特征数据;
对所述用户特征数据中的用户ID、身份证号码、电话号码、联系人电话号码、IP地址和设备号进行拓扑关联,得到关系网络;
将所述用户特征数据按照所述关系网络存入图数据库,得到关系图谱;
从所述用户生命周期的起点出发,连接所述用户生命周期中各个操作过程的数据流节点,对所述关系网络进行动态更新。
4.根据权利要求1所述的基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述构建反欺诈引擎:所述反欺诈引擎由反欺诈规则和反欺诈模型组成,具体包括:
将黑灰名单撞库规则、用户异常信息和行为检测规则、设备类及各类账户多头关联规则和用户信息一致性校验规则存入反欺诈规则;
利用K最近邻分类算法构建反欺诈模型:
选取一部分所述历史交易数据作为训练数据集;所述训练数据包括作为输入参数的用户特征数据和作为分类输出的用户风险偏好;所述用户风险偏好包括正常用户和欺诈用户;
计算所述实时交易数据中的新用户的用户特征数据与所述训练数据集中用户特征数据之间的距离;
按照递增顺序对所述距离进行排序,得到顺序距离集;
按照设定数量选取所述顺利距离集中距离最小值对应的所述实时交易数据中的新用户的用户特征数据作为样本数据集;
计算所述样本数据集中异常用户特征数据所占比例记为用户风险得分;
根据所述用户风险得分确定分类输出的用户风险偏好,得到训练好的反欺诈模型。
5.根据权利要求1所述的基于搜索引擎的实时识别欺诈团伙的方法,其特征在于,所述利用所述反欺诈引擎在所述核心数据索引库、所述地理坐标索引库和所述关系图谱实时在线识别所述实时交易数据存在的进行欺诈交易的用户,具体包括:
利用所述实时交易数据中的设备号作为搜索词,利用所述反欺诈引擎到所述核心数据索引库中检索查询出具有相同设备号的所有数据,再计算所述设备号对应的设备上在预设时间段内发生交易的总次数,当所述总次数大于交易次数阈值时确定所述设备号对应的用户为潜在欺诈用户;
将所述潜在欺诈用户的埋点数据中的地理空间数据,转换成地理坐标,再次利用所述反欺诈引擎到Elasticsearch搜索引擎的地理坐标索引库中进行检索,分析出与所述潜在欺诈用户的空间相似度在预设空间相似度阈值范围内的其他潜在欺诈用户;
再利用所述关...
【专利技术属性】
技术研发人员:徐玉立,张荣杰,陈望东,吴文烁,赵正丽,张连,陈凯旋,谢伟伟,
申请(专利权)人:广州及包子信息技术咨询服务有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。