【技术实现步骤摘要】
一种基于文本转义为GPS距离的资料虚假识别系统及方法
[0001]本专利技术属于大数据
,具体涉及一种基于文本转义为GPS距离的资料虚假识别系统及方法。
技术介绍
[0002]随着互联网金融的出现,充分利用其开放性和便利性,资金需求方和资金供应商可以通过网络平台更快地完成信息筛选、匹配和交易,实现透明准确的对接。让资金流向有需要的人,从而帮助实体经济,引导资金脱离虚拟现实。但同时,这种非接触式的授信模式,也给金融机构的欺诈风控工作带来了严峻的挑战。很多黑产从业者瞄准了互联网信贷业务,通过包装资料、提供虚假资料等方式进行贷款申请以达到诈骗金融机构资金的目的。金融机构如何验证客户提交资料的真实性,一直是各家金融机构重点研究的课题。这些信息都是文本类信息。当前行业中,对于文本信息的应用还比较少,一般的方法是进行文本间全相等或包含的运算,如何量化风险一直是行业的难题。经查,未发现类似的专利文献。
[0003]基于此,为充分挖掘文本中蕴含的信息,本文提出了一种基于文本转义为GPS距离的资料虚假识别方法、系统,通过对客户所 ...
【技术保护点】
【技术特征摘要】
1.一种基于文本转义为GPS距离的资料虚假识别系统,其特征在于,包括:类地址数据跑批模块:用于汇总来自于各个来源的客户类地址文本信息;同质信息聚类模块:用于对类地址文本信息进行同质聚类;文本转义为GPS经纬度模块:用于将所有类地址文本信息转化为GPS经纬度;经纬度距离计算模块:用于汇总所有GPS经纬度,计算任意两组GPS经纬度对之间的距离;资料虚假模型模块:用于根据经纬度距离计算模块计算出的距离特征,构建资料虚假模型;决策模块:用于根据资料虚假模型对客户信息分析后输出的结果对客户进行风险评估,输出风险结果。2.一种基于文本转义为GPS距离的资料虚假识别方法,其特征在于,包括以下步骤:步骤1:当客户发起一笔授信申请时,类地址数据跑批模块汇总来自于各个来源的客户类地址文本信息;步骤2:同质信息聚类模块对所有类地址文本信息进行同质聚类,将类地址文本信息分为IP类信息、手机号类信息、公司名称类信息和公司地址类信息;步骤3:文本转义为GPS经纬度模块将所有类地址文本信息转化为GPS经纬度;步骤4:经纬度距离计算模块汇总所有簇的GPS经纬度,计算任意两组GPS经纬度对之间的驾车距离,作为两两地址间的距离;步骤5:资料虚假模型模块基于步骤4计算得到的距离特征,构建资料虚假模型;步骤6:决策模块根据资料虚假模型输出的结果对客户进行风险评估,输出风险结果。3.根据权利要求2所述的一种基于文本转义为GPS距离的资料虚假识别方法,其特征在于,步骤1中所述的类地址文本信息包括:客户填写的资料信息、移动端设备采集到的信息以及通过外部三方数据机构获取到的信息。4.根据权利要求2所述的一种基于文本转义为GPS距离的资料虚假识别方法,其特征在于,步骤2中所述的IP类信息包括:注册时的IP地址、申请时的IP地址、提现时的IP地址、登录时的IP地址、找回登录密码时的IP地址以及绑卡时的IP地址;所述手机号类信息包括客户注册手机号、银行卡预留手机号、第一联系人手机号、关联的车商手机号、关联的销售人员手机号、法人或实控人手机号、配偶电话、点位电话、住宅化以及人行报告的手机号列表;所述公司名称类信息包括客户填写的公司名称、工商信息公司注册名称、关联的经销商名称、公积金缴存单位、社保单位名称、人行工作单位列表;所述地址明细类信息包括:客户填写的公司地址、客户身份证地址、客户公司工商信息注册地址、身份证签发机关地址、客户填写的家庭地址、客户授信申请时的GPS地址、客户借款申请时的GPS地址以及人行报告的工作单位地址列表。5.根据权利要求2所述的一种基于文本转义为GPS距离的资料虚假识别方法,其特征在于,步骤3中将类地址文本信息转化为GPS经纬度具体包括以下方法:IP类信息转化为GPS经纬度:调用地图服务商的普通IP定位服务,根据IP定位来获取大致位置,利用IP获取大致位置,调用API接口,返回请求参数中指定上网IP的经纬度,该经纬度为当前城市中心点的经度和维度,以此作为IP地址的经纬度;手机号类信息转化为GPS经纬度:通过调用手机号归属地查询接口,得到各个手机号地
址的归属城市,再查询归属城市中心点经纬度,以此作为手机号类地址的经纬度;公司名称类信息转化为GPS经纬度:通...
【专利技术属性】
技术研发人员:王萍,张卓,贾坤,
申请(专利权)人:四川新网银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。