一种金融信用度的模糊动态加权匹配方法及系统技术方案

技术编号:27032898 阅读:19 留言:0更新日期:2021-01-12 11:16
本发明专利技术公开了一种金融信用度的模糊动态加权匹配方法及系统,由设有神经网络架构的模型内的程序或系统进行完成具体包括如下步骤:(1)收集目标客户的指标明细表,(2)按照预定规则对指标明细表进行权重比划分,构建系统的核心指标参数,(3)关联与目标客户的核心指标参数的基本数据,(4)对所述核心指标参数的基本数据进行英文和/或数字化表达,(5)分别对基本数据进行定义编号,根据公式计算核心指标参数进行单一的匹配度和相似度计算,(6)根据定义好的基本数据的权重比进行综合加权匹配度计算,(7)输出匹配度阈值列表结果。本发明专利技术通过模糊动态加权匹配以提高目标客户的身份识别管理效率以及信用精准度可信度的问题。

【技术实现步骤摘要】
一种金融信用度的模糊动态加权匹配方法及系统
本专利技术涉及数据处理
,具体涉及是一种金融信用度的模糊动态加权匹配方法及系统。
技术介绍
现有技术中,有较多的反洗钱的系统和方法,但其系统本身受限于自身对客户身份识别的能力,现有技术的系统对已有黑名单匹配方法主要存在以下三个问题:一是对第三方黑名单数据库中客户的信息利用不全面,比如对住址信息等文本数据的挖掘有限;二是黑名单匹配规则存在不合理现象,不能实现真正的动态加权;三是部分黑名单匹配方式不支持多语言的模糊搜索。因此,在实现在建立客户关系以及处理客户资金交易环节等场景中自然人或机构客户及其受益人的身份识别管理问题存在一定技术缺陷。
技术实现思路
本专利技术的目的在于提供一种金融信用度的模糊动态加权匹配方法,以解决提高目标客户的身份识别管理效率以及信用精准度可信度的问题。为实现上述目的,本专利技术提供如下技术方案:一种金融信用度的模糊动态加权匹配方法,具体包括如下步骤:(1)收集目标客户的指标明细表,(2)按照预定规则对指标明细表进行权重比划分,构建系统的核心指标参数,(3)关联与目标客户的核心指标参数的基本数据,(4)对所述核心指标参数的基本数据进行英文和/或数字化表达,(5)分别对基本数据进行定义编号,根据公式计算核心指标参数进行单一的匹配度和相似度计算,(6)根据定义好的基本数据的权重比进行综合加权匹配度计算,(7)输出匹配度阈值列表结果。>优选地,所述指标明细表包括但不限于来源于人民银行公共信用信息系统、金融机构的违约信息和事业单位缴费信息数据。优选地,所述预定规则为。优选地,所述基本数据包括但不限于目标客户的名称、证件类型、证件号码、出生/注册日期、性别属性、国籍、籍贯和所属行业。优选地,所述匹配度计算公式为其中,d(NPi,NPj)表示输入自然人客户或机构客户的名称字符串NPi和黑名单数据库中疑似自然人客户或机构客户的名称字符串NPj的最短编辑距离;lNPi和lNPj分别表示自然人客户或机构客户的名称字符串NPi和NPj的长度;max(lNPi,lNPj)表示lNPi和lNPj中的最大值;PP01为控制参数。优选地,所述相似度运算公式为其中,a,b分别为地址字符串在空间向量模型中的向量,ai,bi分别为向量a,b的第i个元素。结果越接近1表示两地址相似性越高;越接近于0,表示两地址越不相近。优选地,所述综合加权匹配度的公式为优选地,所述匹配度阈值的可信度定义如下:MP≥90定为精确,MP≥70定为近似,MP≥50定为广泛。本专利技术还提供了一种金融信用度的模糊动态加权匹配系统,由设有神经网络架构的模型内的程序或系统进行完成。与现有技术相比,本专利技术具有以下几个方面的有益效果:1.基于人工智能构建反洗钱黑名单匹配模型,提高整体匹配的速度和准确度。特别地,对于地址信息采用Doc2vec空间向量模型对文本数据进行深度挖掘和语义分析,以达到根据不同国籍不同情境也能自学习文本语义,具备高度自适应性的效果,从而提高文本匹配的准确度。2.模糊匹配与精准匹配相结合,根据机构输入客户信息和主流黑名单数据库中客户信息的存储数据自身属性特征和不同国籍的风俗习惯施以不同的匹配方法和权重,实现个性化的反洗钱黑名单模糊匹配方案。3.基于客户核心指标构建动态加权综合匹配模型,开发了支持中文简体、中文繁体、中文拼音、粤语拼音和英语等主流语言、广泛、近似、精确等多层次检索的反洗钱黑名单模糊匹配系统。附图说明图1为反洗钱黑名单模糊动态加权匹配流程图。具体实施方式下面结合具体实施方式对本专利技术的技术方案作进一步详细地说明。实施例本实施例公开了一种金融信用度的模糊动态加权匹配方法,具体包括如下步骤:(1)收集目标客户的指标明细表,(2)按照预定规则对指标明细表进行权重比划分,构建系统的核心指标参数,(3)关联与目标客户的核心指标参数的基本数据,301、输入自然人客户或机构客户的名称;302、输入自然人客户或机构客户的证件类型和证件号码;301、302必须选一项;303、输入自然人客户的出生日期(YYYYMMDD);304、输入自然人客户的性别(可选);305、输入自然人客户或机构客户的国籍(可选);306、输入自然人客户或机构客户的地址(可选);307、输入机构客户的行业(可选)。(4)对所述核心指标参数的基本数据进行英文和/或数字化表达,401、将自然人客户的名称按名、中间字和姓存放,非拼音形式转化为拼音形式;402、将自然人客户的第一代身份证号码转变为二代身份证号码;403、将自然人客户的出生日期按YYYYMMDD形式存放,区分年月日;对于缺少信息的情形,统一预处理修正为YYYY、MM和DD的不同组合形式;404、将自然人客户的性别男/male转化为0,女/female转化为1;405、将自然人客户或机构客户的非英语形式的国籍转化为英语;406、将自然人客户或机构客户的地址按照国籍+城市/区域(省+市+区)+乡镇/街道+详细地址的结构翻译为英语,构建住址词典库与住址停用词库(包括road,city等),利用TF-IDF权重提取法、词典匹配法提取地址的关键词信息;407、将机构客户的非英语形式的行业转化为英语;(5)分别对基本数据进行定义编号,根据公式计算核心指标参数进行单一的匹配度和相似度计算,501、自然人客户或机构客户的名称匹配度MP1的计算502、计算自然人客户或机构客户的证件号码匹配度MP2。503、计算自然人客户的出生日期匹配度MP3的计算。504、计算自然人客户的性别匹配度MP4的计算。505、计算自然人客户或机构客户的国籍匹配度MP5的计算。506、基于相似度计算自然人客户或机构客户的住址匹配度MP6。(6)根据定义好的基本数据的权重比进行综合加权匹配度计算,(7)输出匹配度阈值列表结果。特别指出的是,所述指标明细表包括但不限于来源于人民银行公共信用信息系统、金融机构的违约信息和事业单位缴费信息数据。针对输入的客户信息以及市场上主要黑名单数据库中客户信息存储的语言形式,基于词典库将中文简体、中文繁体转化为中文拼音,构建和开发支持中文简体、中文繁体、中文拼音、粤语拼音和英语等主流语言形式,有效提高的检索方式模糊状态语义检索。所述基本数据包括但不限于目标客户的名称、证件类型、证件号码、出生/注册日期、性别属性、国籍、籍贯和所属行业。所述匹配度计算公式为其中,d(NPi,NPj)表示输入自然人客户或机构客户的名称字符串NPi和黑名单数据库中疑似自然人客户或机构客户的本文档来自技高网...

【技术保护点】
1.一种金融信用度的模糊动态加权匹配方法,其特征在于,具体包括如下步骤:/n(1)收集目标客户的指标明细表,/n(2)按照预定规则对指标明细表进行权重比划分,构建系统的核心指标参数,/n(3)关联与目标客户的核心指标参数的基本数据,/n(4)对所述核心指标参数的基本数据进行英文和/或数字化表达,/n(5)分别对基本数据进行定义编号,根据公式计算核心指标参数进行单一的匹配度和相似度计算,/n(6)根据定义好的基本数据的权重比进行综合加权匹配度计算,/n(7)输出匹配度阈值列表结果。/n

【技术特征摘要】
1.一种金融信用度的模糊动态加权匹配方法,其特征在于,具体包括如下步骤:
(1)收集目标客户的指标明细表,
(2)按照预定规则对指标明细表进行权重比划分,构建系统的核心指标参数,
(3)关联与目标客户的核心指标参数的基本数据,
(4)对所述核心指标参数的基本数据进行英文和/或数字化表达,
(5)分别对基本数据进行定义编号,根据公式计算核心指标参数进行单一的匹配度和相似度计算,
(6)根据定义好的基本数据的权重比进行综合加权匹配度计算,
(7)输出匹配度阈值列表结果。


2.根据权利要求1所述的金融信用度的模糊动态加权匹配方法,其特征在于,所述指标明细表包括但不限于来源于人民银行公共信用信息系统、金融机构的违约信息和事业单位缴费信息数据。


3.根据权利要求1所述的金融信用度的模糊动态加权匹配方法,其特征在于,所述基本数据包括但不限于目标客户的名称、证件类型、证件号码、出生/注册日期、性别属性、国籍、籍贯和所属行业。


4.根据权利要求1所述的金融信用度的模糊动态加权匹配方法,其特征在于,所述匹配度计算公式为
其中,d(NPi,NPj)表示输...

【专利技术属性】
技术研发人员:李金李梦颖施兴森
申请(专利权)人:上海金仕达软件科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1