【技术实现步骤摘要】
一种信贷业务数据匹配的方法及装置
本申请涉及计算机
,尤其涉及一种信贷业务数据匹配的方法及装置。
技术介绍
对于异构信贷业务数据而言,提取特征并相互匹配是聚类分析等机器学习算法的重要前提步骤。目前,现有的利用向量间距方法等进行数据匹配的方法都需要遍历所有对象,但是遍历过程一般没有保存并做二次利用,仅仅给出一个匹配对象或一个分类结果,并且最终给出匹配对象时对相似程度也缺少量化描述。
技术实现思路
为了解决上述技术问题,本申请提供了一种信贷业务数据匹配的方法及装置,用于高效快速地对共性的信贷业务数据进行匹配并对匹配程度加以量化。为了实现上述目的,本申请实施例提供的技术方案如下:本申请实施例提供一种信贷业务数据匹配的方法,该方法包括:获取待匹配信贷业务数据中的多个特征数据组成第一特征向量,获取目标信贷业务数据中的多个特征数据组成第二特征向量;所述特征数据包括离散型特征数据以及连续型特征数据;所述目标信贷业务数据分别为可匹配信贷业务数据中的每一条;计算所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分;计算所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分;将所述第一距离评分与所述第二距离评分融合得到所述待匹配信贷业务数据与所述目标信贷业务数据的距离评分;将所述距离评分最高的目标信贷业务数据确定为与所述待匹配信贷业务数据匹配的可匹配信贷业务数据。可选的,所述计算 ...
【技术保护点】
1.一种信贷业务数据匹配的方法,其特征在于,所述方法包括:/n获取待匹配信贷业务数据中的多个特征数据组成第一特征向量,获取目标信贷业务数据中的多个特征数据组成第二特征向量;所述特征数据包括离散型特征数据以及连续型特征数据;所述目标信贷业务数据分别为可匹配信贷业务数据中的每一条;/n计算所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分;/n计算所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分;/n将所述第一距离评分与所述第二距离评分融合得到所述待匹配信贷业务数据与所述目标信贷业务数据的距离评分;/n将所述距离评分最高的目标信贷业务数据确定为与所述待匹配信贷业务数据匹配的可匹配信贷业务数据。/n
【技术特征摘要】 【专利技术属性】
1.一种信贷业务数据匹配的方法,其特征在于,所述方法包括:
获取待匹配信贷业务数据中的多个特征数据组成第一特征向量,获取目标信贷业务数据中的多个特征数据组成第二特征向量;所述特征数据包括离散型特征数据以及连续型特征数据;所述目标信贷业务数据分别为可匹配信贷业务数据中的每一条;
计算所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分;
计算所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分;
将所述第一距离评分与所述第二距离评分融合得到所述待匹配信贷业务数据与所述目标信贷业务数据的距离评分;
将所述距离评分最高的目标信贷业务数据确定为与所述待匹配信贷业务数据匹配的可匹配信贷业务数据。
2.根据权利要求1所述的方法,其特征在于,所述计算所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分,包括:
计算所述第一特征向量中的目标离散型特征数据与所述第二特征向量中的目标离散型特征数据之间的汉明距离;所述目标离散型特征数据分别为所述离散型特征数据中的每一个;
获取所述目标离散型特征数据对应的各个汉明距离的评分;
根据所述第一特征向量中的目标离散型特征数据与所述第二特征向量中的目标离散型特征数据之间的汉明距离,以及所述目标离散型特征数据对应的各个汉明距离的评分,得到所述第一特征向量中的目标离散型特征数据与所述第二特征向量中的目标离散型特征数据之间的汉明距离的评分;
将各个所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据之间的汉明距离的评分融合得到所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分。
3.根据权利要求1所述的方法,其特征在于,所述计算所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据之间的第一距离评分,包括:
将所述第一特征向量中的离散型特征数据作为第一向量,所述第二特征向量中的离散型特征数据作为第二向量,计算所述第一向量与所述第二向量之间的汉明距离;
根据所述第一向量与所述第二向量之间的汉明距离确定所述第一特征向量中的离散型特征数据与所述第二特征向量中的离散型特征数据的第一距离评分,所述第一向量与所述第二向量之间的汉明距离以及所述第一距离评分成反比。
4.根据权利要求1所述的方法,其特征在于,所述计算所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分,包括:
计算所述第一特征向量中的目标连续型特征数据与所述第二特征向量中的目标连续型特征数据之间的距离;所述目标连续型特征数据分别为所述连续型特征数据中的每一个;所述距离为欧式距离或者余弦距离;
获取所述目标连续型特征数据对应的各个距离区间的评分区间;
确定所述第一特征向量中的目标连续型特征数据与所述第二特征向量中的目标连续型特征数据之间的距离所属距离区间,在所述所属距离区间的评分区间内确定所述第一特征向量中的目标连续型特征数据与所述第二特征向量中的目标连续型特征数据之间的距离的评分;
将各个所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据之间的距离的评分融合得到所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分。
5.根据权利要求1所述的方法,其特征在于,所述计算所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分,包括:
将所述第一特征向量中的连续型特征数据作为第三向量,所述第二特征向量中的连续型特征数据作为第四向量,计算所述第三向量与所述第四向量之间的距离;所述距离为欧式距离或者余弦距离;
根据所述三向量与所述第四向量之间的距离确定所述第一特征向量中的连续型特征数据与所述第二特征向量中的连续型特征数据的第二距离评分,所述第三向量与所述第四向量之间的距离以及所述第二距离评分成反比。
技术研发人员:王令则,孙琳,李爱平,董冉冉,狄晓帆,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。