【技术实现步骤摘要】
一种基于图数据库的地址快速匹配搜索方法、装置及介质
[0001]本专利技术涉及计算机
,具体涉及一种基于图数据库的地址快速匹配搜索方法
、
装置及介质
。
技术介绍
[0002]在商业应用中,尤其是在银行的一些消费贷款
、
信用卡申请业务中,需要将申请信息中的地址和单位名称进行匹配,用于执行合并客户信息
、
识别重复记录
、
黑名单地址
/
单位名称命中检测等任务
。
然而,由于数据质量
、
命名约定和用户输入习惯等因素的影响,这种匹配往往面临一些挑战
。
而在此之上,如何利用已有的匹配结果,作用在后续的匹配上,面临的挑战更大
。
[0003]为了找到一个和输入的地址
/
单位名称相匹配的地址
/
单位名称,假设这样一种情况,地址
D
找到了一个和它相匹配的地址
B
,而地址
B
在之前也已经通过模糊匹配服务,找到了相匹配的地址
A。
此时,对于要返回给用户的匹配结果有这样几种情况:
[0004]1、
通过不断的链式查询找到最早的匹配结果;
[0005]2、
通过不断的链式查询找到匹配分值最高的匹配结果;
[0006]3、
多种可选的匹配结果
。
[0007]在反欺诈的业务中,如果一个地址
/r/>单位名称关联了多个申请人信息,那么就认为这个地址
/
单位名称本身是一个风险很大的地址
。
这个地址能关联到的点越多,那么风险可能越大
。
而如果选择匹配分值最高的匹配结果,最坏的情况下,每一次新的匹配,产生的分数都比之前高一些,那么每次都会返回新的地址
/
单位名称,就达不到关联的目的;如果选择最早匹配的地址
/
单位名称,则会将所有和这个地址
/
单位名称匹配的所有信息都关联起来,而这种关联会产生传播效应,进一步传递风险
。
[0008]地址
B
通过模糊匹配找到了一个地址
A1
,地址
A1
也通过模糊匹配也找到了一个和它相匹配的地址
A2
,以此类推下去,很容易想到,这可能会产生一个地址匹配的链条,这条链条的最初始的链是
An
‑
>A
,即:
B
‑
>A1
‑
>A1
‑
>A2
‑
>A3...
‑
>An
‑
>A
,在这种情况下,需要设计一种方案,能够有效的识别出历史的匹配,能够将
A
做为
B
的模糊匹配地址返回
。
现有的一些方案是将历史的匹配对存储在
key/value
数据库中,然后通过不断的链式查询一点一点的往前推进,直到找到最初的匹配地址
/
单位名称
。
[0009]即,在实时模糊匹配的场景下,不断的有新的地址
/
单位名称传输过来,当新的地址
/
单位名称匹配了
B
历史库中的地址
/
单位名称
A1
时,如何高效地寻找
A1
最早的匹配地址
A
是亟需解决的问题
。
技术实现思路
[0010]针对
技术介绍
中所提及的技术缺陷,本专利技术实施例的目的在于提供一种基于图数据库的地址快速匹配搜索方法
、
装置及存储介质
。
[0011]为实现上述目的,第一方面,本专利技术实施例提供了一种基于图数据库的地址快速
匹配搜索方法,包括:
[0012]创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间
、
单位名称点之间或地址点与单位名称点之间形成多个匹配边;
[0013]获取输入地址;
[0014]采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址
。
[0015]作为本申请的一种优选实现方式,找到所述输入地址的匹配地址之后,所述方法还包括:
[0016]在所述图模型上,采用图连通算法找到所述输入地址的最初地址
。
[0017]进一步地,作为本申请的一种优选实现方式,所述方法还包括:
[0018]若采用模糊匹配算法从所述图模型中未找到所述输入地址的匹配地址,则确定所述输入地址从所述图模型匹配得到的地址为第一匹配项;
[0019]将所述输入地址和第一匹配项插入到所述图模型中,作为新地址点;
[0020]在所述输入地址和新地址点之间
、
所述新地址点和最初地址之间分别建立匹配边
。
[0021]进一步地,作为本申请的一种优选实现方式,在所述输入地址和新地址点之间
、
所述新地址点和最初地址之间分别建立匹配边之后,所述方法还包括:
[0022]将所述匹配地址或未匹配结果返回给用户
。
[0023]第二方面,本专利技术实施例提供了一种基于图数据库的地址快速匹配搜索装置,包括:
[0024]创建单元,用于创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间
、
单位名称点之间或地址点与单位名称点之间形成多个匹配边;
[0025]获取单元,用于获取输入地址;
[0026]处理单元,用于采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址
。
[0027]作为本申请的一种优选实现方式,所述处理单元还用于:
[0028]在所述图模型上,采用图连通算法找到所述输入地址的最初地址;
[0029]若采用模糊匹配算法从所述图模型中未找到所述输入地址的匹配地址,则确定所述输入地址从所述图模型匹配得到的地址为第一匹配项;
[0030]将所述输入地址和第一匹配项插入到所述图模型中,作为新地址点;
[0031]在所述输入地址和新地址点之间
、
所述新地址点和最初地址之间分别建立匹配边;
[0032]将所述匹配地址或未匹配结果返回给用户
。
[0033]第三方面,本专利技术实施例还提供了一种基于图数据库的地址快速匹配搜索装置,包括处理器
、
输入设备
、
输出设备和存储器,所述处理器
、
输入设备
、
输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于图数据库的地址快速匹配搜索方法,其特征在于,包括:创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间
、
单位名称点之间或地址点与单位名称点之间形成多个匹配边;获取输入地址;采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址
。2.
如权利要求1所述的方法,其特征在于,找到所述输入地址的匹配地址之后,所述方法还包括:在所述图模型上,采用图连通算法找到所述输入地址的最初地址
。3.
如权利要求2所述的方法,其特征在于,所述方法还包括:若采用模糊匹配算法从所述图模型中未找到所述输入地址的匹配地址,则确定所述输入地址从所述图模型匹配得到的地址为第一匹配项;将所述输入地址和第一匹配项插入到所述图模型中,作为新地址点;在所述输入地址和新地址点之间
、
所述新地址点和最初地址之间分别建立匹配边
。4.
如全路要求3所述的方法,其特征在于,在所述输入地址和新地址点之间
、
所述新地址点和最初地址之间分别建立匹配边之后,所述方法还包括:将所述匹配地址或未匹配结果返回给用户
。5.
一种基于图数据库的地址快速匹配搜索装置,其特征在于,包括:创建单元,用于创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间
、
单位名称点之间或地址点与单位名称点之间形成多个匹配边;获取单元,用于获取输入...
【专利技术属性】
技术研发人员:张晨,周研,蒋阔,吴菁,
申请(专利权)人:浙江创邻科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。