【技术实现步骤摘要】
本申请涉及数据分析,尤其涉及一种地址匹配方法、装置、设备及存储介质。
技术介绍
1、在金融领域,比如金融信贷业务场景,信贷业务迅猛发展的同时,各种新型欺诈手段也推陈出新,不断渗透该领域。经调查分析发现,欺诈客群多呈现出有组织性质,且这部分客户在地理空间上存在着较强的关联关系。因此,利用地址匹配技术对客户地址信息构建关联,结合业务中其他调查手段共同挖掘风险群组,从而对风险群组实施差异化的风控策略,是一种防控有组织欺诈风险的有效方式。
2、现有的地址匹配方法,主要采用先中文分词再结合人工预先设计的各种匹配规则的方式,例如正则表达式匹配、分级元素匹配及模糊地址匹配等。然而,一方面该类地址匹配方法,受地址文本的标准程度以及分词边界的影响较大,例如当面对书写不规范的地址文本以及对地址文本的分词不合理的情况,匹配效果就很不理想,准确度不高;另一方面该类地址匹配方法,涉及匹配规则的设计,较为耗时,且匹配规则的设计受限于人工经验,无法保证合理性,从而无法保证匹配准确度,此外匹配规则实现过程也很繁琐,降低了匹配速率,难以适应大数据场景下大规模
...【技术保护点】
1.一种地址匹配方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的地址匹配方法,其特征在于,所述根据所述第一地址元素和所述第一编码向量,以及各个所述第二地址元素和各个所述第二编码向量,从所述候选集中搜索所述地址文本的目标匹配地址文本,包括:
3.根据权利要求2所述的地址匹配方法,其特征在于,所述根据所述第一地址元素和所述第一编码向量,以及各个所述第二地址元素和各个所述第二编码向量,通过分布式搜索引擎进行布尔搜索,确定各个所述待匹配地址文本与所述地址文本的相似度,包括:
4.根据权利要求2所述的地址匹配方法,其特征在于
...【技术特征摘要】
1.一种地址匹配方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的地址匹配方法,其特征在于,所述根据所述第一地址元素和所述第一编码向量,以及各个所述第二地址元素和各个所述第二编码向量,从所述候选集中搜索所述地址文本的目标匹配地址文本,包括:
3.根据权利要求2所述的地址匹配方法,其特征在于,所述根据所述第一地址元素和所述第一编码向量,以及各个所述第二地址元素和各个所述第二编码向量,通过分布式搜索引擎进行布尔搜索,确定各个所述待匹配地址文本与所述地址文本的相似度,包括:
4.根据权利要求2所述的地址匹配方法,其特征在于,根据各个所述相似度,从所述候选集中搜索所述地址文本的目标匹配地址文本,包括:
5.根据权利要求1所述的地址匹配方法,其特征在于,所述历史地址数据库存储于分布式搜索引擎中,所述根据所述区域编码和所述邻居区域编码,搜索历史地址数据库,获取所述地址文本对应的待匹配地址文本候选集,包括:
...
【专利技术属性】
技术研发人员:杨翰章,吴育人,庄伯金,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。