【技术实现步骤摘要】
门店去重处理方法、装置、设备及存储介质
[0001]本申请属于数据处理领域,尤其涉及一种门店去重处理方法、装置、设备及存储介质。
技术介绍
[0002]随着电子支付技术的推广,用户在商户线下的门店中可利用电子支付技术进行支付。为了便于处理商户线下的门店中的电子支付,需要对商户线下的门店进行信息管理。但在门店数据由不同来源上送的情况下,不同来源可能会上送同一门店的门店数据,且不同来源上送的同一门店的门店数据可能会有所不同,导致根据门店数据将同一门店误判为两个不同的门店,即同一门店被反复统计。
[0003]为了避免同一门店被反复统计,需要派遣人员前往门店现场进行巡检,人工判断同一门店是否被反复统计。但人工巡检花费时间、人力非常大,门店去重处理的效率很低。
技术实现思路
[0004]本申请实施例提供一种门店去重处理方法、装置、设备及存储介质,能够提高门店去重处理的效率。
[0005]第一方面,本申请实施例提供一种门店去重处理方法,包括:获取目标门店的第一门店名称和第一门店位置信息;根据第一门店位置信息,确定目标门店所在的目标网格区域;在预存的存量门店数据库中,获取位于目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息,邻居网格区域与目标网格区域相邻;基于第一门店名称、第一门店位置信息、第二门店名称和第二门店位置信息,得到目标门店与位于目标网格区域和邻居网格区域的存量门店的目标相似度;在目标相似度大于等于预设的去重相似度阈值的情况下,将目标门店作为重复门店去除。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种门店去重处理方法,其特征在于,包括:获取目标门店的第一门店名称和第一门店位置信息;根据所述第一门店位置信息,确定所述目标门店所在的目标网格区域;在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息,所述邻居网格区域与所述目标网格区域相邻;基于所述第一门店名称、所述第一门店位置信息、所述第二门店名称和所述第二门店位置信息,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的目标相似度;在所述目标相似度大于等于预设的去重相似度阈值的情况下,将所述目标门店作为重复门店去除。2.根据权利要求1所述的方法,其特征在于,网格区域具有网格编码,在所述在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息之前,还包括:获取所述目标网格区域的网格编码;根据所述目标网格区域的网格编码和网格编码逆算法,获取所述目标网格区域的顶点的位置信息;根据所述目标网格区域的顶点的位置信息,确定位于所述邻居网格区域中辅助点的位置信息;基于每个所述邻居网格区域中辅助点的位置信息和网格编码算法,计算得到每个所述邻居网格区域的网格编码,以确定所述邻居网格区域。3.根据权利要求1所述的方法,其特征在于,网格区域具有网格编码,相邻的网格区域的网格编码中一部分数位的值相同,在所述在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息之前,还包括:获取所述目标网格区域的网格编码;根据所述目标网格区域的网格编码,获取候选网格区域的网格编码,所述候选网格区域包括网格编码中一部分数位的字符与所述目标网格区域的网格编码中一部分数位的字符相同的网格区域;按照网格编码算法中的网格区域排布与编码数位的字符的对应关系,在所述候选网格区域的网格编码中确定所述邻居网格区域的网格编码,以确定所述邻居网格区域。4.根据权利要求1所述的方法,其特征在于,还包括:将地图划分为多个网格区域,并利用网格编码算法,为每个网格区域分配网格编码;获取所述存量门店的门店位置信息,根据所述存量门店的门店位置信息,确定所述存量门店所在的网格区域;建立所述存量门店和存量门店所在的网格区域的网格编码的第一对应关系,并将第一对应关系存储于所述存量门店数据库。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一门店名称、所述第一门店位置信息、所述第二门店名称和所述第二门店位置信息,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的目标相似度,包括:
基于所述第一门店名称和所述第二门店名称,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的N个名称相关相似度,N为大于等于1的整数;基于所述第一门店位置信息和所述第二门店位置信息,得到所述目标门店与位于所述目标网络区域和所述邻居网格区域的所述存量门店的位置相似度;根据N个所述名称相关相似度、所述位置相似度以及对应的权重系数,计算得到所述目标相似度。6.根据权利要求5所述的方法,其特征在于,所述名称相关相似度包括字符相似度,所述基于所述第一门店名称和所述第二门店名称,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的N个名称相关相似度,包括:对所述第一门店名称和所述第二门店名称分别进行分词,得到所述第一门店名称对应的词汇和所述第二门店名称对应的词汇;计算所述第一门店名称对应的词汇和所述第二门店名称对应的词汇的词频和逆文本频率指数;选取词频低于等于冗余词频阈值且逆文本频率指数大于冗余频率指数阈值的词汇;基于选取的所述第一门店名称对应的词汇和选取的所述第二门店名...
【专利技术属性】
技术研发人员:余玮琦,佘萧寒,曾泽华,姜华,高鹏飞,万四爽,刘蓝,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。