门店去重处理方法、装置、设备及存储介质制造方法及图纸

技术编号:35741217 阅读:15 留言:0更新日期:2022-11-26 18:44
本申请公开了一种门店去重处理方法、装置、设备及存储介质,属于数据处理领域。该方法包括:获取目标门店的第一门店名称和第一门店位置信息;根据第一门店位置信息,确定目标门店所在的目标网格区域;在预存的存量门店数据库中,获取位于目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息;基于第一门店名称、第一门店位置信息、第二门店名称和第二门店位置信息,得到目标门店与位于目标网格区域和邻居网格区域的存量门店的目标相似度;在目标相似度大于等于预设的去重相似度阈值的情况下,将目标门店作为重复门店去除。根据本申请实施例能够提高门店去重处理的效率。的效率。的效率。

【技术实现步骤摘要】
门店去重处理方法、装置、设备及存储介质


[0001]本申请属于数据处理领域,尤其涉及一种门店去重处理方法、装置、设备及存储介质。

技术介绍

[0002]随着电子支付技术的推广,用户在商户线下的门店中可利用电子支付技术进行支付。为了便于处理商户线下的门店中的电子支付,需要对商户线下的门店进行信息管理。但在门店数据由不同来源上送的情况下,不同来源可能会上送同一门店的门店数据,且不同来源上送的同一门店的门店数据可能会有所不同,导致根据门店数据将同一门店误判为两个不同的门店,即同一门店被反复统计。
[0003]为了避免同一门店被反复统计,需要派遣人员前往门店现场进行巡检,人工判断同一门店是否被反复统计。但人工巡检花费时间、人力非常大,门店去重处理的效率很低。

技术实现思路

[0004]本申请实施例提供一种门店去重处理方法、装置、设备及存储介质,能够提高门店去重处理的效率。
[0005]第一方面,本申请实施例提供一种门店去重处理方法,包括:获取目标门店的第一门店名称和第一门店位置信息;根据第一门店位置信息,确定目标门店所在的目标网格区域;在预存的存量门店数据库中,获取位于目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息,邻居网格区域与目标网格区域相邻;基于第一门店名称、第一门店位置信息、第二门店名称和第二门店位置信息,得到目标门店与位于目标网格区域和邻居网格区域的存量门店的目标相似度;在目标相似度大于等于预设的去重相似度阈值的情况下,将目标门店作为重复门店去除。
[0006]第二方面,本申请实施例提供一种门店去重处理装置,包括:第一获取模块,用于获取目标门店的第一门店名称和第一门店位置信息;网格区域确定模块,用于根据第一门店位置信息,确定目标门店所在的目标网格区域;第二获取模块,用于在预存的存量门店数据库中,获取位于目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息,邻居网格区域与目标网格区域相邻;计算模块,用于基于第一门店名称、第一门店位置信息、第二门店名称和第二门店位置信息,得到目标门店与位于目标网格区域和邻居网格区域的存量门店的目标相似度;去重模块,用于在目标相似度大于等于预设的去重相似度阈值的情况下,将目标门店作为重复门店去除。
[0007]第三方面,本申请实施例提供一种门店去重处理设备,设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的门店去重处理方法。
[0008]第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的门店去重处理方
法。
[0009]本申请实施例提供一种门店去重处理方法、装置、设备及存储介质,可根据目标门店的门店位置信息,确定目标门店所在的网格区域。网格区域为地图中划分的区域。基于数据库中位于目标门店所在的目标网格区域的存量门店、目标网格区域周边的网格区域的存量门店以及目标门店的门店名称、门店位置信息,得到目标门店与存量门店的相似度,根据该相似度判断新获取的门店是否与存量门店为同一门店,若新获取的门店与存量门店为同一门店,则认为新获取的门店为重复门店,予以去除。该去重过程不需人工参与,且利用门店的位置可缩小用于比对的存量门店的范围,提高了门店去重处理的效率。
附图说明
[0010]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1为本申请一实施例提供的门店去重处理方法的流程图;
[0012]图2为本申请实施例中网格区域的一示例的示意图;
[0013]图3为本申请另一实施例提供的门店去重处理方法的流程图;
[0014]图4为本申请实施例中编码表的一示例的示意图;
[0015]图5为本申请又一实施例提供的门店去重处理方法的流程图;
[0016]图6为本申请一实施例提供的门店去重处理装置的结构示意图;
[0017]图7为本申请一实施例提供的门店去重处理设备的结构示意图。
具体实施方式
[0018]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0019]随着电子支付技术的推广,用户在商户线下的门店中可利用电子支付技术进行支付。为了便于处理商户线下的门店中的电子支付,需要对商户线下的门店进行信息管理。但在门店数据由不同来源上送的情况下,不同来源可能会上送同一门店的门店数据,且不同来源上送的同一门店的门店数据可能会有所不同,导致根据门店数据将同一门店误判为两个不同的门店,即同一门店被反复统计。在一些情况下,同一门店被反复统计的情况也可能会被利用,从而造成存储门店信息的数据库中的漏洞。
[0020]为了避免同一门店被反复统计,需要派遣人员前往门店现场进行巡检,人工判断同一门店是否被反复统计。但人工巡检花费时间、人力非常大,门店去重处理的效率很低。
[0021]本申请提供一种门店去重处理方法、装置、设备及存储介质,可根据新获取的门店的门店位置信息,确定该门店所在的网格区域。网格区域为地图中划分的区域。利用数据库中位于新获取的门店所在的目标网格区域和目标网格区域周边的网格区域的存量门店的数据,以及新获取的门店的数据,得到新获取的门店与存量门店的相似度,根据该相似度判
断新获取的门店是否与存量门店为同一门店,若新获取的门店与存量门店为同一门店,则认为新获取的门店为重复门店,予以去除。该去重过程不需人工参与,且利用门店的位置缩小用于比对的存量门店的范围,提高了门店去重处理的效率。
[0022]下面对本申请提供的门店去重处理方法、装置、设备及存储介质分别进行说明。
[0023]本申请第一方面提供一种门店去重处理方法,可应用于根据不同来源收集来的门店信息进行门店去重的场景,可由门店去重装置、设备等执行,在此并不限定。图1为本申请一实施例提供的门店去重处理方法的流程图,如图1所示,门店去重处理方法可包括步骤S101至步骤S105。
[0024]在步骤S101中,获取目标门店的第一门店名称和第一门店位置信息。
[0025]目标门店为待判断是否为重复门店的门店,可以为新获取到的门店信息对应的门店,如新的欲加入存量门店数据库中的门店。第一门店名称可为目标门店的门店名称。第一门店位置信息可为目标门店的门店位置信息。门店位置信息用于表征门店的位置,可包括门店地址、门店经纬度等,在此并不限定。
[0026]在步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种门店去重处理方法,其特征在于,包括:获取目标门店的第一门店名称和第一门店位置信息;根据所述第一门店位置信息,确定所述目标门店所在的目标网格区域;在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息,所述邻居网格区域与所述目标网格区域相邻;基于所述第一门店名称、所述第一门店位置信息、所述第二门店名称和所述第二门店位置信息,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的目标相似度;在所述目标相似度大于等于预设的去重相似度阈值的情况下,将所述目标门店作为重复门店去除。2.根据权利要求1所述的方法,其特征在于,网格区域具有网格编码,在所述在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息之前,还包括:获取所述目标网格区域的网格编码;根据所述目标网格区域的网格编码和网格编码逆算法,获取所述目标网格区域的顶点的位置信息;根据所述目标网格区域的顶点的位置信息,确定位于所述邻居网格区域中辅助点的位置信息;基于每个所述邻居网格区域中辅助点的位置信息和网格编码算法,计算得到每个所述邻居网格区域的网格编码,以确定所述邻居网格区域。3.根据权利要求1所述的方法,其特征在于,网格区域具有网格编码,相邻的网格区域的网格编码中一部分数位的值相同,在所述在预存的存量门店数据库中,获取位于所述目标网格区域和邻居网格区域的存量门店的第二门店名称和第二门店位置信息之前,还包括:获取所述目标网格区域的网格编码;根据所述目标网格区域的网格编码,获取候选网格区域的网格编码,所述候选网格区域包括网格编码中一部分数位的字符与所述目标网格区域的网格编码中一部分数位的字符相同的网格区域;按照网格编码算法中的网格区域排布与编码数位的字符的对应关系,在所述候选网格区域的网格编码中确定所述邻居网格区域的网格编码,以确定所述邻居网格区域。4.根据权利要求1所述的方法,其特征在于,还包括:将地图划分为多个网格区域,并利用网格编码算法,为每个网格区域分配网格编码;获取所述存量门店的门店位置信息,根据所述存量门店的门店位置信息,确定所述存量门店所在的网格区域;建立所述存量门店和存量门店所在的网格区域的网格编码的第一对应关系,并将第一对应关系存储于所述存量门店数据库。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一门店名称、所述第一门店位置信息、所述第二门店名称和所述第二门店位置信息,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的目标相似度,包括:
基于所述第一门店名称和所述第二门店名称,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的N个名称相关相似度,N为大于等于1的整数;基于所述第一门店位置信息和所述第二门店位置信息,得到所述目标门店与位于所述目标网络区域和所述邻居网格区域的所述存量门店的位置相似度;根据N个所述名称相关相似度、所述位置相似度以及对应的权重系数,计算得到所述目标相似度。6.根据权利要求5所述的方法,其特征在于,所述名称相关相似度包括字符相似度,所述基于所述第一门店名称和所述第二门店名称,得到所述目标门店与位于所述目标网格区域和所述邻居网格区域的存量门店的N个名称相关相似度,包括:对所述第一门店名称和所述第二门店名称分别进行分词,得到所述第一门店名称对应的词汇和所述第二门店名称对应的词汇;计算所述第一门店名称对应的词汇和所述第二门店名称对应的词汇的词频和逆文本频率指数;选取词频低于等于冗余词频阈值且逆文本频率指数大于冗余频率指数阈值的词汇;基于选取的所述第一门店名称对应的词汇和选取的所述第二门店名...

【专利技术属性】
技术研发人员:余玮琦佘萧寒曾泽华姜华高鹏飞万四爽刘蓝
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1