同实体店铺识别方法及其装置、设备、介质、产品制造方法及图纸

技术编号:37159276 阅读:30 留言:0更新日期:2023-04-06 22:23
本申请涉及一种同实体店铺识别方法及其装置、设备、介质、产品,所述方法包括:获取全部店铺组中线上店铺的店铺画像,每个店铺组包括有至少一个线上店铺相对应的店铺画像,同一店铺组中的多个线上店铺均注册有相同的通信特征;确定全部店铺组中第一店铺组与其他任意店铺组中,彼此两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组;根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为同实体店铺组。本申请能精准识别电商平台中的同实体的线上店铺,可以有效维护电商平台的经营秩序。经营秩序。经营秩序。

【技术实现步骤摘要】
同实体店铺识别方法及其装置、设备、介质、产品


[0001]本申请涉及电商信息处理技术,尤其涉及一种同实体店铺识别方法及其装置、设备、介质、产品。

技术介绍

[0002]电子商务,简称电商,按照模式类型,可分为平台模式和独立站模式。平台式电商以集中的方式,整合了海量品牌商品,用户可以着重商品本身进行选购。不同于平台式电商,在独立站电商中,吸引用户的更多是品牌本身,也就是靠品牌流量来吸引用户。而在独立站电商中,商家需要选择一个电商平台建立自己的商城,同时,商家也可以使用同一个电商平台建立多个相似的商城。而对于一些商家,可能会通过建立多个相似的商城,来实现售卖虚假商品、仿造商品等非法目的。因此,如何找出电商平台中的相似商家,即如何挖掘出同属一个商家实体的所有商家,涉及到电商平台的风险管控水平。
[0003]传统技术中用于识别同实体商家的常见方法是通过商家账号、手机号等来关联,找出相似商家。这种方法非常容易规避,一旦商家更改了注册的账号信息,该方法自然就失效。另一种方法是通过计算邮箱账号的相似程度来发现相似商家,这种方法虽然增加了发现相似商家的维度,但是从单一的邮箱维度来进行相似商家判断,自然也会带来不少的误判。
[0004]传统技术中识别同实体商家的另一个不足是局限于对商家店铺的静态信息的识别,这些静态信息是指在一定的时间范围内不轻易变动的信息,例如手机号、邮箱地址等,对静态信息的过度关注,虽然利用了其基本不变的特性,但有利也有弊,导致对同实体店铺的特征捕获渠道变少,无法有效识别出同实体店铺。
[0005]综上,对于同实体店铺的识别技术需要进一步提升,以便提升电商平台对于店铺风险的识别能力。

技术实现思路

[0006]本申请的目的在于解决上述问题而提供一种同实体店铺识别方法及其相应的装置、设备、非易失性可读存储介质,以及计算机程序产品。
[0007]根据本申请的一个方面,提供一种同实体店铺识别方法,包括如下步骤:
[0008]获取全部店铺组中线上店铺的店铺画像,每个店铺组包括有至少一个线上店铺相对应的店铺画像,同一店铺组中的多个线上店铺均注册有相同的通信特征,每个线上店铺的店铺画像包括多个特定采样特征;
[0009]确定全部店铺组中第一店铺组与其他任意店铺组中,彼此两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组;
[0010]根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为第一店铺组的同实体店铺组。
[0011]可选的,获取全部店铺组中线上店铺的店铺画像,包括:
[0012]按照全部线上店铺所注册的通信特征,将注册了相同通信特征的线上店铺划分为同一店铺组,所述通信特征包括电话号码、邮箱地址、通信地址中任意一项;
[0013]针对每个线上店铺,获取其多个特定采样特征构成店铺画像,所述多个特定采样特征包括商品动态信息特征和商户静态信息特征。
[0014]可选的,确定全部店铺组中第一店铺组与其他任意店铺组中,彼此两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组,包括:
[0015]基于笛卡尔积确定第一店铺组与其他任意店铺组之间的两两线上店铺,构成的待比店铺对;
[0016]将每个待比店铺对中的线上店铺的店铺画像转换为画像特征表示;
[0017]将所述待比店铺的所述画像特征表示映射到分类空间,确定出表征其中两个线上店铺之间的语义相似度;
[0018]遍历第一店铺组的各个线上店铺,对于每个线上店铺,确定与其具有最高语义相似度的线上店铺所在的店铺组为相似店铺组。
[0019]可选的,将每个待比店铺对中的线上店铺的店铺画像转换为画像特征表示,包括:
[0020]将待比店铺对中的两个线上店铺的店铺画像中的所述商品动态信息特征编制为独热编码向量并构造为动态特征联合表示;
[0021]将待比店铺对中的两个线上店铺的店铺画像中的所述商户静态信息特征编制为文本特征向量并构造为静态特征联合表示;
[0022]将所述动态特征联合表示与静态特征联合表示构造为画像特征表示。
[0023]可选的,所述商品动态信息特征包括品类覆盖特征和/或操作覆盖特征,所述商户静态信息特征包括邮箱地址和/或网络地址。
[0024]可选的,根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为第一店铺组的同实体店铺组之后,包括:
[0025]构造店铺组合并消息,其中包含第一店铺组及其同实体店铺组的店铺画像;
[0026]将所述店铺组合并消息发送至审核接口;
[0027]响应所述审核接口返回的确认指令,将所述同实体店铺组与其第一店铺组合并为同一店铺组。
[0028]可选的,根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为第一店铺组的同实体店铺组之后,包括:
[0029]将第一店铺组与其同实体店铺组从全部店铺组中排除;
[0030]继续采用全部店铺组中未被排除的任意店铺组作为所述第一店铺组,迭代以上过程为其确定同实体店铺组。
[0031]根据本申请的另一方面,提供一种同实体店铺识别装置,包括:
[0032]画像获取模块,设置为获取全部店铺组中线上店铺的店铺画像,每个店铺组包括有至少一个线上店铺相对应的店铺画像,同一店铺组中的多个线上店铺均注册有相同的通信特征,每个线上店铺的店铺画像包括多个特定采样特征;
[0033]相似识别模块,设置为确定全部店铺组中第一店铺组与其他任意店铺组中,彼此
两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组;
[0034]异同识别模块,设置为根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为第一店铺组的同实体店铺组。
[0035]根据本申请的另一方面,提供一种同实体店铺识别设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的同实体店铺识别方法的步骤。
[0036]根据本申请的另一方面,提供一种非易失性可读存储介质,其以计算机可读指令的形式存储有依据所述的同实体店铺识别方法所实现的计算机程序,所述计算机程序被计算机调用运行时,执行该方法所包括的步骤。
[0037]根据本申请的另一方面,提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
[0038]相对于现有技术,本申请具有丰富的技术优势,包括但不限于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种同实体店铺识别方法,其特征在于,包括:获取全部店铺组中线上店铺的店铺画像,每个店铺组包括有至少一个线上店铺相对应的店铺画像,同一店铺组中的多个线上店铺均注册有相同的通信特征,每个线上店铺的店铺画像包括多个特定采样特征;确定全部店铺组中第一店铺组与其他任意店铺组中,彼此两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组;根据相似店铺组的数量确定各个相似店铺组的得票率,当相似店铺组的得票率超过预设阈值时,确定该相似店铺组为第一店铺组的同实体店铺组。2.根据权利要求1所述的同实体店铺识别方法,其特征在于,获取全部店铺组中线上店铺的店铺画像,包括:按照全部线上店铺所注册的通信特征,将注册了相同通信特征的线上店铺划分为同一店铺组,所述通信特征包括电话号码、邮箱地址、通信地址中任意一项;针对每个线上店铺,获取其多个特定采样特征构成店铺画像,所述多个特定采样特征包括商品动态信息特征和商户静态信息特征。3.根据权利要求2所述的同实体店铺识别方法,其特征在于,确定全部店铺组中第一店铺组与其他任意店铺组中,彼此两两线上店铺的店铺画像之间的语义相似度,为第一店铺组中的每个线上店铺确定与其构成最高语义相似度的线上店铺所在的其他任意店铺组为相似店铺组,包括:基于笛卡尔积确定第一店铺组与其他任意店铺组之间的两两线上店铺,构成的待比店铺对;将每个待比店铺对中的线上店铺的店铺画像转换为画像特征表示;将所述待比店铺的所述画像特征表示映射到分类空间,确定出表征其中两个线上店铺之间的语义相似度;遍历第一店铺组的各个线上店铺,对于每个线上店铺,确定与其具有最高语义相似度的线上店铺所在的店铺组为相似店铺组。4.根据权利要求3所述的同实体店铺识别方法,其特征在于,将每个待比店铺对中的线上店铺的店铺画像转换为画像特征表示,包括:将待比店铺对中的两个线上店铺的店铺画像中的所述商品动态信息特征编制为独热编码向量并构造为动态特征联合表示;将待比店铺对中的两个线上店铺的店铺画像中的所述商户静态信息特征编制为文本特征向量并构造为静态特征联合表示;将所述动态特征联合表示与静态特征联合表示构造为画像特征表示。5.根据权...

【专利技术属性】
技术研发人员:吴智东
申请(专利权)人:广州欢聚时代信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1