本公开的实施例提供了一种商户识别方法、装置、电子设备及计算机可读介质。该方法包括:获取目标商户注册的目标商户名;对目标商户名进行处理,获得目标商户名的目标商户向量表示;计算目标商户向量表示和历史集合的集合中心向量表示的相似度;根据相似度新建一新增集合作为目标商户名对应的目标集合;根据目标集合的目标集合信息将目标商户确定为目标类型商户,其中,目标类型商户是指利用在预设时间范围内注册的第一数量的商户名以进行非正常交易的商户,第一数量的商户名中的任两个之间的相似度小于预设阈值。本公开实施例提供的技术方案能够提高目标类型商户识别的准确性,以及在线持续挖掘获得新增的目标类型商户集合。及在线持续挖掘获得新增的目标类型商户集合。及在线持续挖掘获得新增的目标类型商户集合。
【技术实现步骤摘要】
商户识别方法、装置、电子设备及计算机可读介质
[0001]本公开涉及计算机应用
,具体而言,涉及一种商户识别方法、装置、电子设备及计算机可读介质。
技术介绍
[0002]在线上支付的生态中,出现了很多在短时间内批量注册商户进行非正常交易行为的现象,造成了非常大的经济损失。虽然这些批量注册的商户名称不完全相同,但是高度相似,并且这批商户会在进行几笔交易后被舍弃,如果依赖交易行为对其进行检测,会导致风控很难及时发现它们从而处于被动局势。因此,如何高效地识别这一批量注册的非正常商户是一个值得研究的问题。
[0003]因此,需要一种新的商户识别方法、装置、电子设备及计算机可读介质。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本公开实施例提供一种商户识别方法、装置、电子设备及计算机可读介质,进而至少在一定程度上提高目标类型商户识别的准确性,以及在线持续挖掘获得新增的目标类型商户集合。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]本公开实施例提出一种商户识别方法,包括:获取目标商户注册的目标商户名;对所述目标商户名进行处理,获得所述目标商户名的目标商户向量表示;计算所述目标商户向量表示和历史集合的集合中心向量表示的相似度;根据所述相似度新建一新增集合作为所述目标商户名对应的目标集合;根据所述目标集合的目标集合信息将所述目标商户确定为目标类型商户,其中,所述目标类型商户是指利用在预设时间范围内注册的第一数量的商户名以进行非正常交易的商户,所述第一数量的商户名中的任两个之间的相似度小于预设阈值。
[0008]本公开实施例提出一种商户识别装置,包括:商户名获取模块,配置为获取目标商户注册的目标商户名;向量表示模块,配置为对所述目标商户名进行处理,获得所述目标商户名的目标商户向量表示;相似度计算模块,配置为计算所述目标商户向量表示和历史集合的集合中心向量表示的相似度;目标集合确定模块,配置为根据所述相似度新建一新增集合作为所述目标商户名对应的目标集合;目标类型商户识别模块,配置为根据所述目标集合的目标集合信息将所述目标商户确定为目标类型商户,其中,所述目标类型商户是指利用在预设时间范围内注册的第一数量的商户名以进行非正常交易的商户,所述第一数量的商户名中的任两个之间的相似度小于预设阈值。
[0009]在本公开的一种示例性实施例中,目标集合确定模块包括:第一目标集合确定单
元,配置为若所述相似度中的最大值小于相似度阈值,则新建一新增集合作为所述目标商户名对应的目标集合;第二目标集合确定单元,配置为若所述相似度中的最大值大于或等于相似度阈值,则将具有最大的相似度的历史集合确定为所述目标集合。
[0010]在本公开的一种示例性实施例中,目标集合信息是指示所述目标集合为目标类型商户集合的标识,目标类型商户识别模块包括:第一目标类型商户识别单元,配置为若所述相似度中的最大值小于相似度阈值,则在新建一新增集合作为所述目标商户名对应的目标集合后,确定所述新增集合从创建时间起至当前时间的时间范围内与所述新增集合对应的新增商户名;以及在根据所述新增商户名和所述目标商户名的交易信息确定所述新增集合为目标类型商户集合时,确定所述目标商户为目标类型商户;以及第二目标类型商户识别单元,配置为若所述相似度中的最大值大于或等于相似度阈值,并在根据所述目标集合的目标集合信息确定所述目标集合为目标类型商户集合时,则确定所述目标商户为目标类型商户。
[0011]在本公开的一种示例性实施例中,商户识别装置还包括集合中心向量更新模块,配置为根据所述目标商户向量表示更新所述目标集合的集合中心向量表示。
[0012]在本公开的一种示例性实施例中,集合中心向量更新模块包括第一集合中心向量更新单元,配置为若所述相似度中的最大值小于相似度阈值时,则将所述目标商户向量表示确定为所述新增集合的集合中心向量表示;第二集合中心向量更新单元,配置为若所述相似度中的最大值大于或等于相似度阈值时,则确定具有最大的相似度的历史集合对应的目标商户个数;根据所述目标商户个数确定第一权重和第二权重;以及根据所述第一权重和所述第二权重对所述历史集合的集合中心向量表示和所述目标商户向量表示进行加权求和计算,以根据加权求和计算结果更新所述目标集合的集合中心向量表示。
[0013]在本公开的一种示例性实施例中,商户识别装置还包括:第一集合标识确定模块,配置为若所述相似度中的最大值小于相似度阈值时,获取所述历史集合的集合标识;对所述历史集合的集合标识进行排序,获得最大的集合标识;以及根据所述最大的集合标识的增量计算,确定所述新增集合的集合标识。第二集合标识确定模块,配置为若所述相似度中的最大值大于或等于相似度阈值时,将具有最大的相似度的历史集合的集合标识确定为所述目标集合的集合标识。
[0014]在本公开的一种示例性实施例中,向量表示模块包括:去停用词单元,配置为对所述目标商户名去停用词;分词单元,配置为对去停用词后的所述目标商户名进行分词,获得所述目标商户名的分词和所述分词的词性信息;第一分词权重单元,配置为将词性信息为地名的分词设置第一分词权重;第二分词权重单元,配置为对词长度为预设长度的分词设置第二分词权重,所述第一分词权重大于所述第二分词权重;第三分词权重单元,配置为将词性信息不是地名且词长度大于预设长度的分词设置第三分词权重;向量表示单元,配置为根据所述第一分词权重、所述第二分词权重和所述第三分词权重对所述分词进行加权计算,获得所述目标商户名的向量表示。
[0015]本公开实施例提出一种电子设备,包括:至少一个处理器;存储装置,用于存储至少一个程序,当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现如上述实施例中所述的商户识别方法。
[0016]本公开实施例提出一种计算机可读介质,其上存储有计算机程序,所述程序被处
理器执行时实现如上述实施例中所述的商户识别方法。
[0017]在本公开的一些实施例所提供的技术方案中,在目标商户通过目标商户名进行注册时,通过对目标商户名进行向量表示,并计算目标商户向量表示和各个历史集合的集合中心向量表示的相似度;以根据相似度新建一新增集合作为所述目标商户名对应的目标集合,能够增量式地对不断新增的目标商户名进行聚类,有助于提高集合划分的准确性,并且不会影响已有的历史集合,也能够避免对已有历史集合的重复线下计算带来的资源浪费。同时,基于新建的新增集合作为目标集合,能够根据该目标集合的目标集合信息将目标商户确定为目标类型商户,能够在线持续挖掘获得新增的目标类型商户集合。
[0018]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0019]此处的附图被并入说明书中并构成本说明书本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种商户识别方法,其特征在于,包括:获取目标商户注册的目标商户名;对所述目标商户名进行处理,获得所述目标商户名的目标商户向量表示;计算所述目标商户向量表示和历史集合的集合中心向量表示的相似度;根据所述相似度新建一新增集合作为所述目标商户名对应的目标集合;根据所述目标集合的目标集合信息将所述目标商户确定为目标类型商户,其中,所述目标类型商户是指利用在预设时间范围内注册的第一数量的商户名以进行非正常交易的商户,所述第一数量的商户名中的任两个之间的相似度小于预设阈值。2.如权利要求1所述的方法,其特征在于,根据所述相似度新建一新增集合作为所述目标商户名对应的目标集合包括:若所述相似度中的最大值小于相似度阈值,则新建一新增集合作为所述目标商户名对应的目标集合;若所述相似度中的最大值大于或等于所述相似度阈值,则将具有最大的相似度的历史集合确定为所述目标集合。3.如权利要求2所述的方法,其特征在于,所述目标集合信息是指示所述目标集合为目标类型商户集合的标识;其中,根据所述目标集合的目标集合信息将所述目标商户确定为目标类型商户包括:若所述相似度中的最大值小于所述相似度阈值,则在新建一新增集合作为所述目标商户名对应的目标集合后,确定所述新增集合从创建时间起至当前时间的时间范围内与所述新增集合对应的新增商户名;以及在根据所述新增商户名和所述目标商户名的交易信息确定所述新增集合为目标类型商户集合时,确定所述目标商户为目标类型商户;若所述相似度中的最大值大于或等于所述相似度阈值,并在根据所述目标集合的目标集合信息确定所述目标集合为目标类型商户集合时,则确定所述目标商户为目标类型商户。4.如权利要求2所述的方法,其特征在于,还包括:根据所述目标商户向量表示更新所述目标集合的集合中心向量表示。5.如权利要求4所述的方法,其特征在于,根据所述目标商户向量表示更新所述目标集合的集合中心向量表示包括:若所述相似度中的最大值小于所述相似度阈值时,则将所述目标商户向量表示确定为所述新增集合的集合中心向量表示;若所述相似度中的最大值大于或等于所述相似度阈值时,则确定具有最大的相似度的历史集合对应的目标商户个数;根据所述目标商户个数确定第一权重和第二权重;以及根据所述第一权重和所述第二权重对所述历史集合的集合中心向量表示和所述目标...
【专利技术属性】
技术研发人员:李强,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。