【技术实现步骤摘要】
用户分群方法、地址关系分类模型的训练方法及装置
[0001]本申请涉及数据处理
,尤其涉及一种用户分群方法、地址关系分类模型的训练方法及装置。
技术介绍
[0002]用户分群广泛的应用于各种场景中,例如用户分流、产品推荐等。用户地址作为用户的一个基本信息,可以用于进行用户分群。当前基于用户地址进行用户分群的过程中,主要是基于收集的用户信息中的用户地址进行分群处理,但是由于收集的用户信息中的用户地址往往都是用户手动输入的,因此常常是非标准地址,例如包含拼写错误、存在信息缺失、地名俗称等。而基于该非标准地址进行用户分群,无疑增加了地址处理难度,降低了用户分群结果的准确性。
技术实现思路
[0003]本申请提供一种用户分群方法、地址关系分类模型的训练方法及装置,以提升基于用户地址进行用户分群的准确性。
[0004]第一方面,本申请实施例提供了一种用户分群方法,包括:
[0005]从待分群的用户池所关联的地址池中,获取多个目标地址组合;所述目标地址组合包括第一用户的第一地址和第二用户的第二地址,所述第一用户和所述第二用户是所述用户池中的任意用户;
[0006]依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系;
[0007]根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果。
[0008]可以看出,本申请实施例中,首先从待分群的用户池所关联的地址池中,获取多 ...
【技术保护点】
【技术特征摘要】
1.一种用户分群方法,其特征在于,包括:从待分群的用户池所关联的地址池中,获取多个目标地址组合;所述目标地址组合包括第一用户的第一地址和第二用户的第二地址,所述第一用户和所述第二用户是所述用户池中的任意用户;依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系;根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果。2.根据权利要求1所述的方法,其特征在于,所述从待分群的用户池所关联的地址池中,获取多个目标地址组合,包括:根据待分群的用户池包括的多个用户的排列顺序,分别将当前遍历到的用户确定为第一用户,将位于所述第一用户之后的用户确定为候选用户;从所述用户池关联的地址池中,获取所述第一用户的第一地址和每个候选用户的候选地址;确定所述候选地址的数量是否小于预设数量;若是,则将所述候选地址确定为所述第二地址,将所述第二地址所属的候选用户确定为所述第二用户;将所述第一地址与每个所述第二地址进行组合得到多个目标地址组合;若否,则确定所述第一地址与每个所述候选地址的相似度,按照所述相似度从大到小的顺序,获取所述预设数量的目标相似度;将所述目标相似度对应的候选地址确定为所述第二地址,将所述第二地址所属的候选用户确定为所述第二用户;将所述第一地址与每个所述第二地址进行组合得到多个目标地址组合。3.根据权利要求1所述的方法,其特征在于,所述将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理之前,所述方法还包括:对每个所述目标地址组合中的所述第一地址和所述第二地址进行多个预设维度的第一编码处理,得到每个所述目标地址组合在每个预设维度的第一编码结果;所述依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系,包括:依次将每个所述目标地址组合在每个预设维度的第一编码结果输入所述地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系。4.根据权利要求3所述的方法,其特征在于,对目标地址组合中的所述第一地址和所述第二地址进行多个预设维度的第一编码处理,得到所述目标地址组合在每个预设维度的第一编码结果的具体实现方式有:通过预设连接符连接所述目标地址组合中的所述第一地址和所述第二地址,得到连接地址;对所述连接地址中的每个字进行第一子编码处理,得到第一维度的第一编码结果;对所述连接地址中的所述连接符和每个字所在的位置进行第二子编码处理,得到第二维度的第一编码结果;对所述连接地址中的每个字的声母进行第三子编码处理,得到第三维度的第一编码结果;
对所述连接地址中的每个字的韵母进行第四子编码处理,得到第四维度的第一编码结果;对所述连接地址中的每个字是否属于预设保留字集进行第五子编码处理,得到第五维度的第一编码结果;对所述连接地址中的每个字的归属地址进行第六子编码处理,得到第六维度的第一编码结果。5.根据权利要求3所述的方法,其特征在于,所述地址关系分类模型包括嵌入网络、编码网络和分类网络;将所述目标地址组合在每个预设维度的第一编码结果输入所述地址关系分类模型中进行地址关系分类处理,得到所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系,包括:将所述目标地址组合在每个预设维度的第一编码结果输入所述嵌入网络中进行合并处理,得到合并结果;通过所述编码层对所述合并结果进行第二编码处理,得到第二编码结果;通过所述分类网络对所述第二编码结果进行分类处理,得到所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系。6.根据权利要求1所述的方法,其特征在于,所述根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果,包括:对所述用户池包括的多个用户进行两两组合,得到多个用户组合;根据各所述地址关系,确定每个所述用户组合的用户关系值;根据各所述用户关系值,对所述用户池包括的多个用户进行分群处理,得到分群结果。7.根据权利要求6所述的方法,其特征在于,所述根据各所述地址关系,确定每个所述用户组合的用户关系值,包括:根据各所述地址关系,构建每个所述用户组合的地址关系矩阵;根据每个所述用户组合的所述地址关系矩阵,确定每个所述用户组合的用户关系值。8.根据权利要求6所述的方法,其特征在于,所述根据各所述用户关系值,对所述用户池包括的多个用户进行分群处理,得到分群结果,包括:根据各所述用户关系值,构建所述用户池包括的多个用户之间的关系值矩阵;根据所述关系值矩阵生成用户关系图谱;根据所述...
【专利技术属性】
技术研发人员:汪自立,马超,夏粉,蒋宁,吴海英,肖冰,陆全,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。