用户分群方法、地址关系分类模型的训练方法及装置制造方法及图纸

技术编号:37589200 阅读:19 留言:0更新日期:2023-05-18 11:14
本申请实施例提供了一种用户分群方法、地址关系分类模型的训练方法及装置,其中分群方法包括:从待分群的用户池所关联的地址池中,获取多个目标地址组合;目标地址组合包括第一用户的第一地址和第二用户的第二地址,第一用户和第二用户是用户池中的任意用户;依次将每个目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个目标地址组合中的第一地址与第二地址之间的地址关系;根据各地址关系对用户池包括的多个用户进行分群处理,得到分群结果。通过本申请实施例,提升了基于用户地址进行用户分群的准确性。用户地址进行用户分群的准确性。用户地址进行用户分群的准确性。

【技术实现步骤摘要】
用户分群方法、地址关系分类模型的训练方法及装置


[0001]本申请涉及数据处理
,尤其涉及一种用户分群方法、地址关系分类模型的训练方法及装置。

技术介绍

[0002]用户分群广泛的应用于各种场景中,例如用户分流、产品推荐等。用户地址作为用户的一个基本信息,可以用于进行用户分群。当前基于用户地址进行用户分群的过程中,主要是基于收集的用户信息中的用户地址进行分群处理,但是由于收集的用户信息中的用户地址往往都是用户手动输入的,因此常常是非标准地址,例如包含拼写错误、存在信息缺失、地名俗称等。而基于该非标准地址进行用户分群,无疑增加了地址处理难度,降低了用户分群结果的准确性。

技术实现思路

[0003]本申请提供一种用户分群方法、地址关系分类模型的训练方法及装置,以提升基于用户地址进行用户分群的准确性。
[0004]第一方面,本申请实施例提供了一种用户分群方法,包括:
[0005]从待分群的用户池所关联的地址池中,获取多个目标地址组合;所述目标地址组合包括第一用户的第一地址和第二用户的第二地址,所述第一用户和所述第二用户是所述用户池中的任意用户;
[0006]依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系;
[0007]根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果。
[0008]可以看出,本申请实施例中,首先从待分群的用户池所关联的地址池中,获取多个目标地址组合,该目标地址组合包括第一用户的第一地址和第二用户的第二地址,第一用户和第二用户是用户池中的任意用户;然后依次将每个目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个目标地址组合中的第一地址与第二地址之间的地址关系;最后根据各地址关系对用户池包括的多个用户进行分群处理,得到分群结果。该过程中,由于是基于地址关系分类模型对目标地址组合进行地址关系分类处理,而地址关系分类模型已预先学习到了非标准地址的特征,因此能够快捷准确的处理目标地址组合中的非标准地址,不仅降低了地址处理难度,而且极大的提升了得到的地址关系的准确性;进而基于该地址关系进行分群处理,保障了分群结果的准确性。
[0009]第二方面,本申请实施例提供了一种地址关系分类模型的训练方法,包括:
[0010]基于训练样本集对当前待训练的初始网络进行当前训练步数的训练处理,得到训练后的初始网络;
[0011]若确定所述训练步数满足评分条件,则基于验证样本集对当前的初始网络进行评
分处理,得到模型分数;
[0012]确定所述模型分数的数量是否到达预设数量;若是,则将所述预设数量的模型分数中最高模型分数所对应的初始网络确定为地址关系分类模型;若否,则进行所述训练处理;
[0013]其中,所述地址关系模型用于对输入的目标地址组合进行地址关系分类处理,得到所述目标地址组合包括的第一地址与第二地址之间的地址关系;所述训练样本集和所述验证样本集中的每个样本包括第三地址、第四地址和标签;所述标签用于表征所述第三地址与所述第四地址之间的地址关系。
[0014]可以看出,本申请实施例中,在基于训练样本集对初始网络进行训练的过程中,若确定训练步数满足评分条件,则基于验证样本集对当前的初始网络进行评分处理,得到模型分数;以及在模型分数的数量未到达预设数量时,继续进行训练处理;在模型分数的数量到达预设数量时,将该预设数量的模型分数中最高模型分数所对应的初始网络确定为地址关系分类模型。由此,在训练过程中,通过进行多次评分处理,并将最高模型分数对应的初始网络确定为地址关系分类模型,保障了地址关系分类模型的准确性;进而在基于该地址关系分类模型对输入的目标地址组合进行地址关系分类处理时,不仅能够降低地址处理难度,而且能够提升处理结果的准确性。
[0015]第三方面,本申请实施例提供了一种用户分群装置,包括:
[0016]获取模块,用于从待分群的用户池所关联的地址池中,获取多个目标地址组合;所述目标地址组合包括第一用户的第一地址和第二用户的第二地址,所述第一用户和所述第二用户是所述用户池中的任意用户;
[0017]分类模块,用于依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系;
[0018]分群模块,用于根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果。
[0019]第四方面,本申请实施例提供了一种地址关系分类模型的训练装置,包括:
[0020]训练模块,用于基于训练样本集对当前待训练的初始网络进行当前训练步数的训练处理,得到训练后的初始网络;
[0021]评分模块,用于若确定所述训练步数满足评分条件,则基于验证样本集对当前的初始网络进行评分处理,得到模型分数;
[0022]确定模块,用于确定所述模型分数的数量是否到达预设数量;若是,则将所述预设数量的模型分数中最高模型分数所对应的初始网络确定为地址关系分类模型;若否,则进行所述训练处理;
[0023]其中,所述地址关系模型用于对输入的目标地址组合进行地址关系分类处理,得到所述目标地址组合包括的第一地址与第二地址之间的地址关系;所述训练样本集和所述验证样本集中的每个样本包括第三地址、第四地址和标签;所述标签用于表征所述第三地址与所述第四地址之间的地址关系。
[0024]第五方面,本申请实施例提供了一种电子设备,包括:
[0025]处理器;以及,被安排成存储计算机可执行指令的存储器,所述可执行指令被配置
由所述处理器执行,所述可执行指令包括用于执行上述第一方面提供的用户分群方法中的步骤,或者所述可执行指令包括用于执行上述第二方面提供的地址关系分类模型的训练方法中的步骤。
[0026]第六方面,本申请实施例提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行上述第一方面提供的用户分群方法中的步骤,或者所述可执行指令使得计算机执行上述第二方面提供的地址关系分类模型的训练方法中的步骤。
附图说明
[0027]为了更清楚地说明本申请一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0028]图1为本申请实施例提供的一种用户分群方法的第一种流程示意图;
[0029]图2为本申请实施例提供的一种用户分群方法的第二种流程示意图;
[0030]图3为本申请实施例提供的一种地址关系分类模型的结构示意图;
[0031]图4为本申请实施例提供的一种用户分群方法的第三种流程示意图;
[0032]图5为本申请实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分群方法,其特征在于,包括:从待分群的用户池所关联的地址池中,获取多个目标地址组合;所述目标地址组合包括第一用户的第一地址和第二用户的第二地址,所述第一用户和所述第二用户是所述用户池中的任意用户;依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系;根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果。2.根据权利要求1所述的方法,其特征在于,所述从待分群的用户池所关联的地址池中,获取多个目标地址组合,包括:根据待分群的用户池包括的多个用户的排列顺序,分别将当前遍历到的用户确定为第一用户,将位于所述第一用户之后的用户确定为候选用户;从所述用户池关联的地址池中,获取所述第一用户的第一地址和每个候选用户的候选地址;确定所述候选地址的数量是否小于预设数量;若是,则将所述候选地址确定为所述第二地址,将所述第二地址所属的候选用户确定为所述第二用户;将所述第一地址与每个所述第二地址进行组合得到多个目标地址组合;若否,则确定所述第一地址与每个所述候选地址的相似度,按照所述相似度从大到小的顺序,获取所述预设数量的目标相似度;将所述目标相似度对应的候选地址确定为所述第二地址,将所述第二地址所属的候选用户确定为所述第二用户;将所述第一地址与每个所述第二地址进行组合得到多个目标地址组合。3.根据权利要求1所述的方法,其特征在于,所述将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理之前,所述方法还包括:对每个所述目标地址组合中的所述第一地址和所述第二地址进行多个预设维度的第一编码处理,得到每个所述目标地址组合在每个预设维度的第一编码结果;所述依次将每个所述目标地址组合输入地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系,包括:依次将每个所述目标地址组合在每个预设维度的第一编码结果输入所述地址关系分类模型中进行地址关系分类处理,得到每个所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系。4.根据权利要求3所述的方法,其特征在于,对目标地址组合中的所述第一地址和所述第二地址进行多个预设维度的第一编码处理,得到所述目标地址组合在每个预设维度的第一编码结果的具体实现方式有:通过预设连接符连接所述目标地址组合中的所述第一地址和所述第二地址,得到连接地址;对所述连接地址中的每个字进行第一子编码处理,得到第一维度的第一编码结果;对所述连接地址中的所述连接符和每个字所在的位置进行第二子编码处理,得到第二维度的第一编码结果;对所述连接地址中的每个字的声母进行第三子编码处理,得到第三维度的第一编码结果;
对所述连接地址中的每个字的韵母进行第四子编码处理,得到第四维度的第一编码结果;对所述连接地址中的每个字是否属于预设保留字集进行第五子编码处理,得到第五维度的第一编码结果;对所述连接地址中的每个字的归属地址进行第六子编码处理,得到第六维度的第一编码结果。5.根据权利要求3所述的方法,其特征在于,所述地址关系分类模型包括嵌入网络、编码网络和分类网络;将所述目标地址组合在每个预设维度的第一编码结果输入所述地址关系分类模型中进行地址关系分类处理,得到所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系,包括:将所述目标地址组合在每个预设维度的第一编码结果输入所述嵌入网络中进行合并处理,得到合并结果;通过所述编码层对所述合并结果进行第二编码处理,得到第二编码结果;通过所述分类网络对所述第二编码结果进行分类处理,得到所述目标地址组合中的所述第一地址与所述第二地址之间的地址关系。6.根据权利要求1所述的方法,其特征在于,所述根据各所述地址关系对所述用户池包括的多个用户进行分群处理,得到分群结果,包括:对所述用户池包括的多个用户进行两两组合,得到多个用户组合;根据各所述地址关系,确定每个所述用户组合的用户关系值;根据各所述用户关系值,对所述用户池包括的多个用户进行分群处理,得到分群结果。7.根据权利要求6所述的方法,其特征在于,所述根据各所述地址关系,确定每个所述用户组合的用户关系值,包括:根据各所述地址关系,构建每个所述用户组合的地址关系矩阵;根据每个所述用户组合的所述地址关系矩阵,确定每个所述用户组合的用户关系值。8.根据权利要求6所述的方法,其特征在于,所述根据各所述用户关系值,对所述用户池包括的多个用户进行分群处理,得到分群结果,包括:根据各所述用户关系值,构建所述用户池包括的多个用户之间的关系值矩阵;根据所述关系值矩阵生成用户关系图谱;根据所述...

【专利技术属性】
技术研发人员:汪自立马超夏粉蒋宁吴海英肖冰陆全
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1