用户分类方法、设备、存储介质及装置制造方法及图纸

技术编号:36062076 阅读:41 留言:0更新日期:2022-12-24 10:27
本发明专利技术公开了一种用户分类方法、设备、存储介质及装置,该方法包括:获取待分类用户的用户登记地址,并将用户登记地址与各分级地址对应的特征字符进行匹配,根据匹配结果以及预设度量学习模型确定用户登记地址与各分级地址之间的相似性距离,根据相似性距离对分级地址进行筛选,获得目标分级地址,在预设地址层次树上查找目标分级地址对应的位置信息,并根据位置信息对待分类用户进行分类。由于本发明专利技术中,通过用户登记地址与各分级地址之间的相似性距离确定用户登记地址对应的目标分级地址,并基于目标分级地址在预设地址层次树上的位置信息对待分类用户进行分类,从而能够将用户按照树形组织分类,提高用户分类的准确性和可靠性。靠性。靠性。

【技术实现步骤摘要】
用户分类方法、设备、存储介质及装置


[0001]本专利技术涉及计算机
,尤其涉及一种用户分类方法、设备、存储介质及装置。

技术介绍

[0002]目前,通信企业在对用户进行分类时,往往通过用户办理业务时的登记地址确定用户分类。但是,由于用户登记地址以散列的方式存储,无法确定各用户登记地址之间的关系,从而导致容易出现漏判与错判。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种用户分类方法、设备、存储介质及装置,旨在解决现有技术中在通过用户登记地址确定用户分类时,由于用户登记地址以散列的方式存储,无法确定各用户登记地址之间的关系,从而导致容易出现漏判与错判的技术问题。
[0005]为实现上述目的,本专利技术提供一种用户分类方法,所述用户分类方法包括以下步骤:
[0006]获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配;
[0007]根据匹配结果以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离;
[0008]根据所述相似性距离对分级地址进行筛选,获得目标分级地址;
[0009]在预设地址层次树上查找所述目标分级地址对应的位置信息,并根据所述位置信息对所述待分类用户进行分类。
[0010]可选地,所述根据匹配结果以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离的步骤,具体包括:
[0011]根据匹配结果确定各分级地址的参考分值,并根据所述参考分值生成分级矩阵;
[0012]根据所述分级矩阵以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离。
[0013]可选地,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配的步骤,具体包括:
[0014]获取待分类用户的用户登记地址;
[0015]对预设分级地址表中各分级地址进行标识提取,获得分级标识,并根据所述分级标识确定各分级地址对应的待匹配分级;
[0016]在预设同义词集中查找所述待匹配分级对应的特征字符,并将所述用户登记地址与所述特征字符进行匹配。
[0017]可选地,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配的步骤之前,还包括:
[0018]对预设分级地址表中各分级地址进行模式化处理,获得模式文本;
[0019]通过预设聚类模型对所述模式文本进行层次聚类,获得预设同义词集;
[0020]基于所述预设同义词集对分级地址进行分层聚类,获得层次结构信息,并根据所述层次结构信息构建预设地址层次树。
[0021]可选地,所述通过预设聚类模型对所述模式文本进行层次聚类,获得预设同义词集的步骤,具体包括:
[0022]通过预设聚类模型对所述模式文本进行层次聚类,获得各聚类节点之间的聚类距离;
[0023]判断所述聚类距离是否大于预设阈值,并根据判断结果对所述模式文本进行分类,获得预设同义词集。
[0024]可选地,所述对预设分级地址表中各分级地址进行模式化处理,获得模式文本的步骤之前,所述用户分类方法还包括:
[0025]对预设分级地址表中各分级地址进行字符提取,获得各分级地址的地址字符;
[0026]查找所述地址字符对应的字符种类,并基于所述字符种类对各分级地址进行预处理,获得标准分级地址;
[0027]相应地,所述对预设分级地址表中各分级地址进行模式化处理,获得模式文本的步骤,具体包括:
[0028]对所述标准分级地址进行模式化处理,获得模式文本。
[0029]可选地,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配的步骤之前,所述用户分类方法还包括:
[0030]在待分类用户为预设移动用户时,获取所述待分类用户的用户信息;
[0031]根据所述用户信息通过预设家庭模型确定所述待分类用户对应的关联用户;
[0032]相应地,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址进行匹配的步骤,具体包括:
[0033]获取所述关联用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配。
[0034]此外,为实现上述目的,本专利技术还提出一种用户分类设备,所述用户分类设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的用户分类程序,所述用户分类程序配置为实现如上文所述的用户分类方法的步骤。
[0035]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有用户分类程序,所述用户分类程序被处理器执行时实现如上文所述的用户分类方法的步骤。
[0036]此外,为实现上述目的,本专利技术还提出一种用户分类装置,所述用户分类装置包括:匹配模块、确定模块、筛选模块和分类模块;
[0037]所述匹配模块,用于获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配;
[0038]所述确定模块,用于根据匹配结果以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离;
[0039]所述筛选模块,用于根据所述相似性距离对分级地址进行筛选,获得目标分级地址;
[0040]所述分类模块,用于在预设地址层次树上查找所述目标分级地址对应的位置信息,并根据所述位置信息对所述待分类用户进行分类。
[0041]本专利技术中,公开了获取待分类用户的用户登记地址,并将用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配,根据匹配结果以及预设度量学习模型确定用户登记地址与各分级地址之间的相似性距离,根据相似性距离对分级地址进行筛选,获得目标分级地址,在预设地址层次树上查找目标分级地址对应的位置信息,并根据位置信息对待分类用户进行分类。相较于现有技术中用户登记地址以散列的方式存储,无法确定各用户登记地址之间的关系的方式,由于本专利技术中,通过度量学习确定分级地址与用户登记地址之间的相似性距离,利用相似性距离确定用户登记地址对应的目标分级地址,并基于目标分级地址在预设地址层次树上的位置信息对待分类用户进行分类,从而能够将用户按照树形组织分类归档,提高用户分类的准确性和可靠性。
附图说明
[0042]图1是本专利技术实施例方案涉及的硬件运行环境的用户分类设备的结构示意图;
[0043]图2为本专利技术用户分类方法第一实施例的流程示意图;
[0044]图3为本专利技术用户分类方法第二实施例的流程示意图;
[0045]图4为本专利技术用户分类方法第三实施例的流程示意图;
[0046]图5为本专利技术用户分类装置第一实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户分类方法,其特征在于,所述用户分类方法包括以下步骤:获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配;根据匹配结果以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离;根据所述相似性距离对分级地址进行筛选,获得目标分级地址;在预设地址层次树上查找所述目标分级地址对应的位置信息,并根据所述位置信息对所述待分类用户进行分类。2.如权利要求1所述的用户分类方法,其特征在于,所述根据匹配结果以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离的步骤,具体包括:根据匹配结果确定各分级地址的参考分值,并根据所述参考分值生成分级矩阵;根据所述分级矩阵以及预设度量学习模型确定所述用户登记地址与各分级地址之间的相似性距离。3.如权利要求1所述的用户分类方法,其特征在于,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配的步骤,具体包括:获取待分类用户的用户登记地址;对预设分级地址表中各分级地址进行标识提取,获得分级标识,并根据所述分级标识确定各分级地址对应的待匹配分级;在预设同义词集中查找所述待匹配分级对应的特征字符,并将所述用户登记地址与所述特征字符进行匹配。4.如权利要求1

3中任一项所述的用户分类方法,其特征在于,所述获取待分类用户的用户登记地址,并将所述用户登记地址与预设分级地址表中各分级地址对应的特征字符进行匹配的步骤之前,还包括:对预设分级地址表中各分级地址进行模式化处理,获得模式文本;通过预设聚类模型对所述模式文本进行层次聚类,获得预设同义词集;基于所述预设同义词集对分级地址进行分层聚类,获得层次结构信息,并根据所述层次结构信息构建预设地址层次树。5.如权利要求4所述的用户分类方法,其特征在于,所述通过预设聚类模型对所述模式文本进行层次聚类,获得预设同义词集的步骤,具体包括:通过预设聚类模型对所述模式文本进行层次聚类,获得各聚类节点之间的聚类距离;判断所述聚类距离是否大于预设阈值,并根据判断结果对所述模式文本进行分类,获得预设同义词集。6.如权利要求4所述的用户分类方法,...

【专利技术属性】
技术研发人员:肖亮赵洋袁铁山徐海潮徐勇方勤
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1