潜在用户识别方法、设备、存储介质及装置制造方法及图纸

技术编号:39051040 阅读:10 留言:0更新日期:2023-10-12 19:43
本发明专利技术涉及元宇宙技术领域,公开了一种潜在用户识别方法、设备、存储介质及装置,该方法包括:将潜在用户挖掘场景拆分为多个潜在用户挖掘子场景,基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,通过多个子场景半监督模型对潜在用户进行识别;由于本发明专利技术中针对不同的潜在用户挖掘子场景利用不同的模型进行潜在用户识别,并且基于多模型协同半监督学习机制构建模型,从而能够提高潜在用户识别的准确率,进而能够提高潜在用户识别效率,提升业务推广效果。果。果。

【技术实现步骤摘要】
潜在用户识别方法、设备、存储介质及装置


[0001]本专利技术涉及元宇宙
,尤其涉及一种潜在用户识别方法、设备、存储介质及装置。

技术介绍

[0002]如何准确识别出潜在用户群体是业务推广的关键,而现有的潜在用户识别方式受限于当前业务发展阶段、数据样本以及技术条件的限制,识别效率较低,业务推广效果较差。

技术实现思路

[0003]本专利技术的主要目的在于提供一种潜在用户识别方法、设备、存储介质及装置,旨在解决现有的潜在用户识别方式受限于当前业务发展阶段、数据样本以及技术条件的限制,识别效率较低,业务推广效果较差的技术问题。
[0004]为实现上述目的,本专利技术提供一种潜在用户识别方法,所述潜在用户识别方法包括:
[0005]将潜在用户挖掘场景拆分为多个潜在用户挖掘子场景;
[0006]基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型;
[0007]通过所述多个子场景半监督模型对潜在用户进行识别。
[0008]可选地,所述多模型协同半监督学习机制包括:正负样本均衡化处理,所述基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:
[0009]基于有标签样本数据组成有标签样本集,并对所述有标签样本集进行拆分,获得模型训练集和模型测试集;
[0010]在所述模型训练集中的正负样本比例不均衡时,基于扩张系数对所述模型训练集进行样本均衡化处理,获得新模型训练集;
[0011]基于所述新模型训练集对基模型进行训练;
[0012]基于训练后的基模型和模型测试集构建多个潜在用户挖掘子场景对应的多个子场景半监督模型。
[0013]可选地,所述多模型协同半监督学习机制还包括:多种基模型构建算法;所述基模型包括:第一基模型、第二基模型以及第三基模型,所述第一基模型采用决策树算法作为基模型算法,所述第二基模型采用逻辑回归算法作为基模型算法,所述第三基模型采用随机森林算法作为基模型算法,所述第一基模型和所述第三基模型采用加权损失函数,所以第二基模型采用交叉熵定义损失函数。
[0014]可选地,所述多模型协同半监督学习机制还包括:伪标签标注技术;所述基于训练后的基模型和模型测试集构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:
[0015]基于训练后的基模型分别对无标签样本数据和模型测试集进行基模型推理;
[0016]根据推理结果分别对无标签样本数据和模型测试集进行伪标签标注;
[0017]基于当前参数条件下的伪标签筛选阈值对已进行伪标签标注的无标签样本集进
行样本筛选,直至当前参数条件下的模型迭代优化终止,获得多个潜在用户挖掘子场景对应的多个子场景半监督模型。
[0018]可选地,所述模型协同半监督学习机制还包括:多参数全域搜索机制;所述获得多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:
[0019]基于参数全域搜索机制更新当前参数条件,并基于更新后的当前参数条件进行新一轮的基模型迭代优化;
[0020]基于参数全域搜索机制下输出的每个参数组合的基模型及模型评估结果筛选出多个潜在用户挖掘子场景对应的多个子场景半监督模型。
[0021]可选地,所述基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:
[0022]构建建模指标集,所述建模指标集包括辅助性建模指标集和核心建模指标集,所以核心建模指标集中包括多个维度的业务特征指标;
[0023]基于所述建模指标集和多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型。
[0024]可选地,所述通过所述多个子场景半监督模型对潜在用户进行识别,包括:
[0025]以各子场景半监督模型的建模字段作为推理输入特征分别通过各子场景半监督模型对待识别用户进行推理,获得各子场景的模型矩阵;
[0026]根据所述模型矩阵计算各子场景半监督模型的权重值;
[0027]基于所述权重值通过所述多个子场景半监督模型对潜在用户进行识别。
[0028]此外,为实现上述目的,本专利技术还提出一种潜在用户识别设备,所述潜在用户识别设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的潜在用户识别程序,所述潜在用户识别程序配置为实现如上文所述的潜在用户识别方法。
[0029]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有潜在用户识别程序,所述潜在用户识别程序被处理器执行时实现如上文所述的潜在用户识别方法。
[0030]此外,为实现上述目的,本专利技术还提出一种潜在用户识别装置,所述潜在用户识别装置包括:场景拆分模块、模型构建模块以及用户识别模块;
[0031]所述场景拆分模块,用于将潜在用户挖掘场景拆分为多个潜在用户挖掘子场景;
[0032]所述模型构建模块,用于基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型;
[0033]所述用户识别模块,用于通过所述多个子场景半监督模型对潜在用户进行识别。
[0034]在本专利技术中,公开了将潜在用户挖掘场景拆分为多个潜在用户挖掘子场景,基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,通过多个子场景半监督模型对潜在用户进行识别;由于本专利技术中针对不同的潜在用户挖掘子场景利用不同的模型进行潜在用户识别,并且基于多模型协同半监督学习机制构建模型,从而能够提高潜在用户识别的准确率,进而能够提高潜在用户识别效率,提升业务推广效果。
附图说明
[0035]图1是本专利技术实施例方案涉及的硬件运行环境的潜在用户识别设备的结构示意图;
[0036]图2为本专利技术潜在用户识别方法第一实施例的流程示意图;
[0037]图3为本专利技术潜在用户识别方法一实施例的搜索提示示意图;
[0038]图4为本专利技术潜在用户识别方法第二实施例的流程示意图;
[0039]图5为本专利技术潜在用户识别方法一实施例的多模型协同半监督学习机制示意图;
[0040]图6为本专利技术潜在用户识别方法一实施例的伪标签标注方法示意图;
[0041]图7为本专利技术潜在用户识别方法第三实施例的流程示意图;
[0042]图8为本专利技术潜在用户识别方法第三实施例的流程示意图;
[0043]图9为本专利技术潜在用户识别装置第一实施例的结构框图。
[0044]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0045]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0046]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的潜在用户识别设备结构示意图。
[0047]如图1所示,该潜在用户识别设备可以包括:处理器1001,例如中央处理器(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种潜在用户识别方法,其特征在于,所述潜在用户识别方法包括:将潜在用户挖掘场景拆分为多个潜在用户挖掘子场景;基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型;通过所述多个子场景半监督模型对潜在用户进行识别。2.如权利要求1所述的潜在用户识别方法,其特征在于,所述多模型协同半监督学习机制包括:正负样本均衡化处理,所述基于多模型协同半监督学习机制构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:基于有标签样本数据组成有标签样本集,并对所述有标签样本集进行拆分,获得模型训练集和模型测试集;在所述模型训练集中的正负样本比例不均衡时,基于扩张系数对所述模型训练集进行样本均衡化处理,获得新模型训练集;基于所述新模型训练集对基模型进行训练;基于训练后的基模型和模型测试集构建多个潜在用户挖掘子场景对应的多个子场景半监督模型。3.如权利要求2所述的潜在用户识别方法,其特征在于,所述多模型协同半监督学习机制还包括:多种基模型构建算法;所述基模型包括:第一基模型、第二基模型以及第三基模型,所述第一基模型采用决策树算法作为基模型算法,所述第二基模型采用逻辑回归算法作为基模型算法,所述第三基模型采用随机森林算法作为基模型算法,所述第一基模型和所述第三基模型采用加权损失函数,所以第二基模型采用交叉熵定义损失函数。4.如权利要求2所述的潜在用户识别方法,其特征在于,所述多模型协同半监督学习机制还包括:伪标签标注技术;所述基于训练后的基模型和模型测试集构建多个潜在用户挖掘子场景对应的多个子场景半监督模型,包括:基于训练后的基模型分别对无标签样本数据和模型测试集进行基模型推理;根据推理结果分别对无标签样本数据和模型测试集进行伪标签标注;基于当前参数条件下的伪标签筛选阈值对已进行伪标签标注的无标签样本集进行样本筛选,直至当前参数条件下的模型迭代优化终止,获得多个潜在用户挖掘子场景对应的多个子场景半监督模型。5.如权利要求4所述的潜在用户识别方法,其特征在于,所述模型协同半监督学习机制还包括:多参数全域搜索机制;所述...

【专利技术属性】
技术研发人员:刘亮孙小娟蒋强
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1