一种目标对象的确定方法、装置、介质及设备制造方法及图纸

技术编号:30425342 阅读:17 留言:0更新日期:2021-10-24 16:57
本发明专利技术公开了一种目标对象的确定方法、装置、介质及设备,包括:获取源域数据集和目标域数据集,源域数据集中的每个源域数据元素均包括第一用户的第一特征、第二特征和标签,目标域数据集中的每个目标域数据元素均只包括第二用户的第二特征;根据通过源域数据集对第一机器学习模型进行训练的结果,对目标域数据集进行预测得到第二用户的第一特征;根据通过自定义第二特征以及第一用户的第一特征和标签对第二机器学习模型进行训练的结果,对自定义第二特征和第二用户的第一特征进行预测得到第二用户的预测标签;根据第二用户的预测标签确定目标对象。本发明专利技术涉及机器学习,基于多方特征提升对象预测的准确度,也使得预测模型能适用于多种任务场景。适用于多种任务场景。适用于多种任务场景。

【技术实现步骤摘要】
一种目标对象的确定方法、装置、介质及设备


[0001]本专利技术涉及机器学习领域,具体涉及一种目标对象的确定方法、装置、介质及设备。

技术介绍

[0002]随着人工智能的发展,机器学习模型已广泛应用到各行各业,在各个场景发挥着非常重要的作用。为了满足一平台(平台不限于各类应用、品牌、企业)对另一平台上的用户提供业务以促进用户活跃量或进行业务推广的需求,基于机器学习模型根据两个平台上的用户特征进行联合预测,选取符合一定预测值的用户人群作为业务提供对象,所选中的用户人群能较大概率地符合业务指标,从而满足一平台的业务需求,对于用户而言也可获得个性化的业务服务。
[0003]在此类应用场景下,为了使机器学习模型能够产品化、通用化以及发挥多方用户数据的优势,两个平台上的用户特征缺一不可。但在具体实践时,会有其中一个平台的用户特征缺失的情况。此时模型适用于如促进老客户的活跃度的应用场景,但是不适用于如拉取新客户这一类应用场景,因为对于新客户或称另一平台的潜在用户群而言并不具备在一平台上的用户特征(因为还没有成为一平台的用户)。另一方面,一平台上的用户特征的缺失也会影响模型预测结果的实际效用。

技术实现思路

[0004]为了能更精准的预测目标对象以及使模型能够产品化通用化以满足不同任务场景的需求,本专利技术提供了一种目标对象的确定方法、装置、介质及设备。所述技术方案如下:
[0005]第一方面,本专利技术提供了一种目标对象的确定方法,所述方法包括:
[0006]获取源域数据集和目标域数据集,所述源域数据集中的每个源域数据元素均包括第一用户的第一特征、第二特征和标签,所述目标域数据集中的每个目标域数据元素均只包括第二用户的第二特征;
[0007]根据所述源域数据集对第一机器学习模型进行训练,得到第一预测模型;
[0008]基于所述第一预测模型,根据所述目标域数据集进行预测,得到所述第二用户的第一特征;
[0009]获取自定义第二特征,根据所述自定义第二特征以及所述第一用户的第一特征和标签对第二机器学习模型进行训练,得到第二预测模型;
[0010]基于所述第二预测模型,根据所述自定义第二特征和所述第二用户的第一特征进行预测,得到所述第二用户的预测标签;
[0011]根据所述第二用户的预测标签确定目标对象,以对所述目标对象提供业务;
[0012]其中,所述第一用户为第一平台和第二平台的共同用户,所述第二用户为所述第二平台的用户;所述第一特征表征用户在所述第一平台的特征,所述第二特征表征用户在所述第二平台的特征。
[0013]第二方面,本专利技术提供了一种目标对象的确定装置,所述装置包括:
[0014]获取模块,用于获取源域数据集和目标域数据集,所述源域数据集中的每个源域数据元素均包括第一用户的第一特征、第二特征和标签,所述目标域数据集中的每个目标域数据元素均只包括第二用户的第二特征;
[0015]第一训练模块,用于根据所述源域数据集对第一机器学习模型进行训练,得到第一预测模型;
[0016]第一预测模块,用于基于所述第一预测模型,根据所述目标域数据集进行预测,得到所述第二用户的第一特征;
[0017]第二训练模块,用于获取自定义第二特征,根据所述自定义第二特征以及所述第一用户的第一特征和标签对第二机器学习模型进行训练,得到第二预测模型;
[0018]第二预测模块,用于基于所述第二预测模型,根据所述自定义第二特征和所述第二用户的第一特征进行预测,得到所述第二用户的预测标签;
[0019]对象确定模块,用于根据所述第二用户的预测标签确定目标对象,以对所述目标对象提供业务;
[0020]其中,所述第一用户为第一平台和第二平台的共同用户,所述第二用户为所述第二平台的用户;所述第一特征表征用户在所述第一平台的特征,所述第二特征表征用户在所述第二平台的特征。
[0021]第三方面,本专利技术提供了一种计算机存储介质,所述计算机存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如第一方面所述的一种目标对象的确定方法。
[0022]第四方面,本专利技术提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由所述处理器加载并执行如第一方面所述的一种目标对象的确定方法。
[0023]本专利技术提供的一种目标对象的确定方法、装置、介质及设备,具有如下技术效果:
[0024](1)本专利技术提供的方案基于迁移学习预测用户在其他平台上的特征,以联合多方特征进行对象预测和选择,提升预测的准确性和预测结果的实际效用;
[0025](2)本专利技术提供的方案通过特征预测补充使得预测模型产品化、通用化,能应用于多种任务场景。
[0026]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0027]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0028]图1是本专利技术实施例提供的一种目标对象的确定方法的实施环境示意图;
[0029]图2是本专利技术实施例提供的一种目标对象的确定方法的流程示意图;
[0030]图3是本专利技术实施例提供的一种执行目标对象的确定方法的数据管理平台的任务
处理流程示意图;
[0031]图4是本专利技术实施例提供的另一种目标对象的确定方法的流程示意图;
[0032]图5是本专利技术实施例提供的另一种目标对象的确定方法的流程示意图;
[0033]图6是本专利技术实施例提供的一种目标对象的确定方法中执行模型训练的流程示意图;
[0034]图7(1)至(3)是本专利技术实施例提供的基于数据管理平台执行模型训练任务的步骤流程示意图;
[0035]图8是本专利技术实施例提供的一种目标对象的确定方法中执行模型预测的流程示意图;
[0036]图9是本专利技术实施例提供的一种目标对象的确定装置的结构示意图。
[0037]图10是本专利技术实施例提供的用于实现一种目标对象的确定方法的设备的硬件结构示意图。
具体实施方式
[0038]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象的确定方法,其特征在于,所述方法包括:获取源域数据集和目标域数据集,所述源域数据集中的每个源域数据元素均包括第一用户的第一特征、第二特征和标签,所述目标域数据集中的每个目标域数据元素均只包括第二用户的第二特征;根据所述源域数据集对第一机器学习模型进行训练,得到第一预测模型;基于所述第一预测模型,根据所述目标域数据集进行预测,得到所述第二用户的第一特征;获取自定义第二特征,根据所述自定义第二特征以及所述第一用户的第一特征和标签对第二机器学习模型进行训练,得到第二预测模型;基于所述第二预测模型,根据所述自定义第二特征和所述第二用户的第一特征进行预测,得到所述第二用户的预测标签;根据所述第二用户的预测标签确定目标对象,以对所述目标对象提供业务;其中,所述第一用户为第一平台和第二平台的共同用户,所述第二用户为所述第二平台的用户;所述第一特征表征用户在所述第一平台的特征,所述第二特征表征用户在所述第二平台的特征。2.根据权利要求1所述的一种目标对象的确定方法,其特征在于,所述方法还包括:获取任务需求,所述任务需求至少包含模型配置需求、人群选择需求、特征选择需求;根据所述模型配置需求创建第一机器学习模型和第二机器学习模型;根据所述人群选择需求,确定第一用户集和第二用户集;根据所述特征选择需求,确定自定义第二特征。3.根据权利要求2所述的一种目标对象的确定方法,其特征在于,所述获取源域数据集包括:根据所述第一用户集确定所述第一用户集中各个第一用户的身份标识和标签;获取通过数据集接口上传的用户行为数据;根据所述用户行为数据进行特征规范管理和特征匹配,生成所述各个第一用户的第一特征;根据所述各个第一用户的身份标识从数据仓库中获取所述各个第一用户的第二特征;将所述各个第一用户的身份标识、第一特征、第二特征和标签作为源域数据集。4.根据权利要求2所述的一种目标对象的确定方法,其特征在于,所述获取目标域数据集包括:根据所述第二用户集确定所述第二用户集中各个第二用户的的身份标识;根据所述各个第二用户的身份标识从数据仓库中获取所述各个第二用户的第二特征;将所述各个第二用户的身份标识和第二特征作为目标域数据集。5.根据权利要求1所述的一种目标对象的确定方法,其特征在于,所述方法还包括:通过所述第一用户的第一特征和标签对第三机器学习模型进行训练,得到特征向量表示模型;根据所述特征表示向量模型获取所述第一用户的第一特征嵌入向量,更新所述源域数据集。6.根据权利要求5所述的一种目标对象的确定方法,其特征在于,所述根据所述源域数
据集对第一机器学习模型进行训练,得到第一预测模型和所述根据所述自定义第二特征以及所述第一用户的第一特征和标签对第二机器学习模型进行训练,得到第二预测模型包括:根据所述第一用户的第二特征、标签和第一特征嵌入向量对第一机器学习模型进行训...

【专利技术属性】
技术研发人员:顾立瑞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1