一种数据处理方法及相关装置制造方法及图纸

技术编号:37771952 阅读:26 留言:0更新日期:2023-06-06 13:37
一种数据处理方法,可以应用于信息推荐领域,方法包括:获取第一样本,所述第一样本包括第一数据;所述第一数据为用户属性、物品属性或者上下文信息;从多个嵌入表征中的每个嵌入表征中获取所述第一数据对应的一个第一嵌入向量;基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重;所述第一权重用于将多个所述第一嵌入向量进行融合,得到第一融合向量;至少根据所述第一融合向量,通过推荐模型,得到推荐结果。通过权重确定将多个嵌入向量进行组合,既可以捕捉领域间的共享知识,又可以组合出领域特异的嵌入向量,进而可以学习领域间的共性并捕获领域间差异,进而提高推荐模型的推荐精度。提高推荐模型的推荐精度。提高推荐模型的推荐精度。

【技术实现步骤摘要】
一种数据处理方法及相关装置


[0001]本申请涉及人工智能领域,尤其涉及一种数据处理方法及相关装置。

技术介绍

[0002]人工智能(artificial intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]选择率预测(或者称之为点击率预测),是指预测用户在特定环境下对某个物品的选择概率。例如,应用商店、在线广告等应用的推荐系统中,选择率预测起到关键作用;通过选择率预测可以实现最大化企业的收益和提升用户满意度,推荐系统需同时考虑用户对物品的选择率和物品竞价,其中,选择率为推荐系统根据用户历史行为预测得到,而物品竞价代表该物品被选择/下载后系统的收益。例如,可以通过构建一个函数,该函数可以根据预测的用户选择率和物品竞价计算得到一个函数值,推荐系统按照该函数值对物品进行降序排列。
[0004]为满足用户个性化的需求,推荐系统包括多种推荐场景:浏览器、负一屏、视频流等。用户根据偏好在不同的场景产生不同的行为,每个场景有用户特有的行为特性。在通常情况下,会为每一个场景单独建模。为单个场景独立建模,由于同一个用户在不同的场景中会有不同的行为,无法有效捕获用户不同场景下的行为特征,且在场景比较多的情况下,为每个场景独立建模并维护,会造成较大的人力和资源消耗。

技术实现思路

[0005]本申请提供了一种数据处理方法,可以学习领域间的共性并捕获领域间差异,进而提高推荐模型的推荐精度。
[0006]第一方面,本申请提供了一种数据处理方法,应用于目标推荐场景的信息推荐,所述方法包括:获取第一样本,所述第一样本包括第一数据;所述第一数据为用户属性、物品属性或者上下文信息;从多个嵌入表征中的每个嵌入表征中获取所述第一数据对应的一个第一嵌入向量;基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重;所述第一权重用于将多个所述第一嵌入向量进行融合,得到第一融合向量;至少根据所述第一融合向量,通过推荐模型,得到推荐结果。通过权重确定将多个嵌入向量进行组合,既可以捕捉领域间的共享知识,又可以组合出领域特异的嵌入向量,进而可以学习领域间的共性并捕获领域间差异,进而提高推荐模型的推荐精度。
[0007]在一种可能的实现中,每个所述嵌入表征包括多个嵌入向量,每个嵌入向量对应一个用户属性的类别、物品属性的类别或者上下文信息的类别。
[0008]在一种可能的实现中,所述第一样本还包括第二数据,所述第一数据和所述第二
数据不同;所述第二数据为用户属性、物品属性或者上下文信息;所述方法还包括:获取所述第二数据对应的第二嵌入向量;根据所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重;所述第二权重用于与所述第一融合向量进行融合,得到处理后的第一融合向量,所述第三权重用于与所述第二嵌入向量进行融合,得到处理后的第二嵌入向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述处理后的第一融合向量以及所述处理后的第二嵌入向量,通过推荐模型,得到推荐结果。
[0009]在一种可能的实现中,所述根据所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重,包括:根据所述目标推荐场景的信息、所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重。
[0010]由于某个领域可能偏向于某个特征,且不同的特征的影响因子不同,基于Feature Selection Network(特征选择网络)学习针对不同领域的特征重要性矩阵A,然后对原始embedding(E)进行升权或者降权,达到软性选择的目的,得到最终的特征V。本申请通过引入特征学习来捕获特定领域的特征偏好;学习针对不同领域的特征重要性矩阵,对原始embedding进行升权或者降权,提升模型捕捉特性和学习所有域的共性的能力。
[0011]在一种可能的实现中,所述方法还包括:根据所述目标推荐场景,从多个神经网络分支中选择所述目标推荐场景对应的至少一个神经网络分支;利用所述至少一个神经网络分支,处理所述第一融合向量,得到至少一个向量处理结果;所述至少一个向量处理结果用于融合得到第二融合向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述第二融合向量,通过推荐模型,得到推荐结果。
[0012]利用不同宽度的模块来级联学习领域的共性和特性,并且引入可学习方案来对分支网络进行选择。
[0013]在一种可能的实现中,所述利用所述至少一个神经网络分支,处理所述第一融合向量之前,所述方法还包括:通过目标MLP处理所述第一融合向量;所述利用所述至少一个神经网络分支,处理所述第一融合向量,包括:利用所述至少一个神经网络分支,处理通过所述目标MLP处理后的所述第一融合向量。
[0014]在一种可能的实现中,所述方法还包括:将通过所述目标MLP处理后的所述第一融合向量与所述第二融合向量进行融合。
[0015]在一种可能的实现中,所述目标推荐场景的信息具体为嵌入向量。
[0016]在一种可能的实现中,
[0017]不同的推荐场景为不同的应用程序;或者,
[0018]不同的推荐场景为不同类的应用程序;或者,
[0019]不同的推荐场景为同一个应用程序的不同功能。
[0020]在一种可能的实现中,所述属性信息包括所述用户的用户属性,所述用户属性包括如下的至少一种:性别,年龄,职业,收入,爱好,教育程度。
[0021]在一种可能的实现中,所述属性信息包括所述物品的物品属性,所述物品属性包括如下的至少一种:物品名称,开发者,安装包大小,品类,好评度。
[0022]在一种可能的实现中,不同的推荐场景为不同的应用程序;或者,
[0023]不同的推荐场景为不同类的应用程序;或者,
[0024]不同的推荐场景为同一个应用程序的不同功能。
[0025]在一种可能的实现中,所述装置还包括:
[0026]推荐模块,用于当所述推荐结果满足预设条件,确定向所述用户推荐所述物品。
[0027]第二方面,本申请提供了一种数据处理方法,所述方法包括:
[0028]获取第一样本,所述第一样本包括第一数据;所述第一数据为用户属性、物品属性或者上下文信息;
[0029]从多个嵌入表征中的每个嵌入表征中获取所述第一数据对应的一个第一嵌入向量;
[0030]基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重;所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于目标推荐场景的信息推荐,所述方法包括:获取第一样本,所述第一样本包括第一数据;所述第一数据为用户属性、物品属性或者上下文信息;从多个嵌入表征中的每个嵌入表征中获取所述第一数据对应的一个第一嵌入向量;基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重;所述第一权重用于将多个所述第一嵌入向量进行融合,得到第一融合向量;至少根据所述第一融合向量,通过推荐模型,得到推荐结果。2.根据权利要求1所述的方法,其特征在于,每个所述嵌入表征包括多个嵌入向量,每个嵌入向量对应一个用户属性的类别、物品属性的类别或者上下文信息的类别。3.根据权利要求1或2所述的方法,其特征在于,所述第一样本还包括第二数据,所述第一数据和所述第二数据不同;所述第二数据为用户属性、物品属性或者上下文信息;所述方法还包括:获取所述第二数据对应的第二嵌入向量;根据所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重;所述第二权重用于与所述第一融合向量进行融合,得到处理后的第一融合向量,所述第三权重用于与所述第二嵌入向量进行融合,得到处理后的第二嵌入向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述处理后的第一融合向量以及所述处理后的第二嵌入向量,通过推荐模型,得到推荐结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重,包括:根据所述目标推荐场景的信息、所述第一融合向量以及所述第二嵌入向量,确定所述第一融合向量对应的第二权重、以及所述第二嵌入向量对应的第三权重。5.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:根据所述目标推荐场景,从多个神经网络分支中选择所述目标推荐场景对应的至少一个神经网络分支;利用所述至少一个神经网络分支,处理所述第一融合向量,得到至少一个向量处理结果;所述至少一个向量处理结果用于融合得到第二融合向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述第二融合向量,通过推荐模型,得到推荐结果。6.根据权利要求5所述的方法,其特征在于,所述利用所述至少一个神经网络分支,处理所述第一融合向量之前,所述方法还包括:通过目标MLP处理所述第一融合向量;所述利用所述至少一个神经网络分支,处理所述第一融合向量,包括:利用所述至少一个神经网络分支,处理通过所述目标MLP处理后的所述第一融合向量。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:将通过所述目标MLP处理后的所述第一融合向量与所述第二融合向量进行融合。
8.根据权利要求1至7任一所述的方法,其特征在于,所述目标推荐场景的信息具体为嵌入向量。9.根据权利要求1至8任一所述的方法,其特征在于,不同的推荐场景为不同的应用程序;或者,不同的推荐场景为不同类的应用程序;或者,不同的推荐场景为同一个应用程序的不同功能。10.一种数据处理方法,其特征在于,所述方法包括:获取第一样本,所述第一样本包括第一数据;所述第一数据为用户属性、物品属性或者上下文信息;从多个嵌入表征中的每个嵌入表征中获取所述第一数据对应的一个第一嵌入向量;基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重;所述第一权重用于将多个所述第一嵌入向量进行融合,得到第一融合向量;至少根据所述第一融合向量,通过推荐模型,得到推荐结果;根据所述推荐结果与对应的真值,更新所述多个嵌入表征以及所述推荐模型。11.根据权利要求10所述的方法,其特征在于,所述基于所述目标推荐场景的信息,确定每个所述第一嵌入向量对应的第一权重,包括:基于所述目标推荐场景的信息,通过第一权重确定网络,确定每个所述第一嵌入向量对应的第一权重;所述根据所述推荐结果与对应的真值,更新所述多个嵌入表征以及所述推荐模型,包括:根据所述推荐结果与对应的真值,更新所述多个嵌入表征、所述推荐模型以及所述第一权重确定网络。12.根据权利要求10或11所述的方法,其特征在于,所述第一样本还包括第二数据,所述第一数据和所述第二数据不同;所述第二数据为用户属性、物品属性或者上下文信息;所述方法还包括:获取所述第二数据对应的第二融合向量;根据所述第一融合向量以及所述第二融合向量,通过第二权重确定网络,确定所述第一融合向量对应的第二权重、以及所述第二融合向量对应的第三权重;所述第二权重用于与所述第一融合向量进行融合,得到处理后的第一融合向量,所述第三权重用于与所述第二融合向量进行融合,得到处理后的第二融合向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述处理后的第一融合向量以及所述处理后的第二融合向量,通过推荐模型,得到推荐结果;所述根据所述推荐结果与对应的真值,更新所述多个嵌入表征以及所述推荐模型,包括:根据所述推荐结果与对应的真值,更新所述多个嵌入表征、所述推荐模型以及所述第二权重确定网络。13.根据权利要求10至12任一所述的方法,其特征在于,所述方法还包括:根据所述目标推荐场景的信息,通过分支确定网络,确定多个神经网络分支中每个神
经网络分支对应的分值;所述分值用于从所述多个神经网络分支中选择所述目标推荐场景对应的至少一个神经网络分支;利用所述至少一个神经网络分支,处理所述第一融合向量,得到至少一个向量处理结果;所述至少一个向量处理结果用于融合得到第二融合向量;所述至少根据所述第一融合向量,通过推荐模型,得到推荐结果,包括:至少根据所述第二融合向量,通过推荐模型,得到推荐结果;所述根据所述推荐结果与对应的真值,更新所述多个嵌入表征以及所述推荐模型,包括:根据所述推荐结果与对应的真值,更新所述多个嵌入表征、所述推荐模型以及所述分支确定...

【专利技术属性】
技术研发人员:张琪夏雪松李璟洁唐睿明董振华张瑞
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1