一种推荐方法及装置制造方法及图纸

技术编号:21399174 阅读:16 留言:0更新日期:2019-06-19 07:02
本申请涉及计算机技术领域,公开了一种推荐方法及装置,其中方法包括:根据用户针对目标对象的待预测数据和预设编码规则生成特征序列,进而获取特征序列中各特征对应的概率分布信息,并分别计算得到各特征对应的特征向量;以及根据N个特征的取值和N个特征分别对应的特征向量,得到用户针对目标对象的预测分值;在预测分值大于或等于预设阈值时,向用户推荐目标对象。本申请实施例中,由于各特征对应的特征向量是根据各特征对应的概率分布信息得到的,从而使得各特征对应的特征向量较为准确,预测结果也较为准确,相比于直接使用点估计确定特征向量来说,本发明专利技术实施例中的预测结果更符合现实情况。

【技术实现步骤摘要】
一种推荐方法及装置
本申请涉及计算机
,尤其涉及一种推荐方法及装置。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,AI基础理论等。通过人工智能进行预测在推荐系统等领域有广泛的应用,比如,通过人工智能预测用户针对对象的预测分值,进而基于预测分值向用户推荐对象。以应用市场为例,通过对用户针对应用的预测分值(比如可以是用户点击应用的预测分值,该预测分值可以反映用户点击应用的可能性)进行统计,可以了解不同用户感兴趣的应用,从而向每个用户更精确地推送应用,以提高用户体验。准确地预测用户针对应用的预测分值可以提高实际场景中用户点击应用的概率,从而增加收益。预测用户针对应用的预测分值的一种实现方式为,通过历史统计得到用户针对应用的预测分值,即根据一段历史时间内每个应用的点击量除以展示量得到用户针对该应用的预测分值,并将点击率较高的应用推荐给用户。然而,由于用户点击应用可能会受到多种因素的影响,因此,上述方式仅基于每个应用的点击量和展示量来确定用户针对该应用的预测分值,导致预测不够准确,从而无法实现有效的推荐。因此,目前亟需一种推荐方法,用于解决用户针对对象的预测分值不准确而导致无法有效地向用户推荐对象的技术问题。
技术实现思路
有鉴于此,本申请提供了一种推荐方法及装置,用于解决用户针对对象的预测分值不准确而导致无法有效地向用户推荐对象的技术问题。第一方面,本申请实施例提供了一种推荐方法,包括:根据用户针对目标对象的待预测数据和预设编码规则生成特征序列,所述特征序列包括N个特征的取值,N为整数;获取所述特征序列中各特征对应的概率分布信息,并根据各特征对应的概率分布信息,分别计算得到各特征对应的特征向量;根据所述N个特征的取值和所述N个特征分别对应的特征向量,得到所述用户针对所述目标对象的预测分值;进而在所述预测分值大于或等于预设阈值时,向所述用户推荐所述目标对象。本申请实施例中,由于各特征对应的特征向量是根据各特征对应的概率分布信息得到的,从而使得各特征对应的特征向量较为准确,预测结果也较为准确,相比于直接使用点估计确定特征向量来说,本专利技术实施例中的预测结果更符合现实情况。在一种可能的设计中,特征a对应的概率分布信息包括R个元素所服从的概率分布信息,所述特征a为所述特征序列中的任一个特征,R为整数;所述根据各特征对应的概率分布信息,分别计算得到各特征对应的特征向量包括:根据所述R个元素所服从的概率分布信息,计算所述特征i对应的特征向量。在一种可能的设计中,若第一元素服从高斯分布,则所述第一元素所服从的概率分布信息包括所述高斯分布的均值和标准差,所述第一元素为所述R个元素中的任一个元素。在一种可能的设计中,若第二元素服从均匀分布,则所述第二元素所服从的概率分布信息包括最大值和最小值,所述第二元素为所述R个元素中的任一个元素。在一种可能的设计中,所述根据所述R个元素所服从的概率分布信息,计算所述特征a对应的特征向量,包括:根据所述R个元素所服从的概率分布信息和预设策略,分别计算出所述R个元素对应的值,并根据所述R个元素对应的值得到所述特征a对应的特征向量;所述特征a对应的特征向量为R维,所述R维的值与所述R个元素对应的值一一对应。在一种可能的设计中,所述预设策略为汤普森采样策略或置信区间上界策略。在一种可能的设计中,所述根据所述N个特征的取值和所述N个特征分别对应的特征向量,得到所述用户针对所述目标对象的预测分值,包括:根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值;所述特征b和所述特征c为所述特征序列中的任意两个特征;根据所述特征b和所述特征c交互的贡献值,得到二阶特征交互的贡献值;至少根据所述二阶特征交互的贡献值,得到所述用户针对所述目标对象的预测分值。在一种可能的设计中,所述特征序列中各特征分别对应一个特征向量;根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值,包括:根据所述特征b和所述特征c分别对应的特征向量的内积,计算得到第一值;根据所述第一值与所述特征b和特征c的取值的乘积,计算得到特征b和所述特征c交互的贡献值。如此,通过上述方式确定二阶特征交互的贡献值,相当于对FM模型中每个特征对应的特征向量进行了改进,由于每个特征对应的特征向量是基于每个特征对应的概率分布信息得到的,相比于FM模型来说,每个特征对应的特征向量更为准确,从而使得二阶特征交互的贡献值更为准确,因此,采用本申请实施例中方法得到的预测分值也更为准确。在一种可能的设计中,所述特征序列中各特征分别对应M个特征向量;所述特征序列包括M个域,特征a对应的M个特征向量为所述特征a分别与所述M个域构成的M个域感知特征向量,所述特征a为所述特征序列中的任一个特征;根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值,包括:根据所述特征b对应的第一特征向量和所述特征c对应的第二特征向量的内积,计算得到第二值;其中,所述第一特征向量为所述特征b与所述特征c所属的域构成的域感知特征向量,所述第二特征向量为所述特征c与所述特征b所属的域构成的域感知特征向量;根据所述第二值与所述特征b和特征c的取值的乘积,计算得到特征b和所述特征c交互的贡献值。如此,通过上述方式确定二阶特征交互的贡献值,相当于对FFM模型中每个特征对应的特征向量(即域感知特征向量)进行了改进。FFM模型中特征交互部分使用域感知特征向量,从而能够充分表达任意特征之间的交互,具有较强的表达能力,但由于表达能力增强,可能会使得FFM模型容易过拟合,即对训练数据预测得较为准确,但对于新数据,预测结果容易出现较大偏差,通过采用本专利技术实施例中的方法,即根据每个特征对应的概率分布信息得到每个特征对应的域感知特征向量,从而能够使得每个特征对应的域感知特征向量更为准确,且能够有效缓解过拟合问题。在一种可能的设计中,至少根据所述二阶特征交互的贡献值,得到所述用户针对所述目标对象的预测分值,包括:根据所述N个特征的取值和所述N个特征分别对应的权重值,得到一阶特征的贡献值;根据所述N个特征的取值、所述N个特征分别对应的特征向量和神经网络的权重矩阵,得到高阶特征交互的贡献值;将基准贡献值、所述一阶特征的贡献值、所述二阶特征交互的贡献值和所述高阶特征交互的贡献值进行加权求和,得到所述用户针对所述目标对象的预测分值。第二方面,本申请实施例提供一种装置,该装置可以是执行设备、或者还可以为设置在执行设备中的半导体芯片。该装置具有实现上述第一方面的各种可能的实现方式的功能。该功能本文档来自技高网
...

【技术保护点】
1.一种推荐方法,其特征在于,所述方法包括:根据用户针对目标对象的待预测数据和预设编码规则生成特征序列,所述特征序列包括N个特征的取值,N为整数;获取所述特征序列中各特征对应的概率分布信息,并根据各特征对应的概率分布信息,分别计算得到各特征对应的特征向量;根据所述N个特征的取值和所述N个特征分别对应的特征向量,得到所述用户针对所述目标对象的预测分值;在所述预测分值大于或等于预设阈值时,向所述用户推荐所述目标对象。

【技术特征摘要】
1.一种推荐方法,其特征在于,所述方法包括:根据用户针对目标对象的待预测数据和预设编码规则生成特征序列,所述特征序列包括N个特征的取值,N为整数;获取所述特征序列中各特征对应的概率分布信息,并根据各特征对应的概率分布信息,分别计算得到各特征对应的特征向量;根据所述N个特征的取值和所述N个特征分别对应的特征向量,得到所述用户针对所述目标对象的预测分值;在所述预测分值大于或等于预设阈值时,向所述用户推荐所述目标对象。2.根据权利要求1所述的方法,其特征在于,特征a对应的概率分布信息包括R个元素所服从的概率分布信息,所述特征a为所述特征序列中的任一个特征,R为整数;所述根据各特征对应的概率分布信息,分别计算得到各特征对应的特征向量包括:根据所述R个元素所服从的概率分布信息,计算所述特征a对应的特征向量。3.根据权利要求2所述的方法,其特征在于,若第一元素服从高斯分布,则所述第一元素所服从的概率分布信息包括所述高斯分布的均值和标准差,所述第一元素为所述R个元素中的任一个元素。4.根据权利要求2所述的方法,其特征在于,若第二元素服从均匀分布,则所述第二元素所服从的概率分布信息包括最大值和最小值,所述第二元素为所述R个元素中的任一个元素。5.根据权利要求2至4中任一项所述的方法,其特征在于,所述根据所述R个元素所服从的概率分布信息,计算所述特征i对应的特征向量,包括:根据所述R个元素所服从的概率分布信息和预设策略,分别计算出所述R个元素对应的值,并根据所述R个元素对应的值得到所述特征a对应的特征向量;所述特征a对应的特征向量为R维,所述R维的值与所述R个元素对应的值一一对应。6.根据权利要求5所述的方法,其特征在于,所述预设策略为汤普森采样策略或置信区间上界策略。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述根据所述N个特征的取值和所述N个特征分别对应的特征向量,得到所述用户针对所述目标对象的预测分值,包括:根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值;所述特征b和所述特征c为所述特征序列中的任意两个特征;根据所述特征b和所述特征c交互的贡献值,得到二阶特征交互的贡献值;至少根据所述二阶特征交互的贡献值,得到所述用户针对所述目标对象的预测分值。8.根据权利要求7所述的方法,其特征在于,所述特征序列中各特征分别对应一个特征向量;根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值,包括:根据所述特征b和所述特征c分别对应的特征向量的内积,计算得到第一值;根据所述第一值与所述特征b和特征c的取值的乘积,计算得到特征b和所述特征c交互的贡献值。9.根据权利要求7所述的方法,其特征在于,所述特征序列中各特征分别对应M个特征向量;所述特征序列包括M个域,特征a对应的M个特征向量为所述特征a分别与所述M个域构成的M个域感知特征向量,所述特征a为所述特征序列中的任一个特征;根据特征b和特征c的取值以及所述特征b和所述特征c分别对应的特征向量,计算得到所述特征b和所述特征c交互的贡献值,包括:根据所述特征b对应的第一特征向量和所述特征c对应的第二特征向量的内积,计算得到第二值;其中,所述第一特征向量为所述特征b与所述特征c所属的域构成的域感知特征向量,所述第二特征向量为所述特征c与所述第j特征所属的域构成的域感知特征向量;根据所述第二值与所述特征b和特征c的取值的乘积,计算得到特征b和所述特征c交互的贡献值。10.根据权利要求7至9中任一项所述的方法,其特征在于,至少根据所述二阶特征交互的贡献值,得到所述用户针对所述目标对象的预测分值,包括:根据所述N个特征的取值和所述N个特征分别对应的权重值,得到一阶特征的贡献值;根据所述N个特征的取值、所述N个特征分别对应的特征向量和神经网络的权重矩阵,得到高阶特征交互的贡献值;将基准贡献值、所述一阶特征的贡献值、所述二阶特征交互的贡献值和所述高阶特征交互的贡献值进行加权求和,得到所述用户针对所述目标对象的预测分值。11.一种装置,其特征在于,所述装置包...

【专利技术属性】
技术研发人员:余锦楷唐睿明董振华张宇宙刘卫文钱莉
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1