预测点击率的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20025902 阅读:18 留言:0更新日期:2019-01-06 04:44
本申请公开了一种预测点击率的方法、装置、计算机设备及存储介质,在该方法中,计算机设备获取用于预测目标用户对目标对象的点击概率的输入特征;依据该输入特征,分别确定多个预测模型用于预测该点击概率的适合程度;利用该多个预测模型分别预测该输入特征对应的预测点击率;依据该多个预测模型各自预测出的预测点击率以及该多个预测模型各自对应的适合程度,确定该目标用户对该目标对象的点击概率。本申请的方案可以提高预测用户对某个内容的点击概率的精准度。

【技术实现步骤摘要】
预测点击率的方法、装置、计算机设备及存储介质
本申请涉及计算机
,尤其涉及一种预测点击率的方法、装置、计算机设备及存储介质。
技术介绍
点击率是指网页中某一内容(如,新闻、广告或者产品详情页等等)被用户点击的次数与被显示次数之比,它反映的是该内容被用户点击的概率。而通过预测用户对某个内容的点击率,可以为是否向该用户推荐该内容相关的信息提供依据。在预测用户对某个内容的点击率时,一般会依据用户的用户特征(如,用户年龄、性别等)以及该内容的内容特征(如,内容的类别、内容所包含的关键词等),还可以结合背景数据(如,点击时间、内容的展现位置等),并利用预先训练出的预测模型预测点击率。然而,由于用户的用户特征以及内容的内容特征的复杂度较高,而预测模型所适合的预测场景有限,很难保证预测出的点击率的精准度,使得预测出的点击率的精准度较低。
技术实现思路
有鉴于此,本申请提供了一种预测点击率的方法、装置、计算机设备及存储介质,以提高预测用户对某个内容的点击概率的精准度。为实现上述目的,一方面,本申请提供了一种预测点击率的方法,包括:获取用于预测目标用户对目标对象的点击概率的输入特征;依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度;利用所述多个预测模型分别预测所述输入特征对应的预测点击率;依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。在一种可能的实现方式中,所述依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度,包括:依据特征与类别的函数关系,确定所述输入特征所归属的至少一个目标类别;依据所述至少一个目标类别以及各个预测模型分别与不同类别的适合程度关系,分别确定多个预测模型用于预测所述点击概率的适合程度。在一种可能的实现方式中,所述依据特征与类别的函数关系,确定所述输入特征所归属的至少一个目标类别,包括:利用预先训练的编码器将所述输入特征转换为表征所述输入特征所属的类别信息的隐向量;所述依据所述至少一个目标类别以及各个预测模型分别与不同类别的适合程度关系,分别确定多个预测模型用于预测所述点击概率的适合程度,包括:依据所述隐向量以及预先训练出的各个预测模型各自对应的类别向量,分别确定多个预测模型适合预测所述点击概率的适合程度。又一方面,本申请还提供了一种预测点击率的装置,包括:特征获取单元,用于获取用于预测目标用户对目标对象的点击概率的输入特征;适合度确定单元,用于依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度;点击率预估单元,用于利用所述多个预测模型分别预测所述输入特征对应的预测点击率;点击概率确定单元,用于依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。又一方面,本申请还提供了一种计算机设备,包括:处理器和存储器;其中,所述处理器用于执行所述存储器中存储的程序;所述存储器用于存储程序,所述程序至少用于:获取用于预测目标用户对目标对象的点击概率的输入特征;依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度;利用所述多个预测模型分别预测所述输入特征对应的预测点击率;依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。又一方面,本申请还提供了一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上任一项所述的预测点击率的方法。可见,在本申请实施例中,计算机设备中预置了多个预先训练好的预测模型,在获取到用于预测目标用户对目标对象的点击概率的输入特征之后,会先根据输入特征确定各个预测模型适用于对该输入特征预测点击概率的适合程度,这样,综合各个预测模型针对该输入特征预测出的预测点击率以及各预测模型的适合程度,有利于更为合理的确定出该目标用户对目标对象的点击概率,降低由于单个预测模型不适合对输入特征进行点击率预测而导致预测出的点击概率准确度偏低的情况,从而有利于提高预测出的点击概率的精准度。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1示出了本申请中预测模型预测点击率的一种示意图;图2示出了本申请实施例中预测点击率的系统的一种组成架构示意图;图3示出了本申请实施例中一种预测点击率的方法的一种流程示意图;图4示出了本申请预测点击概率的实现原理示意图;图5示出了本申请一种预测模型预测点击率的方法的又一种流程示意图;图6示出了本申请实施例中监督式变分编码器的神经网络实现示意图;图7示出了本申请实施例中训练编码器、预测模型以及预测模型的类型向量的一种训练流程示意图;图8示出了本申请实施例的一种预测点击率的方法所适用的一种应用场景的示意图;图9示出了本申请实施例的一种预测点击率的装置一种组成示意图;图10示出了本申请实施例的一种计算机设备的组成结构示意图。具体实施方式本申请的方案适用于预测用户对某个对象(如,新闻、广告、文章等)的点击概率(也称为点击率),并有利于提高预测出的用户对对象内容的点击概率的精准度。本申请的专利技术人经研究发现:目前在预测点击率时,一般是预先训练出预测模型,然后利用该预测模型对待预测的输入特征进行预测,以得到相应的点击概率。由于训练好的预测模型中的内部参数是固定的,使得预测模型对于任意输入特征均采用相同的预测标准,而同一种预测标准所适合的预测场景非常有限,从而使得基于该预测模型并不适合对任意输入特征进行点击率预测,进而导致预测出的点击率的精准度较低。如,输入特征一般会涉及到用户特征以及对象的对象特征,还可能会涉及到背景特征等特征维度,而不同用户对于不同对象的感兴趣程度会有所差异,甚至同一用户对于不同对象的感兴趣程度也会有存在明显差异,这就导致了输入特征的复杂性较高。而一款预测模型很难综合考虑所有输入特征的特性,从而使得预测模型可能针对某些输入特征的预测准确度较高,而针对其他输入特征,则无法准确预测出点击率,使得预测模型整体的预测精准度较低。为了便于理解本申请专利技术人的以上研究发现,下面以预测点击率的预测模型为预先训练出的分解机(FactorizationMachine,FM)模型为例进行说明。在FM模型中,可量化特征直接采用数值描述,不可量化特征采用单热编码(OneHotEncoding)来描述。其中,单热编码是指将不可量化特征根据其可能的取值表示成一个高维向量,每个值对应的向量中只有一个元素是1,其他元素均为0。如,假设输入特征包括用户ID和对象ID两种,以共包括3个用户分别为张三、李四、王五,且共包括3个对象分别为A、B、C为例,则,用户ID的单热编码是一个3维向量其中,表示“张三”的向量为:【1,0,0】;表示“李四”的向量为【0,1,0】;表示“王五”的向量为【0,0,1】。类似地,对象ID的单热编码也是一个3维向量,其中,表示对象A向量为【1,0,0】,表本文档来自技高网...

【技术保护点】
1.一种预测点击率的方法,其特征在于,包括:获取用于预测目标用户对目标对象的点击概率的输入特征;依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度;利用所述多个预测模型分别预测所述输入特征对应的预测点击率;依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。

【技术特征摘要】
1.一种预测点击率的方法,其特征在于,包括:获取用于预测目标用户对目标对象的点击概率的输入特征;依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度;利用所述多个预测模型分别预测所述输入特征对应的预测点击率;依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。2.根据权利要求1所述的预测点击率的方法,其特征在于,所述依据所述输入特征,分别确定多个预测模型用于预测所述点击概率的适合程度,包括:依据特征与类别的函数关系,确定所述输入特征所归属的至少一个目标类别;依据所述至少一个目标类别以及各个预测模型分别与不同类别的适合程度关系,分别确定多个预测模型用于预测所述点击概率的适合程度。3.根据权利要求2所述的预测点击率的方法,其特征在于,所述依据特征与类别的函数关系,确定所述输入特征所归属的至少一个目标类别,包括:利用预先训练的编码器将所述输入特征转换为表征所述输入特征所属的类别信息的隐向量;所述依据所述至少一个目标类别以及各个预测模型分别与不同类别的适合程度关系,分别确定多个预测模型用于预测所述点击概率的适合程度,包括:依据所述隐向量以及预先训练出的各个预测模型各自对应的类别向量,分别确定多个预测模型适合预测所述点击概率的适合程度。4.根据权利要求3所述的预测点击率的方法,其特征在于,依据所述隐向量以及预先训练出的各个预测模型各自对应的类别向量,分别确定多个预测模型适合预测所述点击概率的适合程度,包括:分别计算所述隐向量与预先训练出的各个预测模型各自的类别向量之间的向量距离;基于各个预测模型对应的向量距离,分别确定多个预测模型各自适合预测所述点击概率的适合程度。5.根据权利要求1至4任一项所述的预测点击率的方法,其特征在于,所述预测模型适合预测所述点击概率的适合程度为所述预测模型适合预测点击概率的权重,所述权重的大小表征不同的适合程度;所述依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率,包括:依据所述多个预测模型各自对应的权重,对多个预测模型预测出的预测点击率进行加权求和,将加权求和所得的结果确定为所述目标用户对所述目标对象的点击概率。6.根据权利要求1至4任一项所述的预测点击率的方法,其特征在于,所述利用所述多个预测模型分别预测所述输入特征对应的预测点击率,包括:依据各个预测模型对应的适合程度,从所述多个预测模型中选取出适合预测所述点击概率的至少一个目标预测模型;利用所述至少一个目标预测模型分别预测所述输入特征对应的预测点击率;所述依据所述多个预测模型各自预测出的预测点击率以及所述多个预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率,包括:依据所述至少一个目标预测模型预测出的预测点击率以及所述至少一个目标预测模型各自对应的适合程度,确定所述目标用户对所述目标对象的点击概率。7.根...

【专利技术属性】
技术研发人员:陈晓爽郑胤赵沛霖马文晔黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1