信息预测方法技术

技术编号:21914122 阅读:18 留言:0更新日期:2019-08-21 12:28
本申请公开了信息预测方法。该方法的一具体实施方式包括:获取预测样本;确定所述预测样本中的用于计算所述预测样本对应的预测值的特征的特征值;基于所述特征的特征值,计算所述预测样本对应的预测值,其中,所述预测样本对应的预测值指示与所述预测样本相关联的事件的发生概率。实现了结合用户的特征和待推送给用户的推送信息的特征,对用户点击待推送给用户的推送信息的概率进行预测,进而根据计算出的概率进行较为精确地推送。

Information Prediction Method

【技术实现步骤摘要】
信息预测方法
本申请涉及计算机领域,具体涉及互联网领域,尤其涉及信息预测方法。
技术介绍
在一些应用中,提供向用户推送诸如广告的推送信息的功能。目前,通常是依据诸如用户对于推送信息的点击的历史记录,预测用户是否会点击待推送给用户的广告。然而,在诸如向无点击记录的应用的新用户、待推送给用户的广告为新出现的广告等情况下,无法对用户是否会点击待推送给用户的广告进行预测,难以进行较为精确地推送。
技术实现思路
本申请提供了信息预测方法,该方法包括:获取预测样本;确定所述预测样本中的用于计算所述预测样本对应的预测值的特征的特征值;基于所述特征的特征值,计算所述预测样本对应的预测值,其中,所述预测样本对应的预测值指示与所述预测样本相关联的事件的发生概率。本申请提供的信息预测方法,通过获取预测样本;确定所述预测样本中的用于计算所述预测样本对应的预测值的特征的特征值;基于所述特征的特征值,计算所述预测样本对应的预测值,其中,所述预测样本对应的预测值指示与所述预测样本相关联的事件的发生概率。实现了结合用户的特征和待推送给用户的推送信息的特征,对用户点击待推送给用户的推送信息的概率进行预测,进而根据计算出的概率进行较为精确地推送。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1示出了可以应用于本申请的信息预测方法的实施例的示例性系统架构;图2示出了根据本申请的信息预测方法的一个实施例的流程图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用于本申请的信息预测方法的示例性系统架构。如图1所示,系统架构可以包括终端101、102、103,网络104和服务器105。网络104用以在终端101、102、103和服务器105之间提供传输链路的介质。网络104可以为无线传输链路。用户可以使用终端101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端101、102、103上可以安装有WIFI应用,该WIFI应用可以提供海量的无线接入点的接入信息。终端101、102、103可以是具有显示屏并且支持网络通信的各种服务器,包括但不限于智能手机、平板电脑、笔记本电脑。服务器105可以通过WIFI应用向终端101、102、103的用户推送广告,服务器105可以获取到终端101、102、103的用户的特征,根据终端101、102、103的用户的性别、年龄等特征的特征值,结合待推送给终端101、102、103的用户的广告的特征的特征值,预测终端101、102、103的用户点击待推送给终端101、102、103的用户的广告的概率。请参考图2,其示出了根据本申请的信息预测方法的一个实施例的流程图。该方法可以由服务器例如(例如图1中的服务器105)执行,该方法包括:步骤201,获取预测样本。在本实施例中,一个预测样本与一个待预测发生概率的事件相关联。当预测一个事件的发生概率时,需要首先获取与该事件相关联的预测样本,该预测样本中包含该事件涉及的对象的多个特征的特征值。例如,待预测发生概率的事件为一个用户点击一个广告,该事件涉及的对象包括:该用户、该广告。当需要预测该事件的概率时,可以首先获取该用户的性别、年龄、职业等多个特征的特征值和该广告的展示位置、内容类型、尺寸等多个特征的特征值,该用户的多个特征的特征值和该广告的多个特征的特征值构成一个与该事件关联的预测样本,从而获取到与该事件相关联的预测样本,该预测样本对应的预测值为该用户点击该广告的概率。步骤202,确定预测样本中的用于计算该预测样本对应的预测值的特征的特征值。在本实施例中,在通过步骤201确获取预测样本之后,可以确定预测样本中的用于计算该样本对应的预测值的特征的特征值。用于计算预测样本对应的预测值的特征可以为该预测样本中的特征值为非零值的特征,特征值为非零值的特征可以称之为非零特征。例如,待预测发生概率的事件为一个用户点击一个广告,一个预测样本中包含该用户的性别、年龄、职业等多个特征的特征值和该广告的展示位置、内容类型、尺寸等多个特征的特征值,可以从获取到的预测样本中的该用户的非零特征和预测样本中的该广告的非零特征确定为预测样本对应的预测值的特征,同时,可以确定该预测样本中的每一个用于计算该预测样本对应的预测值的非零特征的特征值。步骤203,基于预测样本中的用于计算该预测样本对应的预测值的特征的特征值,计算预测样本对应的预测值。在本实施例中,在通过步骤202确定预测样本中的用于计算预测样本对应的预测值的特征的特征值之后,可以基于预测样本中的用于计算该预测样本对应的预测值的特征的特征值,计算预测样本对应的预测值。例如,待预测发生概率的事件为一个用户点击一个广告。获取到的预测样本中包含该用户的多个特征的特征值和该广告的多个特征的特征值。该预测样本对应的预测值为该事件发生的概率。可以预先对海量的推送记录进行聚类,每一条推送记录中记录有特征和标识是否点击了广告的标识。特征包括:一个广告的特征、该广告推送给的用户的特征。可以根据推送记录中的特征对推送记录进行聚类,例如,可以生成推送记录中的特征对应向量,向量中的每一个分量对应一个特征,可以利用向量的相似度进行聚类。从而,具有相同的特征的推送记录可以在一个聚类结果中。对于聚合在一个聚类结果中的推送记录,可以计算出包含指示点击了广告的标识的推送记录与该聚类结果中的所有推送记录的比例,建立聚类结果与计算出的比例的对应关系。在计算该预测样本对应的预测值时,可以首先生成用于计算预测样本对应的预测值的特征对应的向量,然后,查找出具有与该向量的相似度大于相似度阈值的向量的聚类结果,将该聚类结果对应的比例作为该预测样本对应的预测值即该用户点击该广告的概率。在本实施例的一些可选的实现方式中,可以预先对所有可能被用于计算预测值的特征划分为多个域。属于一个域的特征相对于每一个其他域可以分别具有一个预设权重向量。在利用一个预测样本中的每一个用于计算该预测样本对应的预测值的非零特征的特征值计算一个预测样本对应的预测值时,可以计算第一预设参数、第二预设参数的参数值,然后,可以基于第一预设参数、第二预设参数的参数值,计算预测样本对应的预测值。第一预设参数表示该预测样本的所有非零特征中属于一个域的每一个非零特征的特征值与非零特征相对于另一个域的预设权重向量之和,第二预设参数表示该预测样本的所有非零特征中的每一个非零特征的特征值的平方与非零特征相对于非零特征所属的域的权重向量的平方的乘积之和。在基于第一预设参数、第二预设参数的参数值,计算预测样本对应的预测值时,可以基于以下预测公式基于第一预设参数、第二预设参数的参数值,计算预测样本对应的预测值:其中,为第一预设参数;为第二预设参数;中的xi表示预测样本的所有非零特征中的属于域fa的第i个特征;中的wi,fb表示预测样本的所有非零特征中的属于域f本文档来自技高网...

【技术保护点】
1.一种信息预测方法,其特征在于,所述方法包括:获取预测样本;确定所述预测样本中的用于计算所述预测样本对应的预测值的特征的特征值;基于所述特征的特征值,计算所述预测样本对应的预测值,其中,所述预测样本对应的预测值指示与所述预测样本相关联的事件的发生概率。

【技术特征摘要】
1.一种信息预测方法,其特征在于,所述方法包括:获取预测样本;确定所述预测样本中的用于计算所述预测样本对应的预测值的特征的特征值;基于所述特征的特征值,计算所述预测样本对应的预测值,其中,所述预测样本对应的预测值指示与所述预测样本相关联的事件的发生概率。2.根据权利要求1所述的方法,其特征在于,基于所述特征的特征值,计算所述预测样本对应的预测值包括:基于所述特征的特征值,计算预设参数的参数值,以及基于预设参数的参数值,计算所述预测样本对应的预测值,预设参数包括:第一预设参数、第二预设参数,第一预设参数表示所述预测样本的所有非零特征中属于一个域的每一个非零特征的特征值与所述非零特征相对于另一个域的预设权重向量之和,第二预设参数表示所述预测样本的所有非零特征中的每一个非零特征的特征值的平方与所述非零特征相对于所述非零特征所属的域的预设权重向量的平方的乘积之和。3.根据权利要求2所述的方法,其特征在于,基于预设参数的参数值,计算所述预测样本对应的预测值包括:基于以下预测公式基于预设参数的参数值,计算所述预测样本对应的预测值:其中,为第一预设参数;为第二预设参数;中的xi表示所述预测样本的所有非零特征中的属于域fa的第i个特征;中的wi,fb表示所述预测样本的所有非零特征中的属于域fa的第i个特征相对于域fb的预设权重向量;中的xj表示所述预测样本的所有非零特征中的属于域fb的第j个特征;中的wj,fa表示所述预测样本的所有非零特征中的属于域fb的第j个特征相对于域fa的预设权重向量;中...

【专利技术属性】
技术研发人员:王鹏
申请(专利权)人:上海连尚网络科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1