基于媒体文件的行为预估方法和装置制造方法及图纸

技术编号:19098631 阅读:30 留言:0更新日期:2018-10-03 02:41
本发明专利技术公开了一种基于媒体文件的行为预估方法和装置。其中,该方法包括:获取与媒体文件的类型相对应的行为样本,其中,行为样本用于表示多种目标行为的执行情况,多种目标行为包括具有预设关系的行为;在行为样本的特征向量保持不变的情况下,将行为样本转化为目标向量,其中,目标向量的长度与多种目标行为的数量相同,目标向量的每维分量用于表示每种目标行为的执行情况;通过预设深层神经网络对行为样本的特征向量和目标向量进行处理,得到用于表示多种目标行为执行于媒体文件的执行概率的预估数据。本发明专利技术解决了相关技术媒体文件的行为预估复杂的问题的技术问题。

【技术实现步骤摘要】
基于媒体文件的行为预估方法和装置
本专利技术涉及媒体文件领域,具体而言,涉及一种基于媒体文件的行为预估方法和装置。
技术介绍
目前,在媒体文件的营销领域,通常需要预估用户在一定场景下点击媒体文件链接的概率、进入媒体文件详情页的概率,也即,点击率(ClickThroughRate)预估,简称PCTR。传统应对这种复杂多行为PCTR预估的方法是,对每个行为单独建立模型进行PCTR预估,设其中某个行为的样本量为N的训练数据集合是其中为样本i的特征向量,yi∈{0,1}为对应的目标,0表示曝光,1表示点击。这样当有N种行为时,就需要建立N个模型,并且每个模型都需要单独调参优化,因而媒体文件的预估复杂,存在需要大量人力、时间和机器资源的问题,另外,在线上预估PCTR的时候,由于每个模型预估一种行为,还存在耗时大的问题。在一般场景中,只需要针对媒体文件的详情链接的行为预估,而社交空间中的媒体文件比较特殊,不仅需要针对媒体文件的详情链接的行为预估,而且包括媒体文件的多种不同媒体文件类型的点击行为预估,另外媒体文件的多种行为之间存在一定相关性,各种行为的真实点击率差异巨大,导致彼此之间存在一定相关性的多种行为的预估比传统的行为预估更复杂。针对上述的媒体文件的行为预估复杂的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种基于媒体文件的行为预估方法和装置,以至少解决相关技术媒体文件的行为预估复杂的问题的技术问题。根据本专利技术实施例的一个方面,提供了一种基于媒体文件的行为预估方法。该媒体文件的行为预估方法包括:获取与媒体文件的类型相对应的行为样本,其中,行为样本用于表示多种目标行为的执行情况,多种目标行为包括具有预设关系的行为;在行为样本的特征向量保持不变的情况下,将行为样本转化为目标向量,其中,目标向量的长度与多种目标行为的数量相同,目标向量的每维分量用于表示每种目标行为的执行情况;通过预设深层神经网络对行为样本的特征向量和目标向量进行处理,得到用于表示多种目标行为执行于媒体文件的执行概率的预估数据。根据本专利技术实施例的另一方面,还提供了一种基于媒体文件的行为预估装置。基于媒体文件的行为预估装置包括:第一获取单元,用于获取与媒体文件的类型相对应的行为样本,其中,行为样本用于表示多种目标行为的执行情况,多种目标行为包括具有预设关系的行为;转化单元,用于在行为样本的特征向量保持不变的情况下,将行为样本转化为目标向量,其中,目标向量的长度与多种目标行为的数量相同,目标向量的每维分量用于表示每种目标行为的执行情况;处理单元,用于通过预设深层神经网络对行为样本的特征向量和目标向量进行处理,得到用于表示多种目标行为执行于媒体文件的执行概率的预估数据。在本专利技术实施例中,通过获取与媒体文件的类型相对应的行为样本,其中,行为样本用于表示多种目标行为的执行情况;在行为样本的特征向量保持不变的情况下,将行为样本转化为目标向量,其中,目标向量的长度与多种目标行为的数量相同,目标向量的每维分量用于表示每种目标行为的执行情况;通过预设深层神经网络对行为样本的特征向量和目标向量进行处理,得到用于表示多种目标行为执行于媒体文件的执行概率的预估数据,进而达到了对多种目标行为进行预估的目的,从而实现了降低媒体文件的行为预估复杂性的技术效果,进而解决了相关技术媒体文件的行为预估复杂的问题的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种基于媒体文件的行为预估方法的硬件环境的示意图;图2是根据本专利技术实施例的一种基于媒体文件的行为预估方法的流程图;图3是根据本专利技术实施例的另一种基于媒体文件的行为预估方法的流程图;图4是根据本专利技术实施例的一种通过预设深层神经网络分别对多个行为样本的特征向量和多个目标向量进行处理的方法的流程图;图5是根据本专利技术实施例的另一种基于媒体文件的行为预估方法的流程图;图6是根据本专利技术实施例的一种获取与媒体文件的类型相对应的行为样本的方法的流程图;图7是根据本专利技术实施例的一种DNN信号前向传递的示意图;图8是根据本专利技术实施例的一种DNN误差反向传播示意图;图9是根据本专利技术实施例的一种基于媒体文件的行为预估装置的示意图;图10是根据本专利技术实施例的一种基于媒体文件的行为预估装置的示意图;图11是根据本专利技术实施例的一种基于媒体文件的行为预估装置的示意图;图12是根据本专利技术实施例的一种基于媒体文件的行为预估装置的示意图;以及图13是根据本专利技术实施例的一种终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种基于媒体文件的行为预估方法的实施例。可选地,在本实施例中,上述基于媒体文件的行为预估方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。图1是根据本专利技术实施例的一种基于媒体文件的行为预估方法的硬件环境的示意图。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本专利技术实施例的基于媒体文件的行为预估方法可以由服务器102来执行,也可以由终端104来执行,还可以是由服务器102和终端104共同执行。其中,终端104执行本专利技术实施例的基于媒体文件的行为预估方法也可以是由安装在其上的客户端来执行。图2是根据本专利技术实施例的一种基于媒体文件的行为预估方法的流程图。如图2所示,该基于媒体文件的行为预估方法可以包括以下步骤:步骤S202,获取与媒体文件的类型相对应的行为样本。在本专利技术上述步骤S202提供的技术方案中,获取与媒体文件的类型相对应的行为样本,其中,行为样本用于表示多种目标行为的执行情况,多种目标行为包括具有预设关系的行为。多种目标行为包括具有预设关系的行为,也即,多种目标行为包括彼此之间存在一定相关性的行为,比如,点击进入媒体文件的详情页,可以具有“点赞”行为、“评论”行为,则点击进入媒体文件的详情页的概率会影响到“点赞”行为、“评论行为”,“点赞”行为和“评论行为”之间也会影响彼此的点击率,因而点击进入媒体文件的详情页、“点赞”行为和“评论”行为之间具有相关性。行本文档来自技高网
...

【技术保护点】
1.一种基于媒体文件的行为预估方法,其特征在于,包括:获取与媒体文件的类型相对应的行为样本,其中,所述行为样本用于表示多种目标行为的执行情况,所述多种目标行为包括具有预设关系的行为;在所述行为样本的特征向量保持不变的情况下,将所述行为样本转化为目标向量,其中,所述目标向量的长度与所述多种目标行为的数量相同,所述目标向量的每维分量用于表示每种目标行为的执行情况;通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理,得到用于表示所述多种目标行为执行于所述媒体文件的执行概率的预估数据。

【技术特征摘要】
1.一种基于媒体文件的行为预估方法,其特征在于,包括:获取与媒体文件的类型相对应的行为样本,其中,所述行为样本用于表示多种目标行为的执行情况,所述多种目标行为包括具有预设关系的行为;在所述行为样本的特征向量保持不变的情况下,将所述行为样本转化为目标向量,其中,所述目标向量的长度与所述多种目标行为的数量相同,所述目标向量的每维分量用于表示每种目标行为的执行情况;通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理,得到用于表示所述多种目标行为执行于所述媒体文件的执行概率的预估数据。2.根据权利要求1所述的方法,其特征在于,获取与媒体文件的类型相对应的行为样本包括:获取与多种媒体文件的类型相对应的多个行为样本,其中,每个行为样本用于表示所述预设关系的所述多种目标行为的执行情况;在所述行为样本的特征向量保持不变的情况下,将所述行为样本转化为目标向量包括:在所述多个行为样本的特征向量保持不变的情况下,将所述多个行为样本转化为多个目标向量,其中,每个目标向量的长度与所述多种目标行为的数量相同,所述每个目标向量的每维分量用于表示每种目标行为的执行情况。3.根据权利要求2所述的方法,其特征在于,通过预设深层神经网络对所述特征向量和所述目标向量进行处理,得到用于表示所述多种目标行为的执行概率的预估数据包括:通过所述预设深层神经网络分别对所述多个行为样本的特征向量和所述多个目标向量进行处理,得到所述多种媒体文件下的所述多种目标行为的预估数据。4.根据权利要求3所述的方法,其特征在于,通过所述预设深层神经网络分别对所述多个行为样本的特征向量和所述多个目标向量进行处理,得到所述多种媒体文件下的所述多种目标行为的预估数据包括:将所述多个行为样本的特征向量确定为所述预设深层神经网络的多个初级原始特征;从所述多个初级原始特征中提取预设数据维度的高级特征;根据所述高级特征和所述多个目标向量获得所述多种媒体文件下的所述多种目标行为的预估数据。5.根据权利要求4所述的方法,其特征在于,根据所述高级特征和所述多个目标向量获得所述多种媒体文件下的所述多种目标行为的预估数据包括:采用以下方式获取所述预估数据,其中,所述p用于表示所述预估数据,所述y用于表示所述多个目标向量中的第k个目标向量,所述x为所述第k个目标向量对应的特征向量,所述W∈RM×K为所述预设深层神经网络的参数,所述M为所述预设深层神经网络的顶层输入的所述预设数据维度,所述K为所述多种目标行为的数量,所述WT为所述W的转置。6.根据权利要求1所述的方法,其特征在于,在通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理,得到用于表示所述多种目标行为的执行概率的预估数据之后,所述方法还包括:获取所述多种目标行为的实际执行数据;获取所述多种目标行为的预估数据与所述实际执行数据的数据差;在所述目标向量符合预设条件的情况下,通过所述预设深层神经网络反向传输所述数据差,其中,在所述反向传输的过程中利用所述数据差更新所述预设深层神经网络的权重。7.根据权利要求1所述的方法,其特征在于,获取与媒体文件的类型相对应的行为样本包括:获取所述多种目标行为的历史执行数据;对所述历史执行数据中执行率最低的目标行为增加采样量,得到更新采样数据,其中,所述更新采样数据中的所述多种目标行为的正样本与负样本比例...

【专利技术属性】
技术研发人员:陈细华
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1