基于媒体文件的行为预估方法和装置制造方法及图纸

技术编号：19098631 阅读：30 留言：0更新日期：2018-10-03 02:41

本发明专利技术公开了一种基于媒体文件的行为预估方法和装置。其中，该方法包括：获取与媒体文件的类型相对应的行为样本，其中，行为样本用于表示多种目标行为的执行情况，多种目标行为包括具有预设关系的行为；在行为样本的特征向量保持不变的情况下，将行为样本转化为目标向量，其中，目标向量的长度与多种目标行为的数量相同，目标向量的每维分量用于表示每种目标行为的执行情况；通过预设深层神经网络对行为样本的特征向量和目标向量进行处理，得到用于表示多种目标行为执行于媒体文件的执行概率的预估数据。本发明专利技术解决了相关技术媒体文件的行为预估复杂的问题的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于媒体文件的行为预估方法和装置
本专利技术涉及媒体文件领域，具体而言，涉及一种基于媒体文件的行为预估方法和装置。
技术介绍
目前，在媒体文件的营销领域，通常需要预估用户在一定场景下点击媒体文件链接的概率、进入媒体文件详情页的概率，也即，点击率(ClickThroughRate)预估，简称PCTR。传统应对这种复杂多行为PCTR预估的方法是，对每个行为单独建立模型进行PCTR预估，设其中某个行为的样本量为N的训练数据集合是其中为样本i的特征向量，yi∈{0,1}为对应的目标，0表示曝光，1表示点击。这样当有N种行为时，就需要建立N个模型，并且每个模型都需要单独调参优化，因而媒体文件的预估复杂，存在需要大量人力、时间和机器资源的问题，另外，在线上预估PCTR的时候，由于每个模型预估一种行为，还存在耗时大的问题。在一般场景中，只需要针对媒体文件的详情链接的行为预估，而社交空间中的媒体文件比较特殊，不仅需要针对媒体文件的详情链接的行为预估，而且包括媒体文件的多种不同媒体文件类型的点击行为预估，另外媒体文件的多种行为之间存在一定相关性，各种行为的真实点击率差异巨大，导致彼此之间存在一定相关性的多种行为的预估比传统的行为预估更复杂。针对上述的媒体文件的行为预估复杂的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种基于媒体文件的行为预估方法和装置，以至少解决相关技术媒体文件的行为预估复杂的问题的技术问题。根据本专利技术实施例的一个方面，提供了一种基于媒体文件的行为预估方法。该媒体文件的行为预估方法包括：获取与媒体文件的类型相对应的行为样本，其中...

【技术保护点】
1.一种基于媒体文件的行为预估方法，其特征在于，包括：获取与媒体文件的类型相对应的行为样本，其中，所述行为样本用于表示多种目标行为的执行情况，所述多种目标行为包括具有预设关系的行为；在所述行为样本的特征向量保持不变的情况下，将所述行为样本转化为目标向量，其中，所述目标向量的长度与所述多种目标行为的数量相同，所述目标向量的每维分量用于表示每种目标行为的执行情况；通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理，得到用于表示所述多种目标行为执行于所述媒体文件的执行概率的预估数据。

【技术特征摘要】
1.一种基于媒体文件的行为预估方法，其特征在于，包括：获取与媒体文件的类型相对应的行为样本，其中，所述行为样本用于表示多种目标行为的执行情况，所述多种目标行为包括具有预设关系的行为；在所述行为样本的特征向量保持不变的情况下，将所述行为样本转化为目标向量，其中，所述目标向量的长度与所述多种目标行为的数量相同，所述目标向量的每维分量用于表示每种目标行为的执行情况；通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理，得到用于表示所述多种目标行为执行于所述媒体文件的执行概率的预估数据。2.根据权利要求1所述的方法，其特征在于，获取与媒体文件的类型相对应的行为样本包括：获取与多种媒体文件的类型相对应的多个行为样本，其中，每个行为样本用于表示所述预设关系的所述多种目标行为的执行情况；在所述行为样本的特征向量保持不变的情况下，将所述行为样本转化为目标向量包括：在所述多个行为样本的特征向量保持不变的情况下，将所述多个行为样本转化为多个目标向量，其中，每个目标向量的长度与所述多种目标行为的数量相同，所述每个目标向量的每维分量用于表示每种目标行为的执行情况。3.根据权利要求2所述的方法，其特征在于，通过预设深层神经网络对所述特征向量和所述目标向量进行处理，得到用于表示所述多种目标行为的执行概率的预估数据包括：通过所述预设深层神经网络分别对所述多个行为样本的特征向量和所述多个目标向量进行处理，得到所述多种媒体文件下的所述多种目标行为的预估数据。4.根据权利要求3所述的方法，其特征在于，通过所述预设深层神经网络分别对所述多个行为样本的特征向量和所述多个目标向量进行处理，得到所述多种媒体文件下的所述多种目标行为的预估数据包括：将所述多个行为样本的特征向量确定为所述预设深层神经网络的多个初级原始特征；从所述多个初级原始特征中提取预设数据维度的高级特征；根据所述高级特征和所述多个目标向量获得所述多种媒体文件下的所述多种目标行为的预估数据。5.根据权利要求4所述的方法，其特征在于，根据所述高级特征和所述多个目标向量获得所述多种媒体文件下的所述多种目标行为的预估数据包括：采用以下方式获取所述预估数据，其中，所述p用于表示所述预估数据，所述y用于表示所述多个目标向量中的第k个目标向量，所述x为所述第k个目标向量对应的特征向量，所述W∈RM×K为所述预设深层神经网络的参数，所述M为所述预设深层神经网络的顶层输入的所述预设数据维度，所述K为所述多种目标行为的数量，所述WT为所述W的转置。6.根据权利要求1所述的方法，其特征在于，在通过预设深层神经网络对所述行为样本的特征向量和所述目标向量进行处理，得到用于表示所述多种目标行为的执行概率的预估数据之后，所述方法还包括：获取所述多种目标行为的实际执行数据；获取所述多种目标行为的预估数据与所述实际执行数据的数据差；在所述目标向量符合预设条件的情况下，通过所述预设深层神经网络反向传输所述数据差，其中，在所述反向传输的过程中利用所述数据差更新所述预设深层神经网络的权重。7.根据权利要求1所述的方法，其特征在于，获取与媒体文件的类型相对应的行为样本包括：获取所述多种目标行为的历史执行数据；对所述历史执行数据中执行率最低的目标行为增加采样量，得到更新采样数据，其中，所述更新采样数据中的所述多种目标行为的正样本与负样本比例...

【专利技术属性】
技术研发人员：陈细华，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人