一种多媒体数据处理方法以及装置制造方法及图纸

技术编号：14778253 阅读：83 留言：0更新日期：2017-03-09 14:09

本发明专利技术实施例公开了一种多媒体数据处理方法以及装置，其中方法包括：根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为，生成多媒体数据操作行为矩阵；基于稀疏自编码神经网络，并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量；当接收到与目标用户对应的推荐请求，且历史用户群包含目标用户时，获取目标用户的个人操作行为信息中的多个多媒体数据，并根据目标用户对应的用户特征向量以及个人操作行为信息中各多媒体数据分别对应的隐含特征向量对个人操作行为信息中的多个多媒体数据进行推荐处理。采用本发明专利技术，可保证所推荐的歌曲是用户所喜欢的歌曲，以提高推荐效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，尤其涉及一种多媒体数据处理方法以及装置。
技术介绍
随着互联网技术的发展，各式各样的应用层出不穷，例如，即时通信应用、游戏应用、多媒体数据应用等等。以多媒体数据应用为例，用户可以通过多媒体数据应用收听各式各样的歌曲，而且也可以通过推测用户所喜欢的歌曲，以将相应歌曲推荐给用户。目前，推测用户所喜欢的歌曲的方式可以包括：将用户所收藏(或下载)的歌曲认定为用户所喜欢的歌曲，因此，可以推测用户所喜欢的歌曲包括与所收藏(或下载)的歌曲相类似的歌曲，进而向用户推荐这些相类似的歌曲。当用户没有收藏(或下载)歌曲时，将完整播放完的歌曲认定为用户所喜欢的歌曲，进而进行相似歌曲的推荐。但是完整播放完的歌曲并不代表是用户在听的歌曲(如用户临时离开电脑，而电脑中的音乐播放器继续播放)，进而也无法代表是用户所喜欢的歌曲，所以若直接将完整播放完的歌曲认定为用户所喜欢的歌曲，则无法保证所推荐的歌曲是用户所喜欢的歌曲，导致推荐效果不佳。
技术实现思路
本专利技术实施例提供一种用于多媒体数据处理方法以及装置，可保证所推荐的歌曲是用户所喜欢的歌曲，以提高推荐效果。本专利技术实施例提供了一种多媒体数据处理方法，包括：根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为，生成多媒体数据操作行为矩阵；基于稀疏自编码神经网络，并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量；一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息；一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息；...
一种多媒体数据处理方法以及装置

【技术保护点】
一种多媒体数据处理方法，其特征在于，包括：根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为，生成多媒体数据操作行为矩阵；基于稀疏自编码神经网络，并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量；一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息；一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息；当接收到与目标用户对应的推荐请求，且所述历史用户群包含所述目标用户时，获取所述目标用户的个人操作行为信息中的多个多媒体数据，并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。

【技术特征摘要】
1.一种多媒体数据处理方法，其特征在于，包括：根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为，生成多媒体数据操作行为矩阵；基于稀疏自编码神经网络，并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量；一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息；一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息；当接收到与目标用户对应的推荐请求，且所述历史用户群包含所述目标用户时，获取所述目标用户的个人操作行为信息中的多个多媒体数据，并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。2.如权利要求1所述的方法，其特征在于，所述基于稀疏自编码神经网络，并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量，包括：将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层；所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数；所述隐藏层包括预设数量的隐藏节点；所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数，对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练；当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时，确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件，并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵；所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵，所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量；根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量。3.如权利要求2所述的方法，其特征在于，所述当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时，确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件，并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵，包括：当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时，确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件，并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源；根据预设数量的稀疏自编码器，将所述目标输入源输入到下一个稀疏自编码器的输入层，所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数，并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源，重复执行本步骤，直至最后一个稀疏自编码器训练出隐藏参数；将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵。4.如权利要求2所述的方法，其特征在于，所述目标函数包括预设的用户兴趣因子项，所述用户兴趣因子项包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值；一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。5.如权利要求3所述的方法，其特征在于，所述根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量，包括：当所述稀疏自编码器的数量为一个时，从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量；当所述稀疏自编码器的数量为至少两个时，获取各历史用户分别对应的个人操作行为信息，分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算，并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。6.如权利要求1所述的方法，其特征在于，所述当接收到与目标用户对应的推荐请求，且所述历史用户群包含所述目标用户时，获取所述目标用户的个人操作行为信息中的多个多媒体数据，并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理，包括：当接收到与目标用户对应的推荐请求，且所述历史用户群包含所述目标用户时，检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据；若检测为包含已收藏的多媒体数据，则获取所述已收藏的多媒体数据对应的第一相似多媒体数据，并将所述第一相似多媒体数据作为所述目标用户的推荐数据；若检测为未包含已收藏的多媒体数据，则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据；当所述个人操作行为信息中包含已完整操作的多媒体数据时，将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算，得到个性化特征值；当所述个性化特征值大于预设特征值阈值时，获取所述已完整操作的多媒体数据对应的第二相似多媒体数据，并将所述第二相似多媒体数据作为所述目标用户的推荐数据。7.如权利要求6所述的方法，其特征在于，还包括：当所述个人操作行为信息不包含已完整操作的多媒体数据时，获取多个候选多媒体数据，将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算，得到所述各候选多媒体数据分别对应的个性化特征值；按照各个性...

【专利技术属性】
技术研发人员：黄昕，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人