一种多媒体数据处理方法以及装置制造方法及图纸

技术编号:14778253 阅读:83 留言:0更新日期:2017-03-09 14:09
本发明专利技术实施例公开了一种多媒体数据处理方法以及装置,其中方法包括:根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;当接收到与目标用户对应的推荐请求,且历史用户群包含目标用户时,获取目标用户的个人操作行为信息中的多个多媒体数据,并根据目标用户对应的用户特征向量以及个人操作行为信息中各多媒体数据分别对应的隐含特征向量对个人操作行为信息中的多个多媒体数据进行推荐处理。采用本发明专利技术,可保证所推荐的歌曲是用户所喜欢的歌曲,以提高推荐效果。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种多媒体数据处理方法以及装置
技术介绍
随着互联网技术的发展,各式各样的应用层出不穷,例如,即时通信应用、游戏应用、多媒体数据应用等等。以多媒体数据应用为例,用户可以通过多媒体数据应用收听各式各样的歌曲,而且也可以通过推测用户所喜欢的歌曲,以将相应歌曲推荐给用户。目前,推测用户所喜欢的歌曲的方式可以包括:将用户所收藏(或下载)的歌曲认定为用户所喜欢的歌曲,因此,可以推测用户所喜欢的歌曲包括与所收藏(或下载)的歌曲相类似的歌曲,进而向用户推荐这些相类似的歌曲。当用户没有收藏(或下载)歌曲时,将完整播放完的歌曲认定为用户所喜欢的歌曲,进而进行相似歌曲的推荐。但是完整播放完的歌曲并不代表是用户在听的歌曲(如用户临时离开电脑,而电脑中的音乐播放器继续播放),进而也无法代表是用户所喜欢的歌曲,所以若直接将完整播放完的歌曲认定为用户所喜欢的歌曲,则无法保证所推荐的歌曲是用户所喜欢的歌曲,导致推荐效果不佳。
技术实现思路
本专利技术实施例提供一种用于多媒体数据处理方法以及装置,可保证所推荐的歌曲是用户所喜欢的歌曲,以提高推荐效果。本专利技术实施例提供了一种多媒体数据处理方法,包括:根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。相应地,本专利技术实施例还提供了一种多媒体数据处理装置,包括:矩阵生成模块,用于根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;特征计算模块,用于基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;推荐模块,用于当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。本专利技术实施例通过根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,由此可见,隐含特征向量可以准确表征历史用户群对一个多媒体数据的喜好程度信息,且用户特征向量可以准确表征一个历史用户对多个多媒体数据的喜好程度信息,所以通过隐含特征向量和用户特征向量可以对目标用户实现准确的个性化推荐,即可保证所推荐的歌曲是目标用户所喜欢的歌曲,以提高推荐效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种网络架构的示意图;图2是本专利技术实施例提供的一种多媒体数据处理方法的流程示意图;图3是本专利技术实施例提供的另一种多媒体数据处理方法的流程示意图;图4是本专利技术实施例提供的一种多媒体数据处理装置的结构示意图;图5是本专利技术实施例提供的一种特征计算模块的结构示意图;图6是本专利技术实施例提供的一种推荐模块的结构示意图;图7是本专利技术实施例提供的一种隐含特征生成单元的结构示意图;图8是本专利技术实施例提供的一种用户特征生成单元的结构示意图;图9是本专利技术实施例提供的另一种多媒体数据处理装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参见图1,是本专利技术实施例提供的一种网络架构的示意图。所述网络架构可以包括后台服务器和多个客户端,各个客户端均可以通过网络与所述后台服务器连接,所述后台服务器可以将各个客户端分别对应的用户确定为历史用户群,所述后台服务器还可以收集各个客户端分别对应的操作行为(如某客户端的听歌行为,具体包括该客户端对应的用户所收听过的歌曲)。因此,所述后台服务器可以根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵,并基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息。当某个客户端向所述后台服务器发送推荐请求时,所述后台服务器可以获取多个与该客户端对应的目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。请参见图2,是本专利技术实施例提供的一种多媒体数据处理方法的流程示意图,所述方法可以包括:S101,根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;具体的,基于多媒体数据应用的后台服务器可以获取历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为。所述多媒体数据库可以为音乐库,每一个多媒体数据均可以为音乐库中的一首歌,因此,所述操作行为可以包括所述历史用户群中的各历史用户对各个多媒体数据的收听行为,所述收听行为包括已收听行为和未收听行为,并且所述后台服务器可以为不同的收听行为设置不同的特征值,以生成与所述操作行为相应的多媒体数据操作行为矩阵。如下表1所示的历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为的特征表:歌曲1歌曲2歌曲3歌曲4…用户11001…用户21110…用户30010…用户41111…………………表1其中,表1中的特征值“1”表示该用户收听过这首歌曲,特征值“0”表示该用户未收听过这首歌曲,如用户1与歌曲1之间的特征值为“1”,则说明用户1收听过歌曲1;又如用户3与歌曲2之间的特征值为“0”,则说明用户3未收听过歌曲2。因此,根据表1中的所有特征值即可生成与所述操作行为相应的多媒体数据操本文档来自技高网...
一种多媒体数据处理方法以及装置

【技术保护点】
一种多媒体数据处理方法,其特征在于,包括:根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。

【技术特征摘要】
1.一种多媒体数据处理方法,其特征在于,包括:根据历史用户群对预设的多媒体数据库中的多个多媒体数据的操作行为,生成多媒体数据操作行为矩阵;基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量;一个隐含特征向量表征所述历史用户群对一个多媒体数据的喜好程度信息;一个用户特征向量表征一个历史用户对所述多个多媒体数据的喜好程度信息;当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理。2.如权利要求1所述的方法,其特征在于,所述基于稀疏自编码神经网络,并根据所述多媒体数据操作行为矩阵计算各多媒体数据分别对应的隐含特征向量和各历史用户分别对应的用户特征向量,包括:将所述多媒体数据操作行为矩阵输入到所述稀疏自编码神经网络对应的稀疏自编码器的输入层;所述稀疏自编码器包括所述输入层、隐藏层、输出层以及所述隐藏层与所述输出层之间的目标参数;所述隐藏层包括预设数量的隐藏节点;所述稀疏自编码器根据所述输入层中的参数以及预设的用于训练所述目标参数和所述隐藏节点的隐藏参数的目标函数,对所述目标参数和所述隐藏节点的隐藏参数进行偏导数训练;当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵;所述隐含特征矩阵为所述多媒体数据操作行为矩阵对应的压缩矩阵,所述隐含特征矩阵包括各多媒体数据分别对应的隐含特征向量;根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量。3.如权利要求2所述的方法,其特征在于,所述当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数组合成隐含特征矩阵,包括:当所述稀疏自编码器的所述输出层中的参数与所述输入层中的参数相近时,确定所述目标参数和所述隐藏节点的隐藏参数满足收敛条件,并将满足所述收敛条件的各隐藏节点的隐藏参数确定为目标输入源;根据预设数量的稀疏自编码器,将所述目标输入源输入到下一个稀疏自编码器的输入层,所述下一个稀疏自编码器根据所述目标函数训练所述目标输入源对应的隐藏参数,并将所述下一个稀疏自编码器中训练后的隐藏参数作为目标输入源,重复执行本步骤,直至最后一个稀疏自编码器训练出隐藏参数;将所述最后一个稀疏自编码器训练出的隐藏参数组合为隐含特征矩阵。4.如权利要求2所述的方法,其特征在于,所述目标函数包括预设的用户兴趣因子项,所述用户兴趣因子项包括所述各历史用户分别对所述多媒体数据库中各多媒体数据的兴趣值;一个兴趣值是基于一个历史用户对一个多媒体数据的操作行为类型、操作次数以及完整操作率计算得到的。5.如权利要求3所述的方法,其特征在于,所述根据训练后的目标参数或所述隐含特征矩阵计算所述历史用户群中各历史用户分别对应的用户特征向量,包括:当所述稀疏自编码器的数量为一个时,从所述稀疏自编码器中训练后的目标参数对应的参数矩阵中提取出所述历史用户群中各历史用户分别对应的用户特征向量;当所述稀疏自编码器的数量为至少两个时,获取各历史用户分别对应的个人操作行为信息,分别将各个人操作行为信息中已操作的多媒体数据对应的隐含特征向量进行向量平均计算,并将计算出的各平均向量分别作为各历史用户分别对应的用户特征向量。6.如权利要求1所述的方法,其特征在于,所述当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,获取所述目标用户的个人操作行为信息中的多个多媒体数据,并根据所述目标用户对应的用户特征向量以及所述个人操作行为信息中各多媒体数据分别对应的隐含特征向量对所述个人操作行为信息中的多个多媒体数据进行推荐处理,包括:当接收到与目标用户对应的推荐请求,且所述历史用户群包含所述目标用户时,检测目标用户对应的个人操作行为信息中是否包含已收藏的多媒体数据;若检测为包含已收藏的多媒体数据,则获取所述已收藏的多媒体数据对应的第一相似多媒体数据,并将所述第一相似多媒体数据作为所述目标用户的推荐数据;若检测为未包含已收藏的多媒体数据,则进一步判断所述个人操作行为信息中是否包含已完整操作的多媒体数据;当所述个人操作行为信息中包含已完整操作的多媒体数据时,将所述目标用户对应的用户特征向量与所述已完整操作的多媒体数据对应的隐含特征向量进行点乘运算,得到个性化特征值;当所述个性化特征值大于预设特征值阈值时,获取所述已完整操作的多媒体数据对应的第二相似多媒体数据,并将所述第二相似多媒体数据作为所述目标用户的推荐数据。7.如权利要求6所述的方法,其特征在于,还包括:当所述个人操作行为信息不包含已完整操作的多媒体数据时,获取多个候选多媒体数据,将所述标用户对应的用户特征向量分别与各候选多媒体数据对应的隐含特征向量进行点乘运算,得到所述各候选多媒体数据分别对应的个性化特征值;按照各个性...

【专利技术属性】
技术研发人员:黄昕
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1