【技术实现步骤摘要】
媒体数据处理方法、装置及存储介质
本公开涉及媒体处理
,尤其涉及一种媒体数据处理方法、装置及存储介质。
技术介绍
在媒体数据推荐系统中,需要对媒体数据做嵌入式表示,即在不需要人为做标记的情况下,将一个媒体数据映射到一个向量上。目前主要做法包括:1.item2vec:即将媒体数据看做自然语言处理(natuallanguageprocessing,nlp)里的一个词,媒体数据的序列看做nlp里的句子,然后用word2vec的方法进行表示.2.item和用户(user)联合嵌入表示。无论哪种方法,其实都是从用户行为角度出发,去构建媒体数据序列,而没有考虑媒体数据本身的特征。因而,还没有提取媒体数据特征的方案。
技术实现思路
本公开提供一种媒体数据处理方法、装置及存储介质,以准确地获得媒体数据的特征。第一方面,提供了一种媒体数据处理方法,包括:根据第一媒体数据的第一频谱图,获取所述第一媒体数据的第一特征向量,其中,所述第一特征向量为所述第一媒体数据的初始特征向 ...
【技术保护点】
1.一种媒体数据处理方法,其特征在于,包括:/n根据第一媒体数据的第一频谱图,获取所述第一媒体数据的第一特征向量,其中,所述第一特征向量为所述第一媒体数据的初始特征向量;/n根据所述第一特征向量和历史媒体数据集合,确定所述历史媒体数据集合中与所述第一媒体数据邻近的一个或多个第二媒体数据,其中,所述历史媒体数据集合包括用户选择行为具有关联性的一组历史媒体数据;/n根据所述第一特征向量以及所述一个或多个第二媒体数据,获取所述第一媒体数据的第二特征向量,其中,所述第二特征向量为所述第一媒体数据的优化后的特征向量。/n
【技术特征摘要】
1.一种媒体数据处理方法,其特征在于,包括:
根据第一媒体数据的第一频谱图,获取所述第一媒体数据的第一特征向量,其中,所述第一特征向量为所述第一媒体数据的初始特征向量;
根据所述第一特征向量和历史媒体数据集合,确定所述历史媒体数据集合中与所述第一媒体数据邻近的一个或多个第二媒体数据,其中,所述历史媒体数据集合包括用户选择行为具有关联性的一组历史媒体数据;
根据所述第一特征向量以及所述一个或多个第二媒体数据,获取所述第一媒体数据的第二特征向量,其中,所述第二特征向量为所述第一媒体数据的优化后的特征向量。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
分别提取所述第一媒体数据进行时域特性向量和频域特性向量,获得所述第一媒体数据的第一频谱图。
3.根据权利要求1或2所述的方法,其特征在于,所述根据第一媒体数据的第一频谱图,获取所述第一媒体数据的第一特征向量,包括:
对所述第一媒体数据的第一频谱图进行编码,获取所述第一特征向量。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
将所述编码后得到的所述第一特征向量进行解码,获得重建后的第二频谱图;
根据所述第一频谱图和所述第二频谱图,更新重建误差;
根据所述重新误差,训练所述编码的参数。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据用户选择多个第二媒体数据的行为的关联性,对所述多个第二媒体数据进行分类,得到一个或多个历史媒体数据集合。
6.根据权利要求1或5所述的方法,其特征在于,所述根据所述第一特征向量和历史媒体数据集合,确定所述历史媒体数据集合中与所述第一媒体数据邻近的一个或多个第二媒体数据,包括:
在所述历史媒体数...
【专利技术属性】
技术研发人员:缪畅宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。