数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24853653 阅读:24 留言:0更新日期:2020-07-10 19:07
本公开提供了一种数据处理方法、装置、计算机设备和存储介质,该方法包括:从至少两个维度,提取多媒体内容对应的多个文本信息;基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。本公开实施例能够提高存储的多媒体内容之间的关联度。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质
本公开涉及数据处理
,具体而言,涉及一种数据处理方法、装置、计算机设备和存储介质。
技术介绍
多媒体视频观看应用可用于观看多媒体内容,但是,多媒体视频观看应用为用户呈现的多媒体内容之间的关联性比较差,比如,用户当前正在观看A主题的多媒体内容,下个观看的视频可能是B主题的多媒体内容,又如,用户在多媒体视频观看应用中输入搜索主题后,搜索结果显示的多媒体内容可能仅包括与搜索主题相关的字眼,多媒体内容之间的关联性比较差。
技术实现思路
本公开实施例至少提供一种数据处理方法、装置、计算机设备和存储介质,以提高存储的多媒体内容之间的关联度。第一方面,本公开实施例提供了一种数据处理方法,所述方法包括:从至少两个维度,提取多媒体内容对应的多个文本信息;基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n从至少两个维度,提取多媒体内容对应的多个文本信息;/n基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;/n根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;/n将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
从至少两个维度,提取多媒体内容对应的多个文本信息;
基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度;
根据所述多媒体内容之间的相似度,以及预设相似度阈值,生成至少一个多媒体内容集合;其中,同一多媒体内容集合中的不同多媒体内容之间的相似度大于所述预设相似度阈值;
将所述至少一个多媒体内容集合分别与对应的关键信息进行关联存储,所述关键信息为基于多媒体内容集合中的多媒体内容对应的文本信息确定的。


2.如权利要求1所述的方法,其特征在于,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
根据所述多媒体内容对应的文本信息,确定所述多媒体内容的核心信息;
根据所述多媒体内容的核心信息,对所述多个多媒体内容进行聚类,得到聚类后的至少一个多媒体群体;
基于每个所述多媒体群体中的多个多媒体内容对应的文本信息,确定该多媒体群体中的不同多媒体内容之间的相似度。


3.如权利要求1所述的方法,其特征在于,从至少两个维度,提取多媒体内容对应的多个文本信息,包括:
基于音频识别技术,将所述多媒体内容对应的音频内容转换为第一文本信息;
基于视频识别技术,将所述多媒体内容对应的视频内容转换为第二文本信息;
基于所述多媒体内容对应的描述信息确定第三文本信息;
将所述第一文本信息、所述第二文本信息和所述第三文本信息中至少两个,作为所述多媒体内容对应的多个文本信息。


4.如权利要求1所述的方法,其特征在于,基于所述多媒体内容对应的文本信息,确定多个所述多媒体内容之间的相似度,包括:
针对每个多媒体内容,基于该多媒体内容对应的每个文本信息,生成与该文本信息对应的特征向量;
对该多媒体内容对应的多个特征向量进行拼接处理,得到该多媒体内容对应的拼接特征向量;
基于每个多媒体内容对应的拼接特征向量,计算多个多媒体内容中不同多媒体内容之间的相似度。


5.如权利要求1所述的方法,其特征在于,生成至少一个多媒体内容集合之后,还包括:
针对生成的任一多媒体内容集合,若该任一多媒体内容集合中的多媒体内容的数目大于预设阈值,则根据各所述多媒体内容的用户标识,从该任一多媒体内容集合中,确定多个...

【专利技术属性】
技术研发人员:张宁静
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1