话题识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38899411 阅读:9 留言:0更新日期:2023-09-22 14:19
本公开提供了一种话题识别方法、装置、电子设备及存储介质。所述话题识别方法包括:获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;获取各个所述视频在至少一个内容维度下的视频元素;根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题。视频话题。视频话题。

【技术实现步骤摘要】
话题识别方法、装置、电子设备及存储介质


[0001]本公开总体说来涉及数据处理
,更具体地讲,涉及一种话题识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着视频(例如,短视频)行业不断发展,视频的消费与创作成为大众的日常,视频话题作为视频重要的作品信息元素,在作品的生产和消费场景中都发挥着重要价值,例如,对于视频平台内的推荐等生态具有重要作用,同时话题标签页,也为作品聚合提供便捷的路径,满足用户针对某类内容高频消费的诉求。
[0003]然而,受限于视频话题大多由用户自由编辑的特点,对于同一个事件或玩法,往往针对其描述的话题较多,不利于话题下作品的累计以及后续的传播。

技术实现思路

[0004]本公开的示例性实施例在于提供一种话题识别方法、装置、电子设备及存储介质,其能够准确识别出针对同一事件的多个相似视频话题。
[0005]根据本公开实施例的第一方面,提供一种话题识别方法,所述话题识别方法包括:获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;获取各个所述视频在至少一个内容维度下的视频元素;根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题。
[0006]可选地,所述根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息的步骤包括:基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度,其中,所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题;基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度;基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度;基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项,得到所述多个视频话题的重合指标信息。
[0007]可选地,所述基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度的步骤包括:确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度;确定所述第一视频话题的视频的文本与所述第二视频话题的视频的
文本之间的第二重合度;基于所述第一重合度和所述第二重合度,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。
[0008]可选地,所述基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度的步骤包括:识别所述第一视频话题的视频之中,使用的音乐与所述第二视频话题的视频相同的视频的第一数量,并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值;识别所述第二视频话题的视频之中,使用的音乐与所述第一视频话题的视频相同的视频的第二数量,并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值;基于所述第一比值和所述第二比值,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度。
[0009]可选地,所述基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度的步骤包括:识别所述第一视频话题的视频之中,同时属于所述第二视频话题的视频的第三数量,并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值;识别所述第二视频话题的视频之中,同时属于所述第一视频话题的视频的第四数量,并确定所述第四数量与所述第二视频话题的视频的总数量之间的第四比值;基于所述第三比值和所述第四比值,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度。
[0010]可选地,在所述重合指标信息包括文本维度重合度、音频维度重合度和作品维度重合度的情况下,所述基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题的步骤包括:在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下,确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题;或者,在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下,确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题。
[0011]可选地,所述确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度的步骤包括:确定所述第一视频话题的话题文本与所述第二视频话题的话题文本重合的文本部分,基于所述重合的文本部分占所述第一视频话题的话题文本的比例和所述重合的文本部分占所述第二视频话题的话题文本的比例,确定所述第一重合度;和/或,基于所述第一视频话题的话题文本的特征向量与所述第二视频话题的话题文本的特征向量之间的相似度,确定所述第一重合度;其中,所述确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度的步骤包括:确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本重合的文本部分,基于所述重合的文本部分占所述第一视频话题的视频的文本的比例、所述重合的文本部分占所述第二视频话题的视频的文本的比例,确定所述第二重合度;和/或,基于所述第一视频话题的视频的文本的特征向量与所述第二视频话题的视频的文本的特征向量之间的相似度,确定所述第二重合度。
[0012]可选地,所述话题识别方法还包括:在每个视频话题的标签页内,显示属于所述视
频话题的视频以及属于与所述视频话题针对同一事件的相似视频话题的视频;和/或,针对每个视频,基于所述视频所属的视频话题以及与所述视频话题针对同一事件的相似视频话题,向用户推荐所述视频。
[0013]根据本公开实施例的第二方面,提供一种话题识别装置,所述话题识别装置包括:获取单元,被配置为获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;视频元素获取单元,被配置为获取各个所述视频在至少一个内容维度下的视频元素;信息确定单元,被配置为根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;确定单元,被配置为基于所述重合指标信息,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种话题识别方法,其特征在于,所述话题识别方法包括:获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;获取各个所述视频在至少一个内容维度下的视频元素;根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题。2.根据权利要求1所述的话题识别方法,其特征在于,所述根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息的步骤包括:基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度,其中,所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题;基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度;基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度;基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项,得到所述多个视频话题的重合指标信息。3.根据权利要求2所述的话题识别方法,其特征在于,所述基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度的步骤包括:确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度;确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度;基于所述第一重合度和所述第二重合度,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。4.根据权利要求2所述的话题识别方法,其特征在于,所述基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度的步骤包括:识别所述第一视频话题的视频之中,使用的音乐与所述第二视频话题的视频相同的视频的第一数量,并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值;识别所述第二视频话题的视频之中,使用的音乐与所述第一视频话题的视频相同的视频的第二数量,并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值;基于所述第一比值和所述第二比值,确定所述第一视频话题与所述第二视频话题之间
的音频维度重合度。5.根据权利要求2所述的话题识别方法,其特征在于,所述基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度的步骤包括:识别所述第一视频话题的视频之中,同时属于所述第二视频话题的视频的第三数量,并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值;识别所述第二视频话题的视频之中,同时属于所述第一视频话题的视频的第四数量,并确定所述第四数量与所述第二视频话题的视频的...

【专利技术属性】
技术研发人员:龚云荷
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1