【技术实现步骤摘要】
话题识别方法、装置、电子设备及存储介质
[0001]本公开总体说来涉及数据处理
,更具体地讲,涉及一种话题识别方法、装置、电子设备及存储介质。
技术介绍
[0002]随着视频(例如,短视频)行业不断发展,视频的消费与创作成为大众的日常,视频话题作为视频重要的作品信息元素,在作品的生产和消费场景中都发挥着重要价值,例如,对于视频平台内的推荐等生态具有重要作用,同时话题标签页,也为作品聚合提供便捷的路径,满足用户针对某类内容高频消费的诉求。
[0003]然而,受限于视频话题大多由用户自由编辑的特点,对于同一个事件或玩法,往往针对其描述的话题较多,不利于话题下作品的累计以及后续的传播。
技术实现思路
[0004]本公开的示例性实施例在于提供一种话题识别方法、装置、电子设备及存储介质,其能够准确识别出针对同一事件的多个相似视频话题。
[0005]根据本公开实施例的第一方面,提供一种话题识别方法,所述话题识别方法包括:获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;获取各个所述视频在至少一个内容维度下的视频元素;根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题。
[0006]可选地,所述根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述 ...
【技术保护点】
【技术特征摘要】
1.一种话题识别方法,其特征在于,所述话题识别方法包括:获取多个视频话题及每个视频话题的视频,其中,每个视频话题的视频包括已发布且属于所述视频话题的视频;获取各个所述视频在至少一个内容维度下的视频元素;根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息,其中,所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度;基于所述重合指标信息,确定所述多个视频话题中针对同一事件的相似视频话题。2.根据权利要求1所述的话题识别方法,其特征在于,所述根据各个所述视频话题的话题文本及对应的视频的视频元素,确定所述多个视频话题的重合指标信息的步骤包括:基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度,其中,所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题;基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度;基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度;基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项,得到所述多个视频话题的重合指标信息。3.根据权利要求2所述的话题识别方法,其特征在于,所述基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度的步骤包括:确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度;确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度;基于所述第一重合度和所述第二重合度,确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。4.根据权利要求2所述的话题识别方法,其特征在于,所述基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息,确定所述第一视频话题与所述第二视频话题之间的音频维度重合度的步骤包括:识别所述第一视频话题的视频之中,使用的音乐与所述第二视频话题的视频相同的视频的第一数量,并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值;识别所述第二视频话题的视频之中,使用的音乐与所述第一视频话题的视频相同的视频的第二数量,并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值;基于所述第一比值和所述第二比值,确定所述第一视频话题与所述第二视频话题之间
的音频维度重合度。5.根据权利要求2所述的话题识别方法,其特征在于,所述基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量,确定所述第一视频话题与所述第二视频话题之间的作品维度重合度的步骤包括:识别所述第一视频话题的视频之中,同时属于所述第二视频话题的视频的第三数量,并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值;识别所述第二视频话题的视频之中,同时属于所述第一视频话题的视频的第四数量,并确定所述第四数量与所述第二视频话题的视频的...
【专利技术属性】
技术研发人员:龚云荷,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。