一种视频彩铃标签生成方法、系统、设备及介质技术方案

技术编号:46096442 阅读:10 留言:0更新日期:2025-08-12 18:15
本申请公开了一种视频彩铃标签生成方法、系统、设备及介质,方法包括:获取多模态视频彩铃数据,对多模态视频彩铃数据进行预处理得到预处理数据,对预处理数据进行时空特征提取处理得到视频时空特征,对视频时空特征进行多模态特征融合处理得到多模态特征,构建动态语义图谱,根据动态语义图谱对多模态特征进行标签查询处理,得到视频彩铃标签。本申请实施例能够提高标签与内容语义的一致性,可以广泛应用于视频处理技术领域。

【技术实现步骤摘要】

本申请涉及视频处理,尤其涉及一种视频彩铃标签生成方法、系统、设备及介质


技术介绍

1、随着5g通信技术的普及与视频彩铃业务的爆发式增长,用户对个性化、场景化的视频彩铃内容需求日益增强。相关技术中,存在文字识别的方式生成视频彩铃标签,通过对视频彩铃的视频字幕进行文字识别从而生成标签。但是,在实际应用中发现,相关的文字识别技术对复杂背景视频的干扰处理能力不足,识别准确率较低。同时,相关技术独立处理音频、视频特征导致标签与内容语义不一致失配率较高,导致生成的标签准确率较低,影响了用户体验和内容推荐的效率。综上,相关技术中存在的技术问题有待得到改善。


技术实现思路

1、本申请实施例的主要目的在于提出一种视频彩铃标签生成方法、系统、设备及介质,能够提高生成标签的准确率。

2、为实现上述目的,本申请实施例的一方面提出了一种视频彩铃标签生成方法,所述方法包括:

3、获取多模态视频彩铃数据;

4、对所述多模态视频彩铃数据进行预处理,得到预处理数据;

5、对所述预处理数据进行时本文档来自技高网...

【技术保护点】

1.一种视频彩铃标签生成方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述多模态视频彩铃数据包括视频流、音频流和元数据,所述对所述多模态视频彩铃数据进行预处理,得到预处理数据,包括以下步骤:

3.根据权利要求2所述的方法,其特征在于,所述对所述视频流进行时空切片和动态背景抑制处理,得到预处理图像,包括以下步骤:

4.根据权利要求1所述的方法,其特征在于,所述对所述预处理数据进行时空特征提取处理,得到视频时空特征,包括以下步骤:

5.根据权利要求4所述的方法,其特征在于,所述根据光流场算法对所述预处理图像...

【技术特征摘要】

1.一种视频彩铃标签生成方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述多模态视频彩铃数据包括视频流、音频流和元数据,所述对所述多模态视频彩铃数据进行预处理,得到预处理数据,包括以下步骤:

3.根据权利要求2所述的方法,其特征在于,所述对所述视频流进行时空切片和动态背景抑制处理,得到预处理图像,包括以下步骤:

4.根据权利要求1所述的方法,其特征在于,所述对所述预处理数据进行时空特征提取处理,得到视频时空特征,包括以下步骤:

5.根据权利要求4所述的方法,其特征在于,所述根据光流场算法对所述预处理图像进行位移补偿处理,得到补偿图像,包括以下步骤...

【专利技术属性】
技术研发人员:骆延楠
申请(专利权)人:天翼爱音乐文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1