【技术实现步骤摘要】
本申请涉及视频处理,尤其涉及一种视频彩铃标签生成方法、系统、设备及介质。
技术介绍
1、随着5g通信技术的普及与视频彩铃业务的爆发式增长,用户对个性化、场景化的视频彩铃内容需求日益增强。相关技术中,存在文字识别的方式生成视频彩铃标签,通过对视频彩铃的视频字幕进行文字识别从而生成标签。但是,在实际应用中发现,相关的文字识别技术对复杂背景视频的干扰处理能力不足,识别准确率较低。同时,相关技术独立处理音频、视频特征导致标签与内容语义不一致失配率较高,导致生成的标签准确率较低,影响了用户体验和内容推荐的效率。综上,相关技术中存在的技术问题有待得到改善。
技术实现思路
1、本申请实施例的主要目的在于提出一种视频彩铃标签生成方法、系统、设备及介质,能够提高生成标签的准确率。
2、为实现上述目的,本申请实施例的一方面提出了一种视频彩铃标签生成方法,所述方法包括:
3、获取多模态视频彩铃数据;
4、对所述多模态视频彩铃数据进行预处理,得到预处理数据;
5、对
...【技术保护点】
1.一种视频彩铃标签生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述多模态视频彩铃数据包括视频流、音频流和元数据,所述对所述多模态视频彩铃数据进行预处理,得到预处理数据,包括以下步骤:
3.根据权利要求2所述的方法,其特征在于,所述对所述视频流进行时空切片和动态背景抑制处理,得到预处理图像,包括以下步骤:
4.根据权利要求1所述的方法,其特征在于,所述对所述预处理数据进行时空特征提取处理,得到视频时空特征,包括以下步骤:
5.根据权利要求4所述的方法,其特征在于,所述根据光流场
...【技术特征摘要】
1.一种视频彩铃标签生成方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述多模态视频彩铃数据包括视频流、音频流和元数据,所述对所述多模态视频彩铃数据进行预处理,得到预处理数据,包括以下步骤:
3.根据权利要求2所述的方法,其特征在于,所述对所述视频流进行时空切片和动态背景抑制处理,得到预处理图像,包括以下步骤:
4.根据权利要求1所述的方法,其特征在于,所述对所述预处理数据进行时空特征提取处理,得到视频时空特征,包括以下步骤:
5.根据权利要求4所述的方法,其特征在于,所述根据光流场算法对所述预处理图像进行位移补偿处理,得到补偿图像,包括以下步骤...
【专利技术属性】
技术研发人员:骆延楠,
申请(专利权)人:天翼爱音乐文化科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。