视频处理方法、电子设备以及存储介质技术

技术编号:41663090 阅读:15 留言:0更新日期:2024-06-14 15:23
本申请公开了一种视频处理方法、电子设备以及存储介质,涉及大模型技术、直播领域。其中,该方法包括:获取原始视频和预存的产品列表,其中,原始视频包括至少一个产品的内容展示,产品列表包含用于描述至少一个产品的属性的描述文本;对原始视频进行信息抽取,得到多个语音片段和语音片段对应的关键视频帧;基于描述文本、多个语音片段和关键视频帧对原始视频进行切分,得到至少一个产品的子视频。本申请解决了相关技术中对视频的处理准确率较低的技术问题。

【技术实现步骤摘要】

本申请涉及大模型技术、直播领域,具体而言,涉及一种视频处理方法、电子设备以及存储介质


技术介绍

1、目前,直播电商是当前电商平台的重要组成,对直播电商内容的采集和分析是平台运营的重要环节,例如,价格对比、优惠活动对比,传统电商也有此环节,但传统电商是以网页中的文本加图像作为主展示产品,目前对文本或图像的分析技术已经成熟,完全可以实现自动化,但是直播电商主要是靠口述和实物讲解为主展现商品,且过程中存在较多干扰问题,导致原始视频的处理准确率较低。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种视频处理方法、电子设备以及存储介质,以至少解决相关技术中对视频的处理准确率较低的技术问题。

2、根据本申请实施例的一个方面,提供了一种视频处理方法,包括:获取原始视频和预存的产品列表,其中,原始视频包括至少一个产品的内容展示,产品列表包含用于描述至少一个产品的属性的描述文本;对原始视频进行信息抽取,得到多个语音片段和语音片段对应的关键视频帧;基于描述文本、本文档来自技高网...

【技术保护点】

1.一种视频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于所述描述文本、所述多个语音片段和所述关键视频帧对所述原始视频进行切分,得到所述至少一个产品的子视频,包括:

3.根据权利要求2所述的方法,其特征在于,所述视频切分模型包括:图像编码器、分词器和多模态大模型;

4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述原始视频进行信息抽取,得到多个语音片段和所述语音片段对应的关键视频帧,包括:

6.根据权利要求5所述的方法,其特征在于,所...

【技术特征摘要】

1.一种视频处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,基于所述描述文本、所述多个语音片段和所述关键视频帧对所述原始视频进行切分,得到所述至少一个产品的子视频,包括:

3.根据权利要求2所述的方法,其特征在于,所述视频切分模型包括:图像编码器、分词器和多模态大模型;

4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述原始视频进行信息抽取,得到多个语音片段和所述语音片段对应的关键视频帧,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述多个文本片段和所述至少一个产品的描述文本,从所述原始视频中抽取出所述关键视频帧,包括:

7.一种视频处理方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,基于所述描述文本、所述多个语音片段和所述关键视频帧对所述原始视频进行切分,得到所述至少一个商品的子视频,包括:

9.根据权利要求8所述的方法,其特征在于,所述视频切...

【专利技术属性】
技术研发人员:余天予王潇斌蒋勇谢朋峻
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1