视频处理方法、电子设备以及存储介质技术

技术编号：41663090 阅读：15 留言：0更新日期：2024-06-14 15:23

本申请公开了一种视频处理方法、电子设备以及存储介质，涉及大模型技术、直播领域。其中，该方法包括：获取原始视频和预存的产品列表，其中，原始视频包括至少一个产品的内容展示，产品列表包含用于描述至少一个产品的属性的描述文本；对原始视频进行信息抽取，得到多个语音片段和语音片段对应的关键视频帧；基于描述文本、多个语音片段和关键视频帧对原始视频进行切分，得到至少一个产品的子视频。本申请解决了相关技术中对视频的处理准确率较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及大模型技术、直播领域，具体而言，涉及一种视频处理方法、电子设备以及存储介质。

技术介绍

1、目前，直播电商是当前电商平台的重要组成，对直播电商内容的采集和分析是平台运营的重要环节，例如，价格对比、优惠活动对比，传统电商也有此环节，但传统电商是以网页中的文本加图像作为主展示产品，目前对文本或图像的分析技术已经成熟，完全可以实现自动化，但是直播电商主要是靠口述和实物讲解为主展现商品，且过程中存在较多干扰问题，导致原始视频的处理准确率较低。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种视频处理方法、电子设备以及存储介质，以至少解决相关技术中对视频的处理准确率较低的技术问题。

2、根据本申请实施例的一个方面，提供了一种视频处理方法，包括：获取原始视频和预存的产品列表，其中，原始视频包括至少一个产品的内容展示，产品列表包含用于描述至少一个产品的属性的描述文本；对原始视频进行信息抽取，得到多个语音片段和语音片段对应的关键视...

【技术保护点】

1.一种视频处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，基于所述描述文本、所述多个语音片段和所述关键视频帧对所述原始视频进行切分，得到所述至少一个产品的子视频，包括：

3.根据权利要求2所述的方法，其特征在于，所述视频切分模型包括：图像编码器、分词器和多模态大模型；

4.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述原始视频进行信息抽取，得到多个语音片段和所述语音片段对应的关键视频帧，包括：

6.根据权利要求5所述的方法，其特征在于，所...

【技术特征摘要】

1.一种视频处理方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述视频切分模型包括：图像编码器、分词器和多模态大模型；

4.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述对所述原始视频进行信息抽取，得到多个语音片段和所述语音片段对应的关键视频帧，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述多个文本片段和所述至少一个产品的描述文本，从所述原始视频中抽取出所述关键视频帧，包括：

7.一种视频处理方法，其特征在于，包括：

8.根据权利要求7所述的方法，其特征在于，基于所述描述文本、所述多个语音片段和所述关键视频帧对所述原始视频进行切分，得到所述至少一个商品的子视频，包括：

9.根据权利要求8所述的方法，其特征在于，所述视频切...

【专利技术属性】
技术研发人员：余天予，王潇斌，蒋勇，谢朋峻，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人