带货视频的裁切方法、系统、设备及存储介质技术方案

技术编号：41197529 阅读：2 留言：0更新日期：2024-05-07 22:25

本发明专利技术提供了一种带货视频的裁切方法、系统、设备及存储介质，其中方法部分以下步骤：接收用户上传的待裁切带货视频；在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据；从所述字幕数据中提取出与商品有关的文本并展示在用户界面中；接收用户在所述用户界面中选择的至少一个所述文本；在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段。本发明专利技术的带货视频的裁切方法实现了在带货视频中自动化的快速定位出不同商品在视频中的带货片段位置，并截取出该位置的视频片段以用于商品宣传，减轻了人工剪辑的工作量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频编辑，尤其涉及一种带货视频的裁切方法、系统、设备及存储介质。

技术介绍

1、视频直播能够快速高效地传递信息，具有实时性、现场性、直观性等特点，逐渐成为互联网的重点表达方式。消费类直播是视频直播的一个细分领域，在消费类直播中，主播可以向用户(即观众)展示商品并介绍商品的使用方式；相应地，用户可以通过观看直播来了解商品详情，并可以在直播界面中点击相应的商品链接进行购买。例如，在一个服装直播视频中，主播会试穿多件服装并介绍如何搭配，用户可以在直播界面中找出本场直播展示的服装列表，点击相应的链接进行购买。

2、在某些情况中，商家希望以视频的形式来全面展示商品。为了避免单独录制商品介绍视频的繁琐过程，商家希望从已有的商品直播视频中截取出针对单个商品的短视频，采用该短视频来对单个商品进行展示。例如，商家可以将截取出的短视频放置在相应商品的详情页中，以便用户更加全面地了解商品信息；或者，将短视频转发至特定渠道(例如视频应用、即时通讯应用等)中，以对商品进行宣传推广。

技术实现思路

1、本专利技术的主要目的旨在提供一种带货视频的裁切方法、系统、设备及存储介质，以解决现有技术所述的上述问题。

2、本专利技术第一方面提供了一种带货视频的裁切方法，包括以下步骤：

3、接收用户上传的待裁切带货视频；

4、在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据；

5、从所述字幕数据中提取出与商品有关的文本并展示在用户界面中；

6、接收用户在所述用户界面中选择的至少一个所述文本；

7、在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段。

8、在本专利技术第一方面一种可选的实施方式中，所述在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据包括：

9、从所述待裁切带货视频中提取出音频数据包；

10、利用预先训练好的语音识别模型对所述音频数据包进行语音识别，并记录识别出的每个字的时间戳；

11、将识别出的每个字及每个字的所述时间戳一一对应进行存储至预设格式的文档中，获得所述待裁切带货视频的字幕数据。

12、在本专利技术第一方面一种可选的实施方式中，所述利用预先训练好的语音识别模型对所述音频数据包进行语音识别，并记录识别出的每个字的时间戳包括：

13、通过模型内置的播放器对所述音频数据包进行播放；

14、实时获取所述音频数据包播放时的声纹特征；

15、通过实时波形比对获得所述声纹特征对应的音素；

16、通过预设的音素组合规则实时得到音节；

17、通过字典匹配的方式获得所述音节对应的文字，并记录所述音节的时间区间作为所述文字的时间戳。

18、在本专利技术第一方面一种可选的实施方式中，所述从所述字幕数据中提取出与商品有关的文本并展示在用户界面中包括：

19、遍历所述字幕数据中的各个文字；

20、从所述各个文字查找出可以组成商品名称的文本集；

21、对所述文本集进行去重处理后并区分展示在用户界面中。

22、在本专利技术第一方面一种可选的实施方式中，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段包括：

23、对于与用户选择的每一个所述文本，获取所述文本最早的时间戳；

24、从所述文本最早的时间戳往前遍历所述字幕数据中的各个文字，判断是否存在预设的第一关键词；

25、若存在预设的所述第一关键词，则以所述第一关键词的时间戳作为视频裁切的初步拟定时间起点；

26、获取所述初步拟定时间起点前后第一时间段内的所述待裁切带货视频的若干第一视频帧；

27、通过预设的识物模型判断若干所述第一视频帧是否存在所述文本对应的商品；

28、若存在所述文本对应的商品，则以所述初步拟定时间起点作为所述待裁切带货视频最终的裁切时间起点。

29、在本专利技术第一方面一种可选的实施方式中，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段还包括：

30、对于与用户选择的每一个所述文本，获取所述文本最晚的时间戳；

31、从所述文本最晚的时间戳往后遍历所述字幕数据中的各个文字，判断是否存在预设的第二关键词；

32、若存在预设的所述第二关键词，则以所述第二关键词的时间戳作为视频裁切的初步拟定时间终点；

33、获取所述初步拟定时间终点前后第二时间段内的所述待裁切带货视频的若干第二视频帧；

34、通过预设的识物模型判断若干所述第二视频帧是否存在所述文本对应的商品；

35、若存在所述文本对应的商品，则以所述初步拟定时间终点作为所述待裁切带货视频最终的裁切时间终点。

36、在本专利技术第一方面一种可选的实施方式中，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段之后包括；

37、将各个所述文本对应的视频片段以随机视频帧作为封面配合以商品名称作为视频片段名称的方式展示在所述用户界面上；

38、对于每一段所述视频片段，接收用户选择的风格处理模板；

39、在后台通过预设的图像处理引擎按照所述风格处理模板对所述视频片段进行处理；

40、将所述图像处理引擎处理后的所述视频片段导出至用户预先设定的存储位置进行保存。

41、本专利技术第二方面提供了一种带货视频的裁切系统，所述带货视频的裁切系统包括：

42、视频接收模块，用于接收用户上传的待裁切带货视频；

43、字幕获取模块，用于在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据；

44、文本提取模块，用于从所述字幕数据中提取出与商品有关的文本并展示在用户界面中；

45、文本选择接收模块，用于接收用户在所述用户界面中选择的至少一个所述文本；

46、视频裁切模块，用于在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段。

47、本专利技术第三方面提供了一种带货视频的裁切设备，所述带货视频的裁切设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

48、所述至少一个处理器调用所述存储器中的所述指令，以使得所述带货视频的裁切设备执行如上述任一项所述的带货视频的裁切方法。

49、本专利技术第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述的带货视频的裁切方法。

50、有益效果：本发本文档来自技高网...

【技术保护点】

1.一种带货视频的裁切方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的带货视频的裁切方法，其特征在于，所述在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据包括：

3.根据权利要求2所述的带货视频的裁切方法，其特征在于，所述利用预先训练好的语音识别模型对所述音频数据包进行语音识别，并记录识别出的每个字的时间戳包括：

4.根据权利要求3所述的带货视频的裁切方法，其特征在于，所述从所述字幕数据中提取出与商品有关的文本并展示在用户界面中包括：

5.根据权利要求4所述的带货视频的裁切方法，其特征在于，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段包括：

6.根据权利要求5所述的带货视频的裁切方法，其特征在于，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁切带货视频进行裁切，获得各个所述文本对应的视频片段还包括：

7.根据权利要求1所述的带货视频的裁切方法，其特征在于，所述在后台执行预设的基于文本时间戳的视频裁切算法对所述待裁

8.一种带货视频的裁切系统，其特征在于，所述带货视频的裁切系统包括：

9.一种带货视频的裁切设备，其特征在于，所述带货视频的裁切设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的带货视频的裁切方法。

...

【技术特征摘要】

1.一种带货视频的裁切方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的带货视频的裁切方法，其特征在于，所述在后台执行预设的字幕生成算法获得所述待裁切带货视频的字幕数据包括：

4.根据权利要求3所述的带货视频的裁切方法，其特征在于，所述从所述字幕数据中提取出与商品有关的文本并展示在用户界面中包括：

6.根据权利要求5所述的带货视频的裁切方法，其特征在...

【专利技术属性】
技术研发人员：谭熙，李小龙，
申请(专利权)人：深圳市闪剪智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人