当前位置: 首页 > 专利查询>奥多比公司专利>正文

使用转录交互的视频片段选择和编辑制造技术

技术编号:41058278 阅读:15 留言:0更新日期:2024-04-24 11:09
本公开的实施例涉及使用转录交互的视频片段选择和编辑。本发明专利技术的实施例提供了用于标识视频片段的候选边界、使用这些边界的视频片段选择、以及通过转录交互选择的视频片段的基于文本的视频编辑的系统、方法和计算机存储介质。在示例实现中,从转录提取检测到的句子和词的边界,将边界重新定时到到语音或音频活动最小的位置的相邻语音间隙,并且将所得到的边界存储为视频片段的候选边界。因此,转录界面呈现转录,将选择转录文本的输入解释为选择具有从候选边界选择的对应边界的视频片段的指令,并且将传统上认为是基于文本的操作(例如,剪切、复制、粘贴)的命令解释为使用所选择的视频片段执行对应视频编辑操作的指令。

【技术实现步骤摘要】


技术介绍

1、近年来,视频的使用激增,它在从电影电视到广告和社交媒体的几乎每个行业都有应用。企业和个人经常在各种环境中创建和分享视频内容,例如演示文稿、教程、评论、新闻和体育片段、博客、产品评论、表彰、喜剧、舞蹈、音乐、电影和视频游戏,仅举几个示例。视频可以使用相机捕获,使用动画或渲染工具生成,使用各种类型的视频编辑软件进行编辑,并通过各种渠道分享。事实上,数码相机、智能手机、社交媒体和其他技术的最新进步提供了许多新方法,使得即使是新手也更容易捕获和分享视频。随着这些捕获和分享视频的新方式的出现,对视频编辑功能的需求也越来越大。

2、传统上,视频编辑涉及选择视频帧并对帧或相关联的音频执行某种类型的动作。一些常见操作包括导入、裁切、裁剪、重新排列、应用过渡和效果、调整颜色、添加标题和图形、导出及其他。视频编辑软件,例如pro和adobe premiereelements,通常包括图形用户界面(gui),其呈现表示视频中的视频帧的视频时间线,并允许用户选择特定帧以及要对帧执行的操作。然而,传统的视频编辑可能乏味、具有挑战性,甚至超出了许多用户的技本文档来自技高网...

【技术保护点】

1.一种或多种计算机存储介质,存储计算机可用指令,所述计算机可用指令在由一个或多个计算设备执行时,使所述一个或多个计算设备执行操作,所述操作包括:

2.根据权利要求1所述的一种或多种计算机存储介质,其中所述视频分段的所述表示的所述生成包括:从所述转录提取句子片段,并且基于所述视频的音频轨道中的语音或音频活动,针对与间隙相邻的所述句子片段中的一个或多个句子片段,将句子边界重新定时到所述间隙中。

3.根据权利要求1所述的一种或多种计算机存储介质,其中所述视频分段的所述表示的所述生成包括:使用从所述转录被提取的时间戳将句子片段细分为构成词片段。>

4.根据权利...

【技术特征摘要】

1.一种或多种计算机存储介质,存储计算机可用指令,所述计算机可用指令在由一个或多个计算设备执行时,使所述一个或多个计算设备执行操作,所述操作包括:

2.根据权利要求1所述的一种或多种计算机存储介质,其中所述视频分段的所述表示的所述生成包括:从所述转录提取句子片段,并且基于所述视频的音频轨道中的语音或音频活动,针对与间隙相邻的所述句子片段中的一个或多个句子片段,将句子边界重新定时到所述间隙中。

3.根据权利要求1所述的一种或多种计算机存储介质,其中所述视频分段的所述表示的所述生成包括:使用从所述转录被提取的时间戳将句子片段细分为构成词片段。

4.根据权利要求1所述的一种或多种计算机存储介质,其中所述视频分段的所述表示的所述生成包括:从所述转录提取词片段,并且基于所述视频的音频轨道中的语音或音频活动,针对与间隙相邻的所述词片段中的一个或多个词片段,将词边界重新定时到所述间隙中。

5.根据权利要求1所述的一种或多种计算机存储介质,其中与所述转录片段的所述视觉化交互的所述第一输入是点击或敲击并沿着所述转录片段的所述视觉化进行拖动。

6.根据权利要求1所述的一种或多种计算机存储介质,其中与所述转录片段的所述视觉化交互的所述第一输入还将对转录文本的选择对齐到由所述视频分段表示的词边界。

7.根据权利要求1所述的一种或多种计算机存储介质,所述操作还包括:至少基于与所述转录片段的所述视觉化交互的所述第一输入,引起包括执行所述视频编辑操作的选项的菜单的呈现。

8.根据权利要求1所述的一种或多种计算机存储介质,其中与所述转录片段的所述视觉化交互的所述第一输入选择所述转录的转录文本,并且与所述转录片段的所述视觉化交互的所述第二输入包括用以剪切、复制、粘贴或删除所述对应视频片段的指令。

9.根据权利要求1所述的一种或多种计算机存储介质,所述操作还包括:接受从媒体库选择多个视频的输入,生成组合所述多个视频的合成视频的表示,以及将所述合成视频的所述表示加载到视频编辑界面中,其中所述转录对所述合成视频的音频轨道进行转录,并且所述转录的所述视觉化在所述视频编辑...

【专利技术属性】
技术研发人员:白雪J·J·萨拉蒙A·O·阿加瓦拉申熙庭蔡浩然J·R·勃兰特L·A·唐特彻瓦C·A·弗雷泽
申请(专利权)人:奥多比公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1