一种视频处理方法及装置制造方法及图纸

技术编号:13601332 阅读:61 留言:0更新日期:2016-08-27 16:36
本发明专利技术实施例提供一种视频处理方法及装置,用以在拍摄的视频中增加字幕,解决现有技术中视频拍摄同质化的缺陷。所述视频处理方法包括检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息;对录制的语音信息进行识别得到字幕信息;根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。

【技术实现步骤摘要】

本专利技术实施例涉及视频拍摄
,尤其涉及一种视频处理方法及装置
技术介绍
随着智能移动终端技术的发展,使用移动终端进行短视频拍摄成为当下热门应用之一。目前,利用移动终端进行视频拍摄的拍摄方式单一,即用户利用视频拍摄应用程序提供的模板、滤镜等辅助工具进行视频拍摄。视频拍摄完成后,用户可以将其发布到网站供其他用户观看或者下载,也可以在移动终端本地存储,用户无法对拍摄完成的视频按照自己的意愿进行处理,使用用户拍摄的视频趋于同质化。实际应用中,用户可能存在如下需求:在拍摄完成的视频中添加字幕,而现有的视频拍摄方法无法实现该功能,因此,如何在拍摄的视频中增加字幕成为利用移动终端进行视频拍摄
亟待解决的技术问题之一。
技术实现思路
本专利技术实施例提供一种视频处理方法及装置,用以在拍摄的视频中增加字幕,解决现有技术中视频拍摄同质化的缺陷。本专利技术实施例提供一种视频处理方法,包括:检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息;对录制的语音信息进行识别得到字幕信息;根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。本专利技术实施例提供一种视频处理装置,包括:控制单元,用于在检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;以及在检测到结束录制语音触发事件时,停止
播放所述视频和录制语音信息;语音识别单元,用于对录制的语音信息进行识别得到字幕信息;字幕信息插入单元,用于根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。本专利技术实施例提供一种视频处理设备,包括处理器和存储器,处理器可以用于读取存储器中的程序,执行下列过程:检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息;对录制的语音信息进行识别得到字幕信息;根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。本专利技术实施例提供的视频处理方法及装置,在视频拍摄完成后,通过将用户录制的语音识别为字幕并插入至拍摄完成的视频中,用户可以为拍摄的视频添加字幕,使得拍摄的视频更具个性,提高了用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a为本专利技术实施例中视频拍摄完成后用户需要对以完成视频进行处理时的显示界面示意图;图1b为本专利技术实施例中语音录制页面的界面示意图;图1c为本专利技术实施例中为提供字幕开启/关闭开关的界面示意图;图1d为本专利技术实施例中添加了字幕的视频播放效果示意图;图2为本专利技术实施例中视频处理方法流程图;图3为本专利技术实施例中视频拍摄装置结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,
显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一为了提高用户体验,本专利技术实施例中,用户在拍摄完成视频之后,可以为拍摄的视频添加字幕。如图1a所示,为本专利技术实施例中,视频拍摄完成后用户需要对以完成视频进行处理时的显示界面示意图,用户需要为拍摄完成的视频添加字幕时,可以点击添加旁白按键触发视频处理应用程序启动。视频处理应用程序启动后,进入语音录制页面,如图1b所示,为语音录制页面的界面示意图。用户可以通过点击开始录制按键开始录制语音,触发语音录制流程,用户点击开始录制按键的同时,开始播放已完成的视频,用户根据播放的视频录制语音信息。当用户需要结束语音录制流程时,点击结束录制按键,同时停止播放视频。基于此,如图2所示,为本专利技术实施例提供的视频处理方法实施例流程图,可以包括以下步骤:S21、检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制。在检测到用户点击开始录制按键时确定检测到开始录制语音触发事件,此时开始播放已完成视频,并进入语音录制流程。S22、在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息。在检测到用户点击结束录制按键时确定检测到结束录制语音触发事件,此时停止播放已完成视频,结束语音录制流程。S23、对录制的语音信息进行识别得到字幕信息。S24、根据录制的语音信息的时间信息将得到的字幕信息插入到视频中。需要说明的是,具体实施时,还可以在录制语音信息的同时对录制的语音信息进行识别,并插入到视频中进行显示,即步骤S23、步骤S24可以与步骤S21同时执行。在步骤S23中,可以有以下两种实施方式:第一种实施方式、在网络侧进行识别具体的,在检测到结束录制语音触发事件时,向网络侧服务器发送语音识别请求,其中携带有录制的语音信息,由网络侧服务器利用语音识别技术将接收到的语音信息识别为字幕信息后返回。第二种实施方式、在终端设备本地进行识别这种实施方式下,需要开发人在预先在视频处理应用程序中预先写入翻译库,在安装视频处理应用程序时存储至终端设备本地,以识别用户录制的语音。受制于终端设备的存储空间,预先写入的翻译库中包含的语言可能并不完整,例如,可以仅仅写入大部分用户常用的语言,例如中文,英文,对于一些不常见的语言可以不写入,以节省终端设备的存储空间。另外,与网络侧识别方式相比,在终端设备本地识别响应速度相对较快,用户在录制结束后立即可以识别出对应的字幕信息。在网络侧进行识别的实施方式中,由于网络侧服务器可利用的翻译资源较多,因此,可以将用户录制的语音信息识别为不同语言的字幕信息,且其识别结果更加准确。但是,其受网络环境影响较大,如果网络环境较好,终端设备得到字幕信息的延迟较小,如果网络环境较差,终端设备得到字幕信息的延迟较大。为了使得视频播放与语音信息识别得到的字幕信息融合效果更好,具体实施时,在进行字幕识别过程中可以控制视频播放与语音录制同步进行。下面通过实施例二进行说明。实施例二在检测到开始录制语音触发事件时开始播放视频,并获取视频的开始播放时间点;在检测到结束录制语音触发事件时停止播放视频,并获取视频的结束播放时间点。基于此在向视频中插入字幕信息时,可以将字幕信息插入到获取的开始播放时间点与结束播放时间点之间的视频中。例如,在检测到开始录制语音触发事件时开始播放视频,并获取到视频的开始播放时间点为第5s,在检测到结束录制语音触发事件时停止播放视频,并获取到视频的结束播放时间点为第15s,则将识别出的字幕信息插入到视频的第5s-第15s之间。针对网络侧识别的识别结果延迟问题,本专利技术实施例中,在检测到结束录制语音触发事件后,如果获得字幕信息延迟大于预设阈值,例如,字幕信
息延迟2s才获得,则在向视频中插入字幕信息时,需要增加延迟的时间。例如,用户录制5s的语音信息,在2s后获得了识别出的字幕信息,这种情况下,假设获取的开始播放时间点为第5s,结束播本文档来自技高网
...

【技术保护点】
一种视频处理方法,其特征在于,包括:检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息;对录制的语音信息进行识别得到字幕信息;根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。

【技术特征摘要】
1.一种视频处理方法,其特征在于,包括:检测到开始录制语音触发事件时开始播放已拍摄完成的视频并进行语音信息录制;在检测到结束录制语音触发事件时,停止播放所述视频和录制语音信息;对录制的语音信息进行识别得到字幕信息;根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中。2.根据权利要求1所述的方法,其特征在于,对录制的语音信息进行识别得到的字幕信息,具体包括:向网络侧发送语音识别请求,其中所述语音识别请求携带有录制的语音信息;接收所述网络侧根据所述语音信息识别出的字幕信息;或者将录制的语音信息在本地识别为字幕信息。3.根据权利要求1所述的方法,其特征在于,还包括:在检测到开始录制语音触发事件时,获取所述视频的开始播放时间点;在检测到结束录制语音触发事件时,获取所述视频的结束播放时间点;以及根据录制的语音信息的时间信息将所述字幕信息插入到所述视频中,具体包括:将所述字幕信息插入到所述开始播放时间点和结束播放时间点之间的视频中。4.根据权利要求1所述的方法,其特征在于,录制的语音信息由至少一个按照录制时间排列的子语音信息组成。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在检测到删除任一子语音信息触发事件时,删除对应的子语音信息。6.根据权利要求5所述的方法,其特征在于,所述删除对应的子语音信息之后包括:在检测到重新录制被删除的子语音信息的开始录制语音触发事件时,从被删除子语音信息的开始录制时间点开始播放所述视频并重新进行语音信息录制;对重新录制的语音信息进行识别得到字幕信息并根据重新录制语音信息
\t的时间信息将识别得到的字幕信息插入所述视频中。7.根据权利要求6所述的方法,其特征在于,从被删除子语音信息的开始录制时间点开始播放所述视频并重新进行语音信息录制,具体包括:在检测到重新录制被删除的子语音信息的开始录制语音触发事件时,从被删除子语音信息的开始录制时间点开始播放所述视频并重新进行语音信息录制,直至到达所述被删除子语音信息的结束录制时间点时停止录制语音信息并停止播放所述视频;或者在检测到重新录制被删除的子语音信息的开始录制语音触发事件时,从被删除子语音信息的开始录制时间点开始播放所述视频并重新进行语音信息录制,直至到达录制时间最晚的子语音信息的结束录制时间点时停止录制语音信息并停止播放所述视频。8.一种视频处理装置,其特...

【专利技术属性】
技术研发人员:李瑞科姜乐
申请(专利权)人:乐视网信息技术北京股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1