视频文件录制方法、音频文件录制方法及移动终端技术

技术编号:16502736 阅读:141 留言:0更新日期:2017-11-04 12:28
本申请公开一种移动终端的视频文件录制方法,移动终端处于视频录制模式时,通过摄像头获得图像信息、通过麦克风获得音频信息,并且移动终端调用语音识别引擎,基于语音识别引擎对获得的音频信息进行实时处理,以便基于音频信息同步生成字幕信息,移动终端退出视频录制模式后,对本次视频录制过程中获得的图像信息构成的图像流、本次视频录制过程中获得的音频信息构成的音频流、以及本次视频录制过程中获得的字幕信息构成的字幕流进行合成处理,获得第一视频文件。基于本申请公开的方法,能够快捷地制作完成配置有字幕的视频文件。本申请还公开一种移动终端的音频文件录制方法。

Video file recording method, audio file recording method and mobile terminal

The invention discloses a mobile terminal video recording method, mobile terminal in the video recording mode, the camera to obtain the image information and audio information through a microphone, and a mobile terminal call speech recognition engine, speech recognition engine for real-time processing of audio information based on the audio information to generate caption information based on synchronization, mobile the terminal exit video recording mode, the subtitle information obtained on the image of the video image information obtained in the process of recording a stream, the video recording audio information obtained in the course of a audio stream, and the video recording process of subtitle stream synthesis, get the first video files. Based on this method, the video file with subtitles can be rapidly completed. The present invention also discloses an audio file recording method for a mobile terminal.

【技术实现步骤摘要】
视频文件录制方法、音频文件录制方法及移动终端
本申请属于多媒体
,尤其涉及视频文件录制方法、音频文件录制方法及移动终端。
技术介绍
随着互联网技术的发展和互联网资源的日益丰富,用户通过互联网能够获取到多种用于工作、学习、娱乐的资源,音频和视频就是其中重要的资源。为了给用户带来更加丰富的体验,音频和视频通常配有对应的字幕,便于有听觉障碍的用户或者处于嘈杂环境的用户通过字幕清楚地理解音频和视频所播放的内容。目前通常是先制作音频或者视频,后期再制作对应的字幕。但是,目前针对音频或者视频制作字幕的方式较为单一。
技术实现思路
有鉴于此,本申请的目的在于提供一种应用于移动终端的视频文件录制方法,以便更加快捷地制作完成配置有字幕的视频文件。本申请还提供一种应用于移动终端的音频文件录制方法,以便更加快捷地制作完成配置有字幕的音频文件。为实现上述目的,本申请提供如下技术方案:一方面,本申请提供一种移动终端的视频文件录制方法,包括:获得指示开始录制视频的第一指令;响应所述第一指令,进入视频录制模式;在所述视频录制模式下,通过所述移动终端的摄像头获得图像信息,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;获得指示结束录制视频的第二指令;响应所述第二指令,退出所述视频录制模式;将在所述视频录制模式下,由所述图像信息构成的图像流、由所述音频信息构成的音频流、以及由所述字幕信息构成的字幕流合成为第一视频文件,以使得在播放所述第一视频文件时,同步输出所述图像流、所述音频流和所述字幕流。可选的,上述方法中,所述基于所述语音识别引擎对所述音频信息进行实时处理,包括:基于所述音频信息的参数信息确定当前录制环境;基于当前录制环境为所述第一环境的结果,将当前的音频信息同步转换为字幕信息;基于当前录制环境为所述第二环境的结果,暂停将音频信息同步转换为字幕信息的操作,直至获得表明当前录制环境为所述第一环境的结果。可选的,上述方法中,所述第一环境为至少有一个用户在进行语言输出的环境,所述第二环境为仅存在背景音的环境。可选的,上述方法中,基于所述音频信息的参数信息确定当前录制环境,包括:确定当前音频信息的信噪比;如果当前音频信息的信噪比大于阈值,则确定当前录制环境为所述第一环境;如果当前音频信息的信噪比小于所述阈值,则确定当前录制环境为所述第二环境。可选的,所述移动终端包括麦克风阵列,所述麦克风阵列包括多个安装位置不同的麦克风,其中,所述摄像头所在的侧面上设置有至少一个麦克风,所述移动终端的至少一个其他侧面上设置有麦克风;上述方法中,所述通过所述移动终端的麦克风获得音频信息,包括:通过所述麦克风阵列获得目标用户的音频信息,其中,所述目标用户为能够通过所述移动终端的摄像头进行图像采集且显示在所述移动终端的显示屏内的用户。另一方面,本申请提供一种移动终端,包括输入接口、摄像头、麦克风和处理器;所述输入接口用于采集输入指令;所述处理器用于:响应指示开始录制视频的第一指令,进入视频录制模式;在所述视频录制模式下,通过所述移动终端的摄像头获得图像信息,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;响应指示结束录制视频的第二指令,退出所述视频录制模式;将在所述视频录制模式下,由所述图像信息构成的图像流、由所述音频信息构成的音频流、以及由所述字幕信息构成的字幕流合成为第一视频文件,以使得在播放所述第一视频文件时,同步输出所述图像流、所述音频流和所述字幕流。可选的,上述移动终端中,所述处理器在基于所述语音识别引擎对所述音频信息进行实时处理的方面,用于:基于所述音频信息的参数信息确定当前录制环境;基于当前录制环境为所述第一环境的结果,将当前的音频信息同步转换为字幕信息;基于当前录制环境为所述第二环境的结果,暂停将音频信息同步转换为字幕信息的操作,直至获得表明当前录制环境为所述第一环境的结果。可选的,上述移动终端中,所述处理器将所述第一环境配置为至少有一个用户在进行语言输出的环境,将所述第二环境配置为仅存在背景音的环境。可选的,上述移动终端中,所述处理器在基于所述音频信息的参数信息确定当前录制环境的方面,用于:确定当前音频信息的信噪比;如果当前音频信息的信噪比大于阈值,则确定当前录制环境为所述第一环境;如果当前音频信息的信噪比小于所述阈值,则确定当前录制环境为所述第二环境。可选的,上述移动终端包括麦克风阵列,所述麦克风阵列包括多个安装位置不同的麦克风,其中,所述摄像头所在的侧面上设置有至少一个麦克风,所述移动终端的至少一个其他侧面上设置有麦克风;所述移动终端还包括显示屏;所述处理器在通过所述移动终端的麦克风获得音频信息的方面,用于:通过所述麦克风阵列获得目标用户的音频信息,其中,所述目标用户为能够通过所述移动终端的摄像头进行图像采集且显示在所述移动终端的显示屏内的用户。另一方面,本申请提供一种移动终端的音频文件录制方法,包括:获得指示开始录制音频的第一指令;响应所述第一指令,进入音频录制模式;在所述音频录制模式下,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;获得指示结束录制音频的第二指令;响应所述第二指令,退出所述音频录制模式;将在所述音频录制模式下,由所述音频信息构成的音频流以及由所述字幕信息构成的字幕流合成为第一音频文件,以使得在播放所述第一音频文件时,同步输出所述音频流和所述字幕流。另一方面,本申请提供一种移动终端,包括输入接口、麦克风和处理器;所述输入接口用于采集输入指令;所述处理器用于:响应指示开始录制音频的第一指令,进入音频录制模式;在所述音频录制模式下,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;响应指示结束录制音频的第二指令,退出所述音频录制模式;将在所述音频录制模式下,由所述音频信息构成的音频流以及由所述字幕信息构成的字幕流合成为第一音频文件,以使得在播放所述第一音频文件时,同步输出所述音频流和所述字幕流。由此可见,本申请的有益效果为:本申请公开的移动终端的视频文件录制方法,移动终端处于视频录制模式时,通过摄像头获得图像信息、通过麦克风获得音频信息,并且移动终端调用语音识别引擎,基于语音识别引擎对获得的音频信息进行实时处理,以便基于音频信息同步生成字幕信息,移动终端退出视频录制模式后,对本次视频录制过程中获得的图像信息构成的图像流、本次视频录制过程中获得的音频信息构成的音频流、以及本次视频录制过程中获得的字幕信息构成的字幕流进行合成处理,获得第一视频文件。可以看到,本申请公开的视频文件录制方法,移动终端在录制视频的过程中,通过语音识别引擎对音频信息进行实时处理,从而基于音频信息同步生成字幕信息,移动终端在退出视频录制模式后,即可基于音频流、图像流和字幕流生成视频文件,从而快捷地制作完成配置有字幕的视频文件。附图说明为了更清楚地说明本申请实施例,本文档来自技高网...
视频文件录制方法、音频文件录制方法及移动终端

【技术保护点】
一种移动终端的视频文件录制方法,其特征在于,包括:获得指示开始录制视频的第一指令;响应所述第一指令,进入视频录制模式;在所述视频录制模式下,通过所述移动终端的摄像头获得图像信息,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;获得指示结束录制视频的第二指令;响应所述第二指令,退出所述视频录制模式;将在所述视频录制模式下,由所述图像信息构成的图像流、由所述音频信息构成的音频流、以及由所述字幕信息构成的字幕流合成为第一视频文件,以使得在播放所述第一视频文件时,同步输出所述图像流、所述音频流和所述字幕流。

【技术特征摘要】
1.一种移动终端的视频文件录制方法,其特征在于,包括:获得指示开始录制视频的第一指令;响应所述第一指令,进入视频录制模式;在所述视频录制模式下,通过所述移动终端的摄像头获得图像信息,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;获得指示结束录制视频的第二指令;响应所述第二指令,退出所述视频录制模式;将在所述视频录制模式下,由所述图像信息构成的图像流、由所述音频信息构成的音频流、以及由所述字幕信息构成的字幕流合成为第一视频文件,以使得在播放所述第一视频文件时,同步输出所述图像流、所述音频流和所述字幕流。2.根据权利要求1所述的方法,其特征在于,所述基于所述语音识别引擎对所述音频信息进行实时处理,包括:基于所述音频信息的参数信息确定当前录制环境;基于当前录制环境为所述第一环境的结果,将当前的音频信息同步转换为字幕信息;基于当前录制环境为所述第二环境的结果,暂停将音频信息同步转换为字幕信息的操作,直至获得表明当前录制环境为所述第一环境的结果。3.根据权利要求2所述的方法,其特征在于,所述第一环境为至少有一个用户在进行语言输出的环境,所述第二环境为仅存在背景音的环境。4.根据权利要求3所述的方法,其特征在于,基于所述音频信息的参数信息确定当前录制环境,包括:确定当前音频信息的信噪比;如果当前音频信息的信噪比大于阈值,则确定当前录制环境为所述第一环境;如果当前音频信息的信噪比小于所述阈值,则确定当前录制环境为所述第二环境。5.根据权利要求1所述的方法,其特征在于,所述移动终端包括麦克风阵列,所述麦克风阵列包括多个安装位置不同的麦克风,其中,所述摄像头所在的侧面上设置有至少一个麦克风,所述移动终端的至少一个其他侧面上设置有麦克风;所述通过所述移动终端的麦克风获得音频信息,包括:通过所述麦克风阵列获得目标用户的音频信息,其中,所述目标用户为能够通过所述移动终端的摄像头进行图像采集且显示在所述移动终端的显示屏内的用户。6.一种移动终端,其特征在于,包括输入接口、摄像头、麦克风和处理器;所述输入接口用于采集输入指令;所述处理器用于:响应指示开始录制视频的第一指令,进入视频录制模式;在所述视频录制模式下,通过所述移动终端的摄像头获得图像信息,通过所述移动终端的麦克风获得音频信息;调用语音识别引擎,基于所述语音识别引擎对所述音频信息进行实时处理,以使得基于所述音频信息同步生成字幕信息;响应指示结束录制视频的第二指令,退出所述视频录制模式;将在所述视频录制模式下,由所述图像信息构成的图像流、由所述音频信息构成的音频流、以及由所述字幕信息构成的字幕流合成为第一视频文件,以使得在播放所述第一视频文件时,同步输出所述图像流...

【专利技术属性】
技术研发人员:张雨田
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1