一种基于语音识别的视频拍摄方法技术

技术编号：35299922 阅读：18 留言：0更新日期：2022-10-22 12:48

本发明专利技术公开了一种基于语音识别的视频拍摄方法，包括以下步骤：语音唤醒步骤：设备通过语音识别系统获取语音唤醒命令，设备获取唤醒命令后进入音频和视频录制预备状态；音视频录制步骤：设备根据预定的语音分贝值进入音频、视频录制状态，语音小于预定的分贝值时，设备停止音频、录制视频；音频处理步骤：在视频录制时，通过语音识别系统获取单独的音频文件，并把音频文件数据转化成PCM格式；音视频合成步骤：将录制的视频和语音信息进行合成。本发明专利技术基于语音采集、语音识别和视频素材动态合成技术，实现了一套“说话即拍、闭嘴即停，同时根据用户说话内容自动贴纸”的新一代视频消息交互系统，便于用户与好友之间进行视频互动，增进用户关系。用户关系。用户关系。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语音识别的视频拍摄方法

[0001]本专利技术涉及视频拍摄
，具体涉及一种基于语音识别的视频拍摄方法。

技术介绍

[0002]随着手机的普及，拍摄短视频成为人们生活中一种娱乐方式，通过发布短视频，使得好友能够进行观看，进而达到与朋友进行互动的目的。
[0003]如授权公告号为CN201510374399.4公开了一种视频录制方法及装置。本专利技术所述的一种视频录制方法包括：在第一预览界面中播放视频；实时检测所述第一预览界面是否为当前显示界面，如果是，则对所述当前显示界面中播放的视频进行录制；如果否，则开辟新线程，在所述新线程内，对所述第一预览界面中播放的视频进行录制。
[0004]上述以及在现有技术中的视频拍摄时操作步骤繁琐，导致视频进行拍摄时不方便。因此，亟需设计一种基于语音识别的视频拍摄方法来解决上述问题。

技术实现思路

[0005]本专利技术的目的是提供一种基于语音识别的视频拍摄方法，以解决现有技术中的上述不足之处。
[0006]为了实现上述目的，本专利技术提供如下技术方案：
[0007]一种基于语音识别的视频拍摄方法，包括以下步骤：
[0008]语音唤醒步骤：设备通过语音识别系统获取语音唤醒命令，设备获取唤醒命令后进入音频和视频录制预备状态；
[0009]音视频录制步骤：设备根据预定的语音分贝值进入音频、视频录制状态，语音小于预定的分贝值时，设备停止音频、录制视频；
[0010]音频处理步骤：在视频录制时，通过语音识别系统获...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的视频拍摄方法，其特征在于，包括以下步骤：语音唤醒步骤：设备通过语音识别系统获取语音唤醒命令，设备获取唤醒命令后进入音频和视频录制预备状态；音视频录制步骤：设备根据预定的语音分贝值进入音频、视频录制状态，语音小于预定的分贝值时，设备停止音频、录制视频；音频处理步骤：在视频录制时，通过语音识别系统获取单独的音频文件，并把音频文件数据转化成PCM格式；音视频合成步骤：将录制的视频和语音信息进行合成；生成字幕贴纸步骤：根据获取的语音信息生成对应的字幕，将字幕与视频的对应帧数据进行合成，得到完成拍摄的视频。2.根据权利要求1所述的一种基于语音识别的视频拍摄方法，其特征在于，所述语音唤醒步骤中，所述语音识别系统识别语音的具体方法为：声音信号采集子步骤：通过设备里所带的麦克风、语音采集模块把对声音信号进行储存；声音信号处理子步骤：首先利用谱减法的降噪处理方式对声音信号进行去噪，留得有用的声音信号，然后利用预加重的预处理方式增加语音信号特征；特征提取子步骤：对声音信号中的语音特征进行提取；分类识别子步骤：语音识别系统根据对输入语音的限制进行分类。3.根据权利要求1所述的一种基于语音识别的视频拍摄方法，其特征在于，在所述视频录制步骤中，定义缓存队列音频缓存和视频缓存的队列长度都是1；设备的启动和停止的具体过程如下：启动录制缓存视频和音频；读取音频数据，处理成线性PCM编码格式音频数据，传递给CNN
‑
VAD模块；在CNN
‑
VAD模块，通过频域的滑动平均或移动平均算法来识别是否有语音活动；将设备的视频录制定义为说话模式和非说话模式两种状态；当有语音活动并且分贝大于57db，就表示有人声，设备进入说话模式，在说话模式下，持续缓存数据(视频和音频)，通过pcm重采样，使用c++jni将音频数据转换成科大讯飞听写要求的pcm格式；当语音停止并且分贝小于57db的过程持续500毫秒，设备进入非说话模式，此时设备保存之前的缓存数据，开始下一段数据缓存处理，在非说话模式下，设备停止录制时将数据编码，同时将数据封装成mp4保存；将得到的pcm格式音频数据，通过科大讯飞sdk传入pcm数据，得到音频内容的数据，包括对应时间点的某个单词；然后使用美摄sdk通过API来编辑视频，最终在对应视频的时间点加上字幕。4.根据权利要求2所述的一种基于语音识别的视频拍摄方法，其特征在于，所述语音识别系统包括：特定人语音识别系统：仅考虑对于专人的话音进行识别；非特定人语音系统：识别的语音与人无关，...

【专利技术属性】
技术研发人员：童明，
申请(专利权)人：武汉氪细胞网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人