短视频的音频错误识别方法及相关产品技术

技术编号：30438044 阅读：12 留言：0更新日期：2021-10-24 17:41

本公开提供一种短视频的音频错误识别方法及相关产品，所述方法包括如下步骤：终端进入短视频应用后，采集用户拍摄的第一视频文件；终端提取第一视频文件的第一音频文件，将第一音频文件拆分成多个音频块，每个音频块为音频连续部分；终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误，如第i音频块错误，提取第i音频块对应的第i时间区间，并将第i时间区间显示给用户。本申请提供的技术方案具有用户体验度高的优点。供的技术方案具有用户体验度高的优点。供的技术方案具有用户体验度高的优点。

全部详细技术资料下载

【技术实现步骤摘要】
短视频的音频错误识别方法及相关产品

[0001]本专利技术涉及通信
，具体涉及一种短视频的音频错误识别方法及相关产品。

技术介绍

[0002]短视频即短片视频，是一种互联网内容传播方式，一般是在互联网新媒体上传播的时长在1分钟以内的视频传播内容。
[0003]现有的短视频的音频文件无法实现纠错，无法自动识别音频错误，降低了用户的体验度。

技术实现思路

[0004]本专利技术实施例提供了一种短视频的音频错误识别方法及相关产品，可以实现对音频文件的错误位置进行识别，具有提高用户体验度的优点。
[0005]第一方面，本专利技术实施例提供一种短视频的音频错误识别方法，所述方法包括如下步骤：终端进入短视频应用后，采集用户拍摄的第一视频文件；终端提取第一视频文件的第一音频文件，将第一音频文件拆分成多个音频块，每个音频块为音频连续部分；终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误，如第i音频块错误，提取第i音频块对应的第i时间区间，并将第i时间区间显示给用户。
[0006]可选的，所述将第一音频文件拆分成多个音频块具体包括：提取第一音频文件的时域波形图，将时域波形图中音量小于设定阈值的区间标记出来，将相邻两个标记的区间之间的音频数据确定为一个音频块。
[0007]可选的，所述方法还包括：将第i音频块播放。
[0008]可选的，所述方法还包括：采集第i时间区间的新的音频块，采用新的音频块替换第i音频块。
[0009]第二方面，提供一种终端，...

【技术保护点】

【技术特征摘要】
1.一种短视频的音频错误识别方法，其特征在于，所述方法包括如下步骤：终端进入短视频应用后，采集用户拍摄的第一视频文件；终端提取第一视频文件的第一音频文件，将第一音频文件拆分成多个音频块，每个音频块为音频连续部分；终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误，如第i音频块错误，提取第i音频块对应的第i时间区间，并将第i时间区间显示给用户。2.根据权利要求1所述的方法，其特征在于，所述将第一音频文件拆分成多个音频块具体包括：提取第一音频文件的时域波形图，将时域波形图中音量小于设定阈值的区间标记出来，将相邻两个标记的区间之间的音频数据确定为一个音频块。3.根据权利要求1所述的方法，其特征在于，所述将第一音频文件拆分成多个音频块具体包括：将第一音频文件按基础时间区间拆分成n个基础音频区间，采集n个基础音频区间中每个基础音频区间对应的音量值，将n个基础音频区间进行标记，标记方式具体可以包括：若音量值大于音量阈值，将该基础音频区间标记为普通基础音频区间，若音量值小于音量阈值，将该基础音频区间标记为间隔基础音频区间，将标记后的n个基础音频区间中相邻且相同类型的基础音频区间合并成一个基础音频区间集合，将基础音频区间集合中均包含普通基础音频区间的基础音频区间集合作为一个音频块。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：采集第i时间区间的新的音频块，采用新的音频块替换第i音频块。5.一种终端，所述终端包括：处理器、摄像头、音频器和显示屏，其特征在于，所述摄像头和所述音频器，用于进入短视频应用后，采集用户拍摄的第一视频文件；所述处理器，...

【专利技术属性】
技术研发人员：董秀娟，
申请(专利权)人：深圳市知小兵科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人