短视频的音频错误识别方法及相关产品技术

技术编号:30438044 阅读:12 留言:0更新日期:2021-10-24 17:41
本公开提供一种短视频的音频错误识别方法及相关产品,所述方法包括如下步骤:终端进入短视频应用后,采集用户拍摄的第一视频文件;终端提取第一视频文件的第一音频文件,将第一音频文件拆分成多个音频块,每个音频块为音频连续部分;终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误,如第i音频块错误,提取第i音频块对应的第i时间区间,并将第i时间区间显示给用户。本申请提供的技术方案具有用户体验度高的优点。供的技术方案具有用户体验度高的优点。供的技术方案具有用户体验度高的优点。

【技术实现步骤摘要】
短视频的音频错误识别方法及相关产品


[0001]本专利技术涉及通信
,具体涉及一种短视频的音频错误识别方法及相关产品。

技术介绍

[0002]短视频即短片视频,是一种互联网内容传播方式,一般是在互联网新媒体上传播的时长在1分钟以内的视频传播内容。
[0003]现有的短视频的音频文件无法实现纠错,无法自动识别音频错误,降低了用户的体验度。

技术实现思路

[0004]本专利技术实施例提供了一种短视频的音频错误识别方法及相关产品,可以实现对音频文件的错误位置进行识别,具有提高用户体验度的优点。
[0005]第一方面,本专利技术实施例提供一种短视频的音频错误识别方法,所述方法包括如下步骤:终端进入短视频应用后,采集用户拍摄的第一视频文件;终端提取第一视频文件的第一音频文件,将第一音频文件拆分成多个音频块,每个音频块为音频连续部分;终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误,如第i音频块错误,提取第i音频块对应的第i时间区间,并将第i时间区间显示给用户。
[0006]可选的,所述将第一音频文件拆分成多个音频块具体包括:提取第一音频文件的时域波形图,将时域波形图中音量小于设定阈值的区间标记出来,将相邻两个标记的区间之间的音频数据确定为一个音频块。
[0007]可选的,所述方法还包括:将第i音频块播放。
[0008]可选的,所述方法还包括:采集第i时间区间的新的音频块,采用新的音频块替换第i音频块。
[0009]第二方面,提供一种终端,所述终端包括:处理器、摄像头、音频器和显示屏,所述摄像头和所述音频器,用于进入短视频应用后,采集用户拍摄的第一视频文件;所述处理器,用于提取第一视频文件的第一音频文件,将第一音频文件拆分成多个音频块,每个音频块为音频连续部分,将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误,如第i音频块错误,提取第i音频块对应的第i时间区间,并将第i时间区间显示给用户。
[0010]可选的,所述处理器,具体用于提取第一音频文件的时域波形图,将时域波形图中音量小于设定阈值的区间标记出来,将相邻两个标记的区间之间的音频数据确定为一个音
频块。
[0011]可选的,所述音频器,还用于将第i音频块播放。
[0012]可选的,所述音频器,还用于采集第i时间区间的新的音频块,所述处理器,还用于采用新的音频块替换第i音频块。
[0013]可选的,所述终端为:智能手机或平板电脑。
[0014]第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面提供的方法。
[0015]实施本专利技术实施例,具有如下有益效果:可以看出,本申请提供的技术方案获取第一视频文件以后,提取第一视频文件的第一音频文件,然后对第一音频文件拆分成多个音频块,然后对多个音频块通过神经网络模型来识别确定是否有错误,具有错误,进行错误提示,这样实现了音频文件的识别,提高用户的体验度。
附图说明
[0016]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是一种终端的结构示意图。
[0018]图2是一种短视频的音频错误识别方法的流程示意图。
[0019]图3是本专利技术实施例提供的终端的结构示意图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]本专利技术的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0022]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0023]短视频传播了物质至上的理念。短视频即短片视频,是一种互联网内容传播方式,一般是在互联网新媒体上传播的时长在30分钟以内的视频;随着移动终端普及和网络的提速,短平快的大流量传播内容逐渐获得各大平台、粉丝和资本的青睐。随着网红经济的
出现,视频行业逐渐崛起一批优质UGC内容制作者,微博、秒拍、快手、今日头条纷纷入局短视频行业,募集一批优秀的内容制作团队入驻。到了2017年,短视频行业竞争进入白热化阶段,内容制作者也偏向PGC化专业运作。
[0024]参阅图1,图1提供了一种终端,该终端具体可以为智能手机、平板电脑、计算机、服务器,该智能手机可以为IOS、安卓等系统的终端,上述终端具体可以包括:处理器、存储器、摄像头和显示屏,上述部件可以通过总线连接,也可以通过其他方式连接,本申请并不和限制上述连接的具体方式。
[0025]参阅图2,图2提供了一种短视频的音频错误识别方法,该方法如图2所示,由如图1所示的终端来执行,示例的,本实施例的短视频主要以钢琴短视频为例,该方法包括如下步骤:步骤S201、终端进入短视频应用后,采集用户拍摄的第一视频文件;步骤S202、终端提取第一视频文件的第一音频文件,将第一音频文件拆分成多个音频块,每个音频块为音频连续部分;示例的,上述将第一音频文件拆分成多个音频块具体可以包括:将第一音频文件按基础时间区间拆分成n个基础音频区间,采集n个基础音频区间中每个基础音频区间对应的音量值,将n个基础音频区间进行标记,标记方式具体可以包括:若音量值大于音量阈值(例如30db),将该基础音频区间标记为普通基础音频区间,若音量值小于音量阈值,将该基础音频区间标记为间隔基础音频区间,将标记后的n个基础音频区间中相邻且相同类型的基础音频区间合并成一个基础音频区间集合,将基础音频区间集合中均包含普通基础音频区间的基础音频区间集合作为一个音频块。
[0026]示例的,上述音量值可以为一个基础音频区间的最大音量值,当然在实际应用中,还可以为其他的值,例如一个基础音频区间的平均音量值等等。
[0027]上述音频块的划分方式可以非常方便的将对应的音频数据划分成多个单块,进而实现方便对音频块的识别和确定。
[0028本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种短视频的音频错误识别方法,其特征在于,所述方法包括如下步骤:终端进入短视频应用后,采集用户拍摄的第一视频文件;终端提取第一视频文件的第一音频文件,将第一音频文件拆分成多个音频块,每个音频块为音频连续部分;终端将多个音频块输入到神经网络模型中进行验证确定该音频块是否具有错误,如第i音频块错误,提取第i音频块对应的第i时间区间,并将第i时间区间显示给用户。2.根据权利要求1所述的方法,其特征在于,所述将第一音频文件拆分成多个音频块具体包括:提取第一音频文件的时域波形图,将时域波形图中音量小于设定阈值的区间标记出来,将相邻两个标记的区间之间的音频数据确定为一个音频块。3.根据权利要求1所述的方法,其特征在于,所述将第一音频文件拆分成多个音频块具体包括:将第一音频文件按基础时间区间拆分成n个基础音频区间,采集n个基础音频区间中每个基础音频区间对应的音量值,将n个基础音频区间进行标记,标记方式具体可以包括:若音量值大于音量阈值,将该基础音频区间标记为普通基础音频区间,若音量值小于音量阈值,将该基础音频区间标记为间隔基础音频区间,将标记后的n个基础音频区间中相邻且相同类型的基础音频区间合并成一个基础音频区间集合,将基础音频区间集合中均包含普通基础音频区间的基础音频区间集合作为一个音频块。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:采集第i时间区间的新的音频块,采用新的音频块替换第i音频块。5.一种终端,所述终端包括:处理器、摄像头、音频器和显示屏,其特征在于,所述摄像头和所述音频器,用于进入短视频应用后,采集用户拍摄的第一视频文件;所述处理器,...

【专利技术属性】
技术研发人员:董秀娟
申请(专利权)人:深圳市知小兵科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1