音频处理方法、发送端设备、接收端设备及音频处理系统技术方案

技术编号:13964766 阅读:75 留言:0更新日期:2016-11-09 08:52
本申请公开一种音频处理方法、发送端设备、接收端设备及音频处理系统,所述方法通过在发送端设备录入音频时,对录入的语音句进行标记处理,使得所生成的待传输音频中包含用于标记完整语音句的标记信息,从而后续在接收端设备接收到来自发送端设备的音频数据后,可依据其包含的标记信息从中提取出完整的语音句,在此基础上可进行完整语音句的连续播放,有助于用户快速、准确地理解所接听的音频信息,从而应用本申请可有效改善复杂网络环境下的网络通话效率。

【技术实现步骤摘要】

本专利技术属于音频处理
,尤其涉及一种音频处理方法、发送端设备、接收端设备及音频处理系统。
技术介绍
目前,利用网络工具进行语音通话的应用越来越广泛,如借助网络工具进行语音会议等。此类应用场景中,用户的语音音频往往会因异常复杂的网络环境,而受到各种不确定因素(如无线网络信号的强弱、防火墙、系统性能等)的影响,从而会出现网络音频传输不连贯的现象。网络音频的不连贯传输,最终会导致用户接听的语音句(实时播放)断断续续,即导致完整语音句的不连续播放,比如用户在接听到第一句语音的前半句后,延迟一段时间接听到第一句语音的后半句以及第二句语音的前半句,继续延迟一段时间后接听到第二句语音的后半句等等,会严重影响用户的通话效率,从而为用户快速、准确地理解所接听的音频信息带来了困难。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种音频处理方法、发送端设备、接收端设备及音频处理系统,旨在改善网络通话中,因网络音频传输的不连贯性而导致的通话效率低这一问题。为此,本专利技术公开如下技术方案:一种音频处理方法,应用于发送端设备,所述方法包括:对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,所述语音句标记信息用于标记一完整的语音句;发送所述目标音频至接收端设备。上述方法,优选的,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,包括:基于预设的语音句起始判断条件,为实时录入的当前语音句生成所需的语音句起始标记;其中,所述语音句起始标记用于标记所述当前语音句的起始位置;基于预设的语音句结束判断条件,为所述当前语音句生成所需的语音句结束标记;其中,所述语音句结束标记用于标记所述当前语音句的结束位置。上述方法,优选的,所述发送所述目标音频至接收端设备包括:将所述目标音频封装为相应个数的音频数据包,并依次发送各个所述音频数据包至所述接收端设备。一种音频处理方法,应用于接收端设备,所述方法包括:接收目标音频,所述目标音频包含语音句标记信息,所述语音句标记信息用于标记完整的语音句;基于所述语音句标记信息,从所述目标音频中提取出完整的语音句;播放所述完整的语音句。上述方法,优选的,所述接收目标音频包括:依次接收来自发送端设备的各个音频数据包。上述方法,优选的,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述基于所述语音句标记信息,从所述目标音频中提取出完整的语音句,包括:基于所接收音频数据包中的语音句起始标记,定位语音句的起始位置;基于所接收音频数据包中与所述语音句起始标记相邻配对的语音句结束标记,定位语音句的结束位置;依据所述起始位置及所述结束位置,拼接相应音频数据包中的音频片段,得到所述完整的语音句。一种发送端设备,包括:标记处理模块,用于对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,所述语音句标记信息用于标记一完整的语音句;发送模块,用于发送所述目标音频至接收端设备。上述发送端设备,优选的,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述标记处理模块包括:起始标记生成单元,用于基于预设的语音句起始判断条件,为实时录入的当前语音句生成所需的语音句起始标记;其中,所述语音句起始标记用于标记所述当前语音句的起始位置;结束标记生成单元,用于基于预设的语音句结束判断条件,为所述当前语音句生成所需的语音句结束标记;其中,所述语音句结束标记用于标记所述当前语音句的结束位置。上述发送端设备,优选的,所述发送模块包括:数据封装及发送单元,用于将所述目标音频封装为相应个数的音频数据包,并依次发送各个所述音频数据包至所述接收端设备。一种接收端设备,包括:接收模块,用于接收目标音频,所述目标音频包含语音句标记信息,所述语音句标记信息用于标记完整的语音句;提取模块,用于基于所述语音句标记信息,从所述目标音频中提取出完整的语音句;播放模块,用于播放所述完整的语音句。上述接收端设备,优选的,所述接收模块包括:数据包接收单元,用于依次接收来自发送端设备的各个音频数据包。上述接收端设备,优选的,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述提取模块包括:第一定位单元,用于基于所接收音频数据包中的语音句起始标记,定位语音句的起始位置;第二定位单元,用于基于所接收音频数据包中与所述语音句起始标记相邻配对的语音句结束标记,定位语音句的结束位置;拼接单元,用于依据所述起始位置及所述结束位置,拼接相应音频数据包中的音频片段,得到所述完整的语音句。一种音频处理系统,包括如上所述的发送端设备及接收端设备。由以上方案可知,本申请公开的音频处理方法,通过在发送端设备录入音频时,对录入的语音句进行标记处理,使得所生成的待传输音频中包含用于标记完整语音句的标记信息,从而后续在接收端设备接收到来自发送端设备的音频数据后,可依据其包含的标记信息从中提取出完整的语音句,在此基础上可进行完整语音句的连续播放,有助于用户快速、准确地理解所接听的音频信息,从而应用本申请可有效改善复杂网络环境下的网络通话效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1是本申请提供的一种音频处理方法实施例一的流程图;图2是本申请提供的一种音频处理方法实施例二的流程图;图3是本申请提供的一种发送端设备实施例三的结构示意图;图4是本申请提供的一种发送端设备实施例四的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一参考图1,图1为本申请提供的一种音频处理方法实施例一的流程图,本实施例的方法应用于发送端设备,例如具体可应用于进行网络语音通话的发送端通话工具(通话双方可互为发送端、接收端)中,如图1所示,所述音频处理方法可以包括以下步骤:S101:对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,所述语音句标记信息用于标记一完整的语音句。所述语音句标记信息包括语音句起始标记和语音句结束标记。其中,具体可基于预设的语音句起始判断条件、语音句结束判断条件,在发送端设备,如所述发送端通话工具中添加相应的语音句起始侦测逻辑及语音句结束侦测逻辑,以此实现对所录入的每句语音进行起始侦测和结束侦测。在语音句起始侦测和结束侦测的基础上,可分别在所侦测的语音句起始位置、结束位置处为语音句生成、添加一起始标记、结束标记。实际通话场景中,人们一般会较为连续地表述一完整语音句,而不同语音句之间则通常会略有停顿,即不同语音句之间一般会存在一定延时,从而,在录入音频时,同一语音句中的音频在发生时间上的连续性较高,而不同语音句的音频之间在发生时间上的本文档来自技高网...

【技术保护点】
一种音频处理方法,其特征在于,应用于发送端设备,所述方法包括:对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,所述语音句标记信息用于标记一完整的语音句;发送所述目标音频至接收端设备。

【技术特征摘要】
1.一种音频处理方法,其特征在于,应用于发送端设备,所述方法包括:对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,所述语音句标记信息用于标记一完整的语音句;发送所述目标音频至接收端设备。2.根据权利要求1所述的方法,其特征在于,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述对实时录入的当前语音句进行预设的语音句标记处理,得到包含相应语音句标记信息的目标音频,包括:基于预设的语音句起始判断条件,为实时录入的当前语音句生成所需的语音句起始标记;其中,所述语音句起始标记用于标记所述当前语音句的起始位置;基于预设的语音句结束判断条件,为所述当前语音句生成所需的语音句结束标记;其中,所述语音句结束标记用于标记所述当前语音句的结束位置。3.根据权利要求1所述的方法,其特征在于,所述发送所述目标音频至接收端设备包括:将所述目标音频封装为相应个数的音频数据包,并依次发送各个所述音频数据包至所述接收端设备。4.一种音频处理方法,其特征在于,应用于接收端设备,所述方法包括:接收目标音频,所述目标音频包含语音句标记信息,所述语音句标记信息用于标记完整的语音句;基于所述语音句标记信息,从所述目标音频中提取出完整的语音句;播放所述完整的语音句。5.根据权利要求4所述的方法,其特征在于,所述接收目标音频包括:依次接收来自发送端设备的各个音频数据包。6.根据权利要求5所述的方法,其特征在于,所述语音句标记信息包括语音句起始标记和语音句结束标记,则所述基于所述语音句标记信息,从所述目标音频中提取出完整的语音句,包括:基于所接收音频数据包中的语音句起始标记,定位语音句的起始位置;基于所接收音频数据包中与所述语音句起始标记相邻配对的语音句结束标记,定位语音句的结束位置;依据所述起始位置及所述结束位置,拼接相应音频数据包中的音频片段,得到所述完整的语音句。7.一种发送端设备,其特征在于,包括:标记处理模块,用于对实时录入的当前语音句进行预设...

【专利技术属性】
技术研发人员:王俊雄郁凌
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1