一种语音信号处理方法、装置、终端设备及介质制造方法及图纸

技术编号:17996764 阅读:48 留言:0更新日期:2018-05-19 13:43
本发明专利技术公开了一种语音信号处理方法、装置、终端设备及介质,该方法包括:存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;获取所述目标语音信号的目标语音特征,并将所述目标语音特征进行存储,所述目标语音特征为所述有效语音信号的语音特征中的部分语音特征;释放所述目标语音信号占据的存储空间。实施本发明专利技术实施例,能够在语音流识别中有效节约大量系统资源。

【技术实现步骤摘要】
一种语音信号处理方法、装置、终端设备及介质
本专利技术涉及终端设备
,尤其涉及一种语音信号处理方法、装置、终端设备及介质。
技术介绍
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,都是将整段语音信号采集然后进行存储处理。本专利技术的专利技术人在研究和实践过程中发现,现有技术一方面需要较大的存储空间,另一方面不利于信号采集,一段时间内存储的语音信号中有可能不存在有效语音段,不仅占用了CPU资源,同时还浪费系统存储空间。
技术实现思路
本专利技术实施例提供了一种语音信号处理方法、装置、终端设备及介质,能够有效节约大量系统资源并实现实时连续的语音流识别。第一方面,本专利技术提供了一种语音信号处理方法,包括:存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;获取所述目标语音信号的目标语音特征,并将所述目标语音特征进行存储,所述目标语音特征为所述有效语音信号的语音特征中的部分语音特征;释放所述目标语音信号占据的存储空间。第二方面,本专利技术提供了一种语音信号处理的装置,包括存储单元、获取单元以及释放单元,所述存储单元,用于存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;所述获取单元,用于获取所述目标语音信号的目标语音特征,并将所述目标语音特征进行存储,所述目标语音特征为所述有效语音信号的语音特征中的部分语音特征;所述释放单元,用于释放所述目标语音信号占据的存储空间。第三方面,本专利技术提供了一种语音信号处理的终端设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面的方法。本专利技术实施例通过将目标语音信号存储,获取目标语音信号的目标语音特征,释放目标语音信号的存储空间,然后不断重复上述步骤,以至于获得全部目标语音信号对应的目标语音特征。在此过程中,将语音信号分段存储,提取其语音特征后释放,占用的仅有语音信号的部分大小的存储空间,而不是整段语音信号的存储空间,实现了语音识别中实时连续的语音存储,能在较少的系统资源的情况下实现语音识别中的存储步骤,解决目前存储空间不足而无法有效进行语音识别或进行其他应用操作的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音信号处理方法的流程示意图;图2是本专利技术实施例提供的另一种语音信号处理方法的流程示意图;图3是本专利技术实施例提供的一种装置的结构示意图;图4是本专利技术实施例提供的另一种装置的结构示意图;图5是本专利技术实施例提供的另一种装置的结构示意图;图6是本专利技术实施例提供的一种终端设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。参见图1,是本专利技术实施例提供一种语音信号处理的方法的示意流程图,如图1所示方法可包括:101、存储目标语音信号。需要说明的是,这里执行本专利技术实施例方法的主体,可以是手机、台式电脑、平板电脑、智能手表等配置麦克风的独立设备,也可以是多个设备的组合,例如麦克风和智能电视的组合,还可以为专用的语音识别设备,在此不作限定。其中,目标语音信号是预设时长的有效语音信号中的部分语音信号。语音信号包括有效语音信号和无效语音信号,其中,有效语音信号是用户说话的时候采集到的语音信号,无效语音信号为用户没有说话的时候采集到的语音信号。即,有效语音信号主要采集到的是用户的语音,而无效语音信号采集到的主要是环境噪音。例如,在一段时长为3秒的语音信号中,如果开始头1秒用户没有说话,之后的2秒用户都有说话,则此时第1秒对应的语音信号为无效语音信号,第2、3秒对应的语音信号为有效语音信号。进一步地,有效语音信号的语音特征是指能够被识别的语音特征,具体地,就是有效语音信号的语音特征为语音起始点和语音结束点之间的语音特征,这是通过端点检测得来的。其中,端点检测是根据短时平均幅度、短时平均过零率等语音特征参数,检测有效语音的起始点和结束点。目标语音信号的时长可以根据实际需要进行设置,例如,目标语音信号的时长可以是根据处理器的处理速度,存储器的存储容量等等中的一个或者多个因素进行设置的。如果处理器的处理速度越快,则目标语音信号的时长可以越长;存储器的存储容量越大,则目标语音信号的时长可以越长。可以理解,上述目标语音信号的时长的影响因素仅仅是用作举例,不应构成具体限定。目标语音信号可以是一段较短时间的语音信号,其时长可以是在设备出厂前预先设定的,也可以是在设备使用的过程中自适应进行调整的,可以选在0.5-2s范围间。进一步地,目标语音信号是经过采样和预处理之后的数字信号。由于人耳能听到的声音信号频率范围是200Hz-20KHz,且在当今的主流声音采集卡采样频率一般为22.05KHz、44.1KHz、48KHz三个等级,本专利技术实施例提供的音频采样率范围可以是8kHz~48kHz;AD采样精度可以选择8bit或16bit,在此不作限定。而预处理主要是用于去除语音信号中混入的噪声,这里的噪声包括音频混叠噪声,系统噪声,设备、环境引起的噪声等。此处降噪需要实时处理,根据实际应用场合,可本文档来自技高网...
一种语音信号处理方法、装置、终端设备及介质

【技术保护点】
一种语音信号处理方法,其特征在于,包括:存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;获取所述目标语音信号的目标语音特征,并将所述目标语音特征进行存储,所述目标语音特征为所述有效语音信号的语音特征中的部分语音特征;释放所述目标语音信号占据的存储空间。

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括:存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;获取所述目标语音信号的目标语音特征,并将所述目标语音特征进行存储,所述目标语音特征为所述有效语音信号的语音特征中的部分语音特征;释放所述目标语音信号占据的存储空间。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述有效语音信号的所述语音特征,所述语音特征包括所述有效语音信号中所有目标语音信号对应的目标语音特征。3.根据权利要求1或2所述方法,其特征在于,所述有效语音信号为语音起始点以及语音结束点之间的语音信号,其中,所述语音起始点以及所述语音结束点是通过端点检测得到的。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对所述有效语音信号的语音特征进行识别,从而获得所述有效语音信号的语音识别结果。5.根据权利要求4所述方法,其特征在于,所述对所述有效语音信号的语音特征进行识别,从而获得语音识别结果具体为:将所述有效语音信号中所有目标语音信号对应的目标语音特征分段与语音特征模板进行匹配,从而获得多个部分识别结果;将所述多个部分识别结果进行拼接,从而获得所述语音识别结果。6.一种语音信号处理装置,其特征在于,包括存储单元、获取单元以及释放单元,所述存储单元,用于存储目标语音信号,其中,所述目标语音信号为预设时长的有效语音信号中的部分语音信号;所述获取单元,用于获取所述目标语音信号的目标语音特征,并将所述目标语音特...

【专利技术属性】
技术研发人员:冯澍婷刘洪涛孟亚彬
申请(专利权)人:深圳和而泰智能控制股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1