语音检测方法及装置制造方法及图纸

技术编号:14469876 阅读:86 留言:0更新日期:2017-01-21 01:40
语音检测方法及装置,所述语音检测方法包括:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。上述的方案,可以提高语音检测的速度,并降低语音检测的成本。

【技术实现步骤摘要】

本专利技术涉及语音检测
,特别是涉及一种语音检测方法及装置
技术介绍
移动终端,是指可以在移动中使用的计算机设备。随着集成电路技术的飞速发展,移动终端已经拥有了强大的处理能力,移动终端正在从简单的通话工具变为一个综合信息处理平台,这也给移动终端增加了更加宽广的发展空间。传统的移动终端,通常需要用户手动操作,因而需要用户集中一定的注意力。语音检测方法和总听系统(AlwaysListeningSystem)的使用,使得可以对移动终端进行非手动激活和操作。当所述总听系统检测到声音信号时,语音检测系统便会激活,并对检测到的声音信号进行检测。然后,移动终端便会根据所检测出的声音信号执行相应的操作,例如,当用户输入“拨打XX的手机”的语音时,移动终端便可以对用户输入的“拨打XX的手机”的语音信息进行检测,并在正确检测后,从移动终端中获取XX的手机号码的信息,并拨打。但是,现有技术中语音检测方法,一般使用较为复杂的数学模型来对输入的声音信号进行检测,因此,存在着检测速度慢且成本高的问题。
技术实现思路
本专利技术实施例解决的问题是如何提高语音检测的速度,并降低语音检测的成本。为解决上述问题,本专利技术实施例提供了一种语音检测方法,所述语音检测方法包括:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。可选地,所述模糊声像规则为采用神经网络算法和遗传算法结合对声音训练样本进行训练得到。可选地,所述模糊声像规则包括第一类模糊声像规则和第二类模糊声像规则,所述将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,包括:当确定当前帧的特征向量与所述预设模糊声像规则的第一类模糊声像规则相匹配时,得到的当前帧的语音检测分值为0;当确定当前帧的特征向量与所述预设模糊声像规则的第二类模糊声像规则相匹配时,得到的当前帧的语音检测分值为1。可选地,所述分值阈值为当前帧的声音数据的信噪比。本专利技术实施例还提供了一种语音检测装置,所述装置包括:分帧处理单元,适于对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算单元,适于计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;匹配单元,适于将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;检测单元,适于当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。可选地,所述模糊声像规则为采用神经网络算法和遗传算法结合对声音训练样本进行训练得到。可选地,所述模糊声像规则包括第一类模糊声像规则和第二类模糊声像规则,所述匹配单元在确定当前帧的特征向量与所述预设模糊声像规则的第一类模糊声像规则相匹配时,得到当前帧的语音检测分值为0;在确定当前帧的特征向量与所述预设模糊声像规则的第二类模糊声像规则相匹配时,得到当前帧的语音检测分值为1。可选地,所述分值阈值为当前帧的声音数据的信噪比。与现有技术相比,本专利技术的技术方案具有以下的优点:上述的方案,通过预设的模糊声像规则计算各个声音帧对应的特征向量的语音检测分值,来确定是否对于输入的声音信号进行检测,由于所述模糊声像规则仅仅用于检测当前帧中是否包括语音信息,而不用关心当前帧中包括的语音数据的具体内容,因此,可以提高语音检测的速度,降低语音检测的成本。进一步地,将计算得到的当前帧的语音检测分值与当前帧的信噪比进行比较,当确定当前帧的语音检测分值大于当前帧的信噪比时,确定当前帧中包括语音数据,由于当前帧的信噪比可以准确地反映当前帧中包括的背景噪声的信息,因此,可以提高语音检测的准确率,提升用户的使用体验。附图说明图1是本专利技术实施例中的一种语音检测方法的流程图;图2是本专利技术实施例中的另一种语音检测方法的流程图;图3是本专利技术实施例中的一种语音检测装置的结构示意图。具体实施方式现有技术中的总听系统采用语音活动检测(VoiceActivityDetection,VAD)技术来对声音进行侦测。但是,现有的语音活动检测方法,通常需要训练得到用于语音检测的数学模型来对输入的声音数据进行检测,由于所述数学模型较为发杂,使得语音检测的过程较为复杂,因此,存在着检测速度慢且成本高的问题。为解决现有技术中存在的上述问题,本专利技术实施例采用的技术方案通过预设的模糊声像规则计算各个声音帧对应的特征向量的语音检测分值,来确定是否对于输入的声音信号进行检测,可以提高语音检测的速度,降低语音检测的成本。为使本专利技术的上述目的、特征和优点能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。图1示出了本专利技术实施例中的一种语音检测方法的流程图。如图1所示的语音检测方法,可以包括:步骤S101:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;在具体实施中,可以使用麦克风(MIC)来对外界的声音信号进行采集,当采集到声音信号时,对采集的声音信号进行处理,得到对应的声音数据,并将得到的声音数据划分成为两个以上的帧。步骤S102:计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量和过零能量差。在具体实施中,将得到的声音数据进行分帧处理得到两个以上的帧时,按照时间的顺序逐帧计算各个帧对应的特征向量,并根据各个帧的特征向量确定是否对相应的帧进行语音检测。其中,为了便于描述,在逐帧计算各个帧的特征向量时,可以将当前正在计算特征向量的帧作为所述当前帧。步骤S103:将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值。在具体实施中,所述模糊声像规则为对声音训练样本进行训练得到,所述模糊声像规则中包括多条声像规则,即为声像规则的集合。其中,各个声像规则中包括对应的决策分值,在确定当前帧的特征向量与所述模糊声像规则中的任一条声像规则匹配时,与当前帧的特征向量相匹配的模糊声像规则中的决策分值,即为当前帧的语音检测分值。步骤S104:当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。在具体实施中,所述分值阈值可以为固定不变,也可以根据各个帧的差异而变化,本领域的技术人员可以根据实际的需要进行设置。下面将结合图2对本专利技术实施例中的语音检测方法做进一步详细的介绍。步骤S201:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧。在具体实施中,可以使用麦克风(MIC)来对外界的声音信号进行采集,当采集到声音信号时,对采集的声音信号进行处理,得到对应的声音数据,并将得到的声音数据划分成为两个以上的帧。步骤S202:计算当前帧的特征向量。在具体实施中,当前帧的特征向量包括宽窗位能量差(wide-windowenergydifference),窄窗位能量差(narrow-windowenergydifference)和过零能量差(zero-crossingdifference),其中,宽窗位能量差,窄窗位能量差和过零能量差可以分本文档来自技高网...

【技术保护点】
一种语音检测方法,其特征在于,包括:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。

【技术特征摘要】
1.一种语音检测方法,其特征在于,包括:对输入的声音信号对应的声音数据进行分帧处理得到多个声音帧;计算当前帧的特征向量,所述特征向量包括宽窗位能量差、窄窗位能量差和过零能量差;将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,所述模糊声像规则为对声音训练样本训练得到;当计算得出的语音检测分值大于分值阈值时,对当前帧对应的声音数据进行检测。2.根据权利要求1所述的语音检测方法,其特征在于,所述模糊声像规则为采用神经网络算法和遗传算法结合对声音训练样本进行训练得到。3.根据权利要求1所述的语音检测方法,其特征在于,所述模糊声像规则包括第一类模糊声像规则和第二类模糊声像规则,所述将当前帧的特征向量与预设的模糊声像规则进行匹配,得到对应的语音检测分值,包括:当确定当前帧的特征向量与所述预设模糊声像规则的第一类模糊声像规则相匹配时,得到的当前帧的语音检测分值为0;当确定当前帧的特征向量与所述预设模糊声像规则的第二类模糊声像规则相匹配时,得到的当前帧的语音检测分值为1。4.根据权利要求1所述的语音检测方法,其特征在于,所述分值阈值为当前帧的声音数据的...

【专利技术属性】
技术研发人员:孙廷玮
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1