语音信号的录制方法和装置制造方法及图纸

技术编号:7515841 阅读:179 留言:0更新日期:2012-07-11 22:10
本发明专利技术公开了一种语音信号的录制方法和装置,涉及语音识别领域。为解决语音信号录制时噪声干扰的问题而发明专利技术。当用户启动语音录制功能后,根据预先设置的第一时间窗长度获取当前输入的语音信号;计算所述语音信号的平均能量值;将所述语音信号的平均能量值与预先设置的环境噪声的平均能量值进行比较,获取第一比较结果;根据所述第一比较结果确定是否对所述语音信号进行录制。发明专利技术实施例提供的技术方案可以应用在语音识别系统中。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,尤其涉及一种语音信号的录制方法和装置
技术介绍
随着智能科技的发展,人类已经不再满足于通过鼠标、按键等方式和设备进行交互,而是希望可以通过语音的方式与设备进行交互,实现对设备的语音控制。语音识别技术作为语音交互技术的核心技术之一,已日趋成熟,并逐渐应用在信息处理、教育与商务应用、消费电子等领域。语音识别的一个重要环节是将用户发送的语音信号进行录制,然后语音识别系统采用相关的语音识别算法对录制生成的音频信号进行语音识别。在现有技术中,用户启动语音识别功能后,麦克风会自动开始录音,然而,在实际的使用过程中,用户不一定马上发送语音信号,一般情况下,在用户启动语音识别功能与发送语音信号之间会存在部分空闲时间,在此时间段内,麦克风会对周围环境的噪音进行录音,由于存在噪声干扰,降低了语音识别系统的识别准确率。
技术实现思路
本专利技术的实施例提供一种语音信号的录制方法和装置,能够提高语音识别的准确率。一方面,提供了一种语音信号的录制方法,包括当用户启动语音录制功能后,根据预先设置的第一时间窗长度获取当前输入的语音信号;计算所述语音信号的平均能量值;将所述语音信号的平均能量值与预先设置的环境噪声的平均能量值进行比较,获取第一比较结果;根据所述第一比较结果确定是否对所述语音信号进行录制。另一方面,提供了一种语音信号的录制装置,包括第一获取单元,用于当用户启动语音录制功能后,根据预先设置的第一时间窗长度获取当前输入的语音信号;第一计算单元,用于计算所述第一获取单元获取的语音信号的平均能量值;第一比较单元,用于将所述第一计算单元获取的语音信号的平均能量值与预先设置的环境噪声的平均能量值进行比较,获取第一比较结果;确定单元,用户根据所述第一比较单元获取的第一比较结果确定是否对所述语音信号进行录制。本专利技术实施例提供的语音信息的录制方法和装置,根据环境噪声的平均能量值与语音信号的平均能量值的比较结果确定是否对语音信号进行录制,避免了语音信号录制时录制到单纯的环境噪声的问题,由于本专利技术的技术方案考虑到环境噪声对语音信号录制的影响,使得采用本专利技术提供的技术方案录制的语音信号更准确,从而提高了对录制的语音信号进行语音识别的准确性,进一步地,节省了语音信号录制占用的存储资源以及通信资源。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的语音信号的录制方法流程图一;图2为本专利技术实施例提供的语音信号的录制方法流程图二 ;图3为本专利技术实施例提供的语音信号的录制装置结构示意图一;图4为本专利技术实施例提供的语音信号的录制装置结构示意图二 ;图5为本专利技术实施例提供的语音信号的录制装置结构示意图三;图6为本专利技术实施例提供的语音信号的录制装置结构示意图四。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了解决语音信号录制时噪声干扰的问题,本专利技术实施例提供一种语音信号的录制方法和装置。如图1所示,本专利技术实实施例提供的语音信号的录制方法,包括步骤101,当用户启动语音录制功能后,根据预先设置的第一时间窗长度获取当前输入的语音信号。本实施例不对第一时间窗长度进行具体的限定,在实际的使用过程中,用户可以根据需求自定义设定第一时间窗长度,此处不做赘述。步骤102,计算语音信号的平均能量值。步骤103,将语音信号的平均能量值与预先设置的环境噪声的平均能量值进行比较,获取第一比较结果。在本实施例中,环境噪声的平均能量值可以是预先存储好的,例如可以将环境噪声设置成不同的状态,如安静、一般或者嘈杂等,并根据不同的状态设置不同的环境噪声的平均能量值,如安静状态对应的环境噪声的平均能量值为20dB,一般状态对应的环境噪声的平均能量值为30dB,嘈杂状态对应的环境噪声的平均能量值为50dB等。环境噪声的平均能量值也可以是根据动态环境变化实时检测获得的,则此时,在步骤103之前还可以包括根据预先设置的第二时间窗长度获取当前环境噪声的平均能量值的步骤。需要说明的是,与第一时间窗长度相同地,本专利技术实施例也不对第二时间窗长度进行具体的限定,用户可以根据需要自定义设置,此处不做赘述。可选地,如果环境噪声的平均能量值是实时检测获得的,为了后续使用的方便,节省检测消耗的资源,本专利技术实施例提供的语音信号的录制方法还可以包括将当前环境噪声的平均能量值进行存储的步骤。当然,以上仅为两种具体的举例,在实际的使用过程中,用户还可以通过其他方式获取环境噪声的平均能量值,此处不再一一赘述。步骤104,根据第一比较结果确定是否对语音信号进行录制。具体地,如果第一比较结果为语音信号的平均能量值大于预先设置的环境噪声的平均能量值,对语音信号进行录制;否则,不对语音信号进行录制。本专利技术实施例提供的语音信息的录制方法,根据环境噪声的平均能量值与语音信号的平均能量值的比较结果确定是否对语音信号进行录制,避免了语音信号录制时录制到单纯的环境噪声的问题,由于本专利技术的技术方案考虑到环境噪声对语音信号录制的影响, 使得采用本专利技术提供的技术方案录制的语音信号更准确,从而提高了对录制的语音信号进行语音识别的准确性,进一步地,节省了语音信号录制占用的存储资源以及通信资源。为了避免瞬态噪声对语音信号录制的影响,如图2所示,本专利技术另一实施例还提供一种语音信息的录制方法,该方法与如图1所示的基本相同,其区别在于在步骤101之后,还包括步骤105,对语音信号进行缓存。在本实施例中,步骤105具体位于步骤101之后以及步骤102之前,在实际的使用过程中,步骤105也可以位于其他位置,此处不做赘述。步骤106,如果第一比较结果为语音信号的平均能量值大于预先设置的环境噪声的平均能量值,根据第一时间窗长度获取与语音信号相邻的下一段语音信号。步骤107,计算下一段语音信号的平均能量值。步骤108,将下一段语音信号的平均能量值与预先设置的环境噪声的平均能量值进行比较,获取第二比较结果。则此时,步骤104替换为根据第一比较结果和第二比较结果,确定是否对语音信号以及下一段语音信号进行录制。本专利技术实施例提供的语音信息的录制方法,根据环境噪声的平均能量值与语音信号的平均能量值的比较结果确定是否对语音信号进行录制,避免了语音信号录制时录制到单纯的环境噪声的问题,由于本专利技术的技术方案考虑到环境噪声对语音信号录制的影响, 使得采用本专利技术提供的技术方案录制的语音信号更准确,从而提高了对录制的语音信号进行语音识别的准确性,进一步地,节省了语音信号录制占用的存储资源以及通信资源。如图3所示,本专利技术实施例还提供一种语音信号的录制装置,包括第一获取单元301,用于当用户启动语音录制功能后,根据预先设置的第一时间窗长度获取当前输入的语音信号;第一计算单元302,用于计算第一获取单元本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:邵颖张然刘湘洲
申请(专利权)人:深圳市车音网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术