基于人声的声音信号识别方法、装置及存储介质制造方法及图纸

技术编号:35542292 阅读:16 留言:0更新日期:2022-11-09 15:11
本发明专利技术提供一种基于人声的声音信号识别方法、装置、电子设备及存储介质,该方法进行声音信号识别时,可以根据声纹校验结果区分声音信号中的第一人声信号和第二人声信号,并基于针对助听器触发的模式选择操作,确定相应的工作模式,随后根据工作模式,灵活地对人声信号进行处理,由此,提高了助听器对声音信号识别的灵活性,进而提升助听器用户对声音信息的辨识度。识度。识度。

【技术实现步骤摘要】
基于人声的声音信号识别方法、装置及存储介质


[0001]本专利技术涉及信号数据处理领域,特别是涉及一种基于人声的声音信号识别方法、装置、电子设备及存储介质。

技术介绍

[0002]助听器是一种小型扩音器,把原本听不到的声音加以扩大,再利用听障者的残余听力,使声音能送到大脑听觉中枢,而感觉到声音,用于帮助听力障碍的用户听取外界的声音。
[0003]助听器通常会将所接收到的声音调整至预先设定的声音强度或者由用户操作助听器上的音量键以调整所接收到的声音,然而,在声源环境复杂的环境下,目前的助听器无法对接收到的声音信号进行处理,导致用户无法听清期望听到的声音,进而降低了助听器用户对声音信息的辨识度。
[0004]故需要提供一种基于人声的声音信号识别方法及装置,以解决上述的技术问题。

技术实现思路

[0005]本专利技术实施例提供一种基于人声的声音信号识别方法及装置,可以灵活地对声音信号进行处理,进而提升助听器用户对声音信息的辨识度。
[0006]本专利技术实施例提供一种基于人声的声音信号识别方法,其包括:采集当前环境的声音信号;采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号;响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式;当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号,并基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类;当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号。
[0007]本专利技术实施例还提供一种基于人声的声音信号识别装置,其包括:采集模块,用于采集当前环境的声音信号;识别模块,用于采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号;
第一确定模块,用于响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式;输出模块,用于当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;第二确定模块,用于当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号;分类模块,用于基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类;播放模块,用于当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号。
[0008]本专利技术实施例还提供一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时执行上述声音信号识别方法。
[0009]本专利技术实施例还提供一种存储介质,其内存储有处理器可执行指令,所述指令由一个或一个以上处理器加载,以执行上述声音信号识别方法。
[0010]本专利技术的声音信号识别方法及声音信号识别装置,在采集当前环境的声音信号后,采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号,接着,响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式,当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号,并基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类;当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号,可见,本专利技术的声音信号识别方法及声音信号识别装置,可以根据声纹校验结果区分声音信号中的第一人声信号和第二人声信号,并基于针对助听器触发的模式选择操作,确定相应的工作模式,随后根据工作模式,灵活地对人声信号进行处理,由此,提高了助听器对声音声音信号识别的灵活性,进而提升助听器用户对声音信息的辨识度。
附图说明
[0011]图1为本专利技术的声音信号识别方法的流程示意图;图2为本专利技术的声音信号识别方法的信号热度图;图3为本专利技术的声音信号识别方法的另一流程示意图;图4为本专利技术的声音信号识别方法中生成对抗网络的结构示意图;图5为本专利技术的声音信号识别装置的一实施例的结构示意图;图6为本专利技术的声音信号识别装置的一实施例的输出模块的结构示意图;
图7为本专利技术的声音信号识别装置所在的电子设备的工作环境结构示意图。
具体实施方式
[0012]请参照图式,其中相同的组件符号代表相同的组件,本专利技术的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本专利技术具体实施例,其不应被视为限制本专利技术未在此详述的其它具体实施例。
[0013]在以下的说明中,本专利技术的具体实施例将参考由一部或多部计算机所执行之作业的步骤及符号来说明,除非另有述明。因此,其将可了解到这些步骤及操作,其中有数次提到为由计算机执行,包括了由代表了以一结构化型式中的数据之电子信号的计算机处理单元所操纵。此操纵转换该数据或将其维持在该计算机之内存系统中的位置处,其可重新配置或另外以本领域技术人员所熟知的方式来改变该计算机之运作。该数据所维持的数据结构为该内存之实体位置,其具有由该数据格式所定义的特定特性。但是,本专利技术原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
[0014]本专利技术的基于人声的声音信号识别方法及声音信号识别装置可设置在任何的电子设备中,用于采集当前环境的声音信号,采用预设声纹识别模型识别声音信号中人声信号,得到第一人声信号和第二人声信号,响应于针对助听器触发的模式选择操作,确定助听器的工作模式,当工作模式为第一模式时,则根据当前环境对应的场景类型、历史拾音数据以及第一人声信号的采集时间,输出第一人声信号;当工作模式为第二模式时,在第二人声信号中确定满足预设条件的目标人声信号,并基于目标人声信号对应的语音特征序列对目标人声信号进行分类;当目标人声信号为第一类型的人声信号时,增强第一人声信号的音量,并播放目标人声信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人声的声音信号识别方法,应用于助听器,其特征在于,包括:采集当前环境的声音信号;采用预设声纹识别模型识别所述声音信号中人声信号,得到第一人声信号和第二人声信号,所述第一人声信号为声纹校验成功的人声信号,所述第二人声信号为声纹校验失败的人声信号;响应于针对所述助听器触发的模式选择操作,确定所述助听器的工作模式;当所述工作模式为第一模式时,则根据所述当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号;当所述工作模式为第二模式时,在所述第二人声信号中确定满足预设条件的目标人声信号,并基于所述目标人声信号对应的语音特征序列对所述目标人声信号进行分类;当所述目标人声信号为第一类型的人声信号时,增强所述第一人声信号的音量,并播放所述目标人声信号和音量增强后的第一人声信号;当所述目标人声信号为第二类型的人声信号时,对所述目标人声信号进行转换,并播放所述第一人声信号以及转换后的目标人声信号。2.根据权利要求1所述的方法,其特征在于,所述根据确定当前环境对应的场景类型、历史拾音数据以及所述第一人声信号的采集时间,输出所述第一人声信号,包括:确定当前环境对应的场景类型;从历史拾音数据中获取历史人声信号对应的历史拾音速度以及历史拾音音强;根据所述场景类型、历史拾音速度、历史拾音音强以及所述第一人声信号的音强,调整所述第一人声信号对应的拾音速度和拾音音强;基于所述第一人声信号的采集时间,按照拾音速度和拾音音强输出所述第一人声信号。3.根据权利要求2所述的方法,其特征在于,所述根据所述场景类型、历史拾音速度、历史拾音音强以及所述第一人声信号的音强,调整所述第一人声信号对应的拾音速度和拾音音强,包括:基于所述助听器的麦克风阵列以及所述第一人声信号的音强,构建所述当前环境对应的信号热度地图;根据所述信号热度地图,确定所述第一人声信号与所述助听器之间的相对位置关系;基于所述相对位置关系,获取拾音速度对应的第一调整参数和拾音音强对应的第二调整参数;计算所述历史人声信号与所述第一人声信号之间的人声相似度;当所述历史人声信号与所述第一人声信号之间的人声相似度大于或等于预设相似度时,则获取所述历史人声信号对应的历史拾音速度以及历史拾音音强,并计算所述场景类型对应的第三调参权重、第一调整参数以及历史拾音速度的乘积,得到所述第一人声信号对应的拾音速度,以及;计算所述场景类型对应的第三调参权重、第二调整参数以及历史拾音音强的乘积,得到所述第一人声信号对应的拾音音强;当所述历史人声信号与所述第一人声信号之间的人声相似度小于预设相似度时,获取所述助听器对应当前拾音速度和当前拾音音强,根据所述第三调参权重、第一调整参数、当前拾音速度以及历史拾音速度的乘积,得到所述第一人声信号对应的拾音速度,以及;计算所述第三调参权重、第二调整参数当前拾音音强以及历史拾音音强的乘积,得到所述第一
人声信号对应的拾音音强。4.根据权利要求3所述的方法,其特征在于,所述基于所述助听器的麦克风阵列以及所述第一人声信号的音强,构建所述当前环境对应的信号热度地图,包括:获取所述助...

【专利技术属性】
技术研发人员:朱元玲朱利翰王强伍朝文杨贵乐有为
申请(专利权)人:深圳市婕妤达电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1