System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于非调制声音信号的定位方法及装置制造方法及图纸_技高网

一种基于非调制声音信号的定位方法及装置制造方法及图纸

技术编号:41328181 阅读:2 留言:0更新日期:2024-05-13 15:06
本申请实施例提供一种基于非调制声音信号的定位方法及装置,属于语音识别技术领域,其中方法包括:通过FastICA算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;使用librosa库将分离音频转换为MFCC特征向量;将MFCC特征向量输入至预训练好的BiLSTM模型,获取分离音频的音频类别;将确定好音频类别的分离音频对应的MFCC特征向量输入至预训练好的LightGBM模型,获取输入MFCC特征向量对应的分离音频的音频距离;基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。本申请实施例实现定位不需要依赖于特定的麦克风阵列设备或超声波设备。

【技术实现步骤摘要】

本申请属于语音识别,更具体地,涉及一种基于非调制声音信号的定位方法及装置


技术介绍

1、室内定位可以分为:基于无线的方式,基于光学视觉的方式,以及基于声音的方式。其中,基于无线的定位方式的定位效果易受到其它无线频段干扰,且受设备性能限制,实现成本较高,同时不同定位设备之间需要兼容的协议才能实现兼容定位;基于光学视觉的定位方式在可见光较低或遮挡物遮挡的场景下,定位效果较差,同时还存在隐私安全等问题。

2、相较来说,基于声音的定位方式可以克服基于无线和基于光学视觉的方式的上述缺陷。传统的声音定位方式包括两种:一种是基于声音强度信息的麦克风阵列定位方式,通过计算不同方位麦克风接收的声音强度信息来实现位置的结算。但是不同声音类别的声音强度信息往往不一样,这种方式在存在混合声源或者不同类别声音的场景下定位性能较差。

3、另一种是基于超声波的定位方式,该方式需要依赖于特定的超声波发送和接收设备,同时超声波的往往是定向发送与接收,只能在某一个方位进行定位。

4、因此,还需要进一步对基于声音的定位方式进行改进。


技术实现思路

1、针对相关技术的缺陷,本申请的目的在于提供一种基于非调制声音信号的定位方法及装置,旨在解决传统基于声音的定位方式定位性能受限的问题。

2、第一方面,本申请实施例提供一种基于非调制声音信号的定位方法,包括:

3、通过fastica算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;

>4、使用librosa库将分离音频转换为mfcc特征向量;

5、将mfcc特征向量输入至预训练好的bilstm模型,获取输入mfcc特征向量对应的分离音频的音频类别;

6、将确定好音频类别的分离音频对应的mfcc特征向量输入至预训练好的lightgbm模型,获取输入mfcc特征向量对应的分离音频的音频距离;

7、基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。

8、在一些实施例中,bilstm模型通过以下步骤训练得到:

9、基于用户设备采集到的不同类别的音频信号,构建第一数据集;

10、使用librosa库将第一数据集中的音频信号转换为mfcc特征向量;

11、基于mfcc特征向量和预定义的音频类别标签训练得到bilstm模型。

12、在一些实施例中,lightgbm模型通过以下步骤训练得到:

13、基于用户设备采集的不同音频类别和不同距离的音频信号,构建第二数据集;

14、使用librosa库将第二数据集中的音频信号转换为mfcc特征向量;

15、将mfcc特征向量输入至lightgbm模型,获得输入mfcc特征向量对应的音频信号的预测距离;

16、以最小化预测距离和实际距离的差值绝对值为目标,迭代更新lightgbm模型的模型参数,直至满足迭代条件。

17、在一些实施例中,确定用户设备或音频类别对应的声源设备的位置,包括:

18、基于预先确定的至少三个用户设备的位置,以及至少三个用户设备采集的目标音频类别的分离音频的音频距离,确定目标音频类别对应的声源设备的位置;或者,

19、基于预先确定的用户设备的至少三处位置,以及在至少三处位置采集的目标音频类别的分离音频的音频距离,确定目标音频类别对应的声源设备的位置;或者,

20、基于预先确定的至少三类分离音频对应的声源设备的位置,以及至少三类分离音频对应的音频距离,确定采集至少三类分离音频的用户设备的位置。

21、在一些实施例中,确定采集至少三类分离音频的用户设备的位置,包括:

22、以至少三类分离音频对应的声源设备的位置为中心,以bilstm模型输出的至少三类分离音频对应的音频距离为半径,分别构建三维球体;

23、确定不同的三维球体的交点为采集至少三类分离音频的用户设备的位置。

24、第二方面,本申请实施例还提供一种基于非调制声音信号的定位装置,包括:

25、音频分离模块,用于通过fastica算法对用户设备采集的周围环境的混合音频进行盲源分离,获得至少两组分离音频;

26、特征提取模块,用于使用librosa库将分离音频转换为mfcc特征向量;

27、音频类别获取模块,用于将mfcc特征向量输入至预训练好的bilstm模型,获取输入mfcc特征向量对应的分离音频的音频类别;

28、音频距离获取模块,用于将确定好音频类别的分离音频对应的mfcc特征向量输入至预训练好的lightgbm模型,获取输入mfcc特征向量对应的分离音频的音频距离;

29、定位模块,用于基于各个分离音频的音频类别和音频距离,确定用户设备或音频类别对应的声源设备的位置。

30、在一些实施例中,bilstm模型通过以下步骤训练得到:

31、基于用户设备采集到的不同类别的音频信号,构建第一数据集;

32、使用librosa库将第一数据集中的音频信号转换为mfcc特征向量;

33、基于mfcc特征向量和预定义的音频类别标签训练得到bilstm模型。

34、在一些实施例中,lightgbm模型通过以下步骤训练得到:

35、基于用户设备采集的不同音频类别和不同距离的音频信号,构建第二数据集;

36、使用librosa库将第二数据集中的音频信号转换为mfcc特征向量;

37、将mfcc特征向量输入至lightgbm模型,获得输入mfcc特征向量对应的音频信号的预测距离;

38、以最小化预测距离和实际距离的差值绝对值为目标,迭代更新lightgbm模型的模型参数,直至满足迭代条件。

39、在一些实施例中,定位模块具体用于:

40、基于预先确定的用户设备的至少三处位置,以及在至少三处位置采集的目标音频类别的分离音频的音频距离,确定目标音频类别对应的声源设备的位置;或者,

41、基于预先确定的至少三类分离音频对应的声源设备的位置,以及至少三类分离音频对应的音频距离,确定采集至少三类分离音频的用户设备的位置。

42、在一些实施例中,定位模块具体用于:

43、以至少三类分离音频对应的声源设备的位置为中心,以bilstm模型输出的至少三类分离音频对应的音频距离为半径,分别构建三维球体;

44、确定不同的三维球体的交点为采集至少三类分离音频的用户设备的位置。

45、第三方面,本申请实施例还提供一种电子设备,包括:至少一个存储器,用于存储程序;至少一个处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行第一方面或第一方面的任一种可能的实现方式所描述的方法。

46、第四方面,本申请实施例还本文档来自技高网...

【技术保护点】

1.一种基于非调制声音信号的定位方法,其特征在于,包括:

2.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述BiLSTM模型通过以下步骤训练得到:

3.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述LightGBM模型通过以下步骤训练得到:

4.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述确定所述用户设备或音频类别对应的声源设备的位置,包括:

5.根据权利要求4所述的基于非调制声音信号的定位方法,其特征在于,所述确定采集所述至少三类分离音频的用户设备的位置,包括:

6.一种基于非调制声音信号的定位装置,其特征在于,包括:

7.根据权利要求6所述的基于非调制声音信号的定位装置,其特征在于,所述BiLSTM模型通过以下步骤训练得到:

8.根据权利要求6所述的基于非调制声音信号的定位装置,其特征在于,所述LightGBM模型通过以下步骤训练得到:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,当所述计算机程序在处理器上运行时,使得所述处理器执行如权利要求1-5任一所述的方法。

...

【技术特征摘要】

1.一种基于非调制声音信号的定位方法,其特征在于,包括:

2.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述bilstm模型通过以下步骤训练得到:

3.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述lightgbm模型通过以下步骤训练得到:

4.根据权利要求1所述的基于非调制声音信号的定位方法,其特征在于,所述确定所述用户设备或音频类别对应的声源设备的位置,包括:

5.根据权利要求4所述的基于非调制声音信号的定位方法,其特征在于,所述确定采集所述至少三类分离音频的用户设备...

【专利技术属性】
技术研发人员:邓乾刘文平杨洋申志飞李思涵杨凌晨
申请(专利权)人:湖北经济学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1