语音匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:36903421 阅读:52 留言:0更新日期:2023-03-18 09:23
本申请提供一种语音匹配方法、装置、设备及存储介质,其方法包括:获取目标语音数据以及目标语音数据的声源位置坐标;根据声源位置坐标,计算声源位置与语音接收位置之间的目标距离;根据目标距离,在预设的语音数据库中确定语音匹配范围,其中,语音匹配范围所包含的语音数据形成第一语音数据集,语音数据库所包含的语音数据形成第二语音数据集,第一语音数据集为第二语音数据集的子集;将目标语音数据与第一语音数据集中的语音数据进行语音匹配处理,获得目标语音数据对应的语音匹配结果。上述方法通过计算声源位置与声音接收位置之间的目标距离,在进行语音匹配时,将目标距离作为语音匹配的一个参照依据,可以大大提高语音匹配的精准度。音匹配的精准度。音匹配的精准度。

【技术实现步骤摘要】
语音匹配方法、装置、设备及存储介质


[0001]本申请涉及语音匹配
,尤其涉及一种语音匹配方法、装置、设备及存储介质。

技术介绍

[0002]语音匹配,是指对语音音频进行匹配处理。随着声音识别技术的发展,语音匹配被广泛应用在检测领域,例如,车辆鸣笛检测、设备故障检测等,都需要使用到语音匹配系统。然而,目前现有的语音匹配系统,不具有对于声源的定位功能,无法获取声源的具体方位,语音匹配的精确度不高,匹配效果不佳。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种语音匹配方法、装置、设备及存储介质,旨在解决现有技术中语音匹配的精确度不高、匹配效果不佳的技术问题。
[0004]本申请实施例的第一方面提供了一种语音匹配方法,包括:获取目标语音数据以及所述目标语音数据的声源位置坐标;根据所述声源位置坐标,计算声源位置与语音接收位置之间的目标距离;根据所述目标距离,在预设的语音数据库中确定语音匹配范围,其中,所述语音匹配范围所包含的语音数据形成第一语音数据集,所述语音数据库所包含的语音数据形成第二语音数据集,所述第一语音数据集为所述第二语音数据集的子集;将所述目标语音数据与所述第一语音数据集中的语音数据进行语音匹配处理,获得所述目标语音数据对应的语音匹配结果。
[0005]结合第一方面,在第一方面的第一种可能实现方式中,获取目标语音数据的步骤,包括:对目标场景进行声源感测,获得若干个语音信号,其中,一个语音信号对应一个感测点;对所述若干个语音信号分别进行声音强度检测,获得每个所述语音信号对应的声音强度值;根据所述每个语音信号对应的声音强度值,确定目标感测点,将所述目标感测点对应的语音信号确定为目标语音数据,其中,所述目标感测点为所述若干个语音信号中声音强度值最大的语音信号所对应的感测点。
[0006]结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,获取所述目标语音数据的声源位置坐标的步骤,包括:对所述目标语音数据进行特征提取处理,获得所述目标语音数据对应的语音特征;根据所述语音特征进行坐标系建立,获得初始坐标系;根据所述初始坐标系,对所述目标语音数据进行定位处理,获得所述目标语音数据的声源位置坐标。
[0007]结合第一方面的第二种可能实现方式,在第一方面的第三种可能实现方式中,获得所述目标语音数据的声源位置坐标的步骤之后,还包括:对所述目标语音数据进行分段处理,获得若干个语音片段;对所述若干个语音片段进行特征提取处理,获得若干个语音片段特征,所述若干个语音片段与所述若干个语音片段特征一一对应;根据所述若干个语音片段特征,对所述初始坐标系进行优化处理,获得优化后的坐标系;根据所述优化后的坐标
系,对所述声源位置坐标进行调整处理。
[0008]结合第一方面的第二种可能实现方式,在第一方面的第四种可能实现方式中,根据所述初始坐标系,对所述目标语音数据进行定位处理,获得所述目标语音数据的声源位置坐标的步骤之前,还包括:对所述目标语音数据进行环境嘈杂音强检测处理,提取出所述目标语音数据中的环境嘈杂音特征,对所述环境嘈杂音特征进行删除处理。
[0009]结合第一方面,在第一方面的第五种可能实现方式中,将所述目标语音数据与所述第一语音数据集中的语音数据进行语音匹配处理,获得所述目标语音数据对应的语音匹配结果的步骤,包括:对所述目标语音数据进行分段处理,获得若干个语音片段;对所述若干个语音片段进行数据对比处理,获得数据对比结果,其中,所述数据对比处理包括语音特征对比、语音参数对比、语音时长对比、语音占存大小对比;根据所述数据对比结果,对所述若干个语音片段进行段落统计处理,获得段落统计结果;根据所述段落统计结果,对所述若干个语音片段进行语音整合处理,获得整合语音数据,其中,所述语音整合处理包括同一特征语音整合处理、同一参数语音整合、同一时长语音整合与范围占存大小语音整合处理;将所述整合语音数据与所述第一语音数据集中的语音数据进行语音匹配处理,获得所述目标语音数据对应的语音匹配结果。
[0010]结合第一方面的第五种可能实现方式,在第一方面的第六种可能实现方式中,对所述目标语音数据进行分段处理,获得若干个语音片段的步骤之前,还包括:对所述目标语音数据进行预处理,其中,所述预处理包括:模糊段去除处理、语音滤波处理、嘈杂语音处理。
[0011]本申请实施例的第二方面提供了一种语音匹配装置,包括:获取模块,用于获取目标语音数据以及所述目标语音数据的声源位置坐标;计算模块,用于根据所述声源位置坐标,计算声源位置与语音接收位置之间的目标距离;确定模块,用于根据所述目标距离,在预设的语音数据库中确定语音匹配范围,其中,所述语音匹配范围所包含的语音数据形成第一语音数据集,所述语音数据库所包含的语音数据形成第二语音数据集,所述第一语音数据集为所述第二语音数据集的子集;匹配模块,用于将所述目标语音数据与所述第一语音数据集中的语音数据进行语音匹配处理,获得所述目标语音数据对应的语音匹配结果。
[0012]本申请实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面提供的语音匹配方法的各步骤。
[0013]本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的语音匹配方法的各步骤。
[0014]本申请实施例提供的一种语音匹配方法、装置、电子设备及存储介质,具有以下有益效果:
[0015]本申请通过获取目标语音数据以及目标语音数据的声源位置坐标;根据声源位置坐标,计算声源位置与语音接收位置之间的目标距离;根据目标距离,在预设的语音数据库中确定语音匹配范围,其中,语音匹配范围所包含的语音数据形成第一语音数据集,语音数据库所包含的语音数据形成第二语音数据集,第一语音数据集为第二语音数据集的子集;将目标语音数据与第一语音数据集中的语音数据进行语音匹配处理,获得目标语音数据对
应的语音匹配结果。上述方法通过计算声源位置与声音接收位置之间的目标距离,在进行语音匹配时,将目标距离作为语音匹配的一个参照依据,可以大大提高语音匹配的精准度。
附图说明
[0016]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本申请实施例提供的一种语音匹配方法的实现流程图;
[0018]图2为本申请实施例提供的语音匹配方法中获取目标语音数据时的一种方法流程图;
[0019]图3为本申请实施例提供的语音匹配方法中获取目标语音数据的声源位置坐标时的一种方法流程图;
[0020]图4为本申请实施例提供的语音匹配方法中对声源位置坐标进行调整本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音匹配方法,其特征在于,包括:获取目标语音数据以及所述目标语音数据的声源位置坐标;根据所述声源位置坐标,计算声源位置与语音接收位置之间的目标距离;根据所述目标距离,在预设的语音数据库中确定语音匹配范围,其中,所述语音匹配范围所包含的语音数据形成第一语音数据集,所述语音数据库所包含的语音数据形成第二语音数据集,所述第一语音数据集为所述第二语音数据集的子集;将所述目标语音数据与所述第一语音数据集中的语音数据进行语音匹配处理,获得所述目标语音数据对应的语音匹配结果。2.根据权利要求1所述的语音匹配方法,其特征在于,获取目标语音数据的步骤,包括:对目标场景进行声源感测,获得若干个语音信号,其中,一个语音信号对应一个感测点;对所述若干个语音信号分别进行声音强度检测,获得每个所述语音信号对应的声音强度值;根据所述每个语音信号对应的声音强度值,确定目标感测点,将所述目标感测点对应的语音信号确定为目标语音数据,其中,所述目标感测点为所述若干个语音信号中声音强度值最大的语音信号所对应的感测点。3.根据权利要求2所述的语音匹配方法,其特征在于,获取所述目标语音数据的声源位置坐标的步骤,包括:对所述目标语音数据进行特征提取处理,获得所述目标语音数据对应的语音特征;根据所述语音特征进行坐标系建立,获得初始坐标系;根据所述初始坐标系,对所述目标语音数据进行定位处理,获得所述目标语音数据的声源位置坐标。4.根据权利要求3所述的语音匹配方法,其特征在于,获得所述目标语音数据的声源位置坐标的步骤之后,还包括:对所述目标语音数据进行分段处理,获得若干个语音片段;对所述若干个语音片段进行特征提取处理,获得若干个语音片段特征,所述若干个语音片段与所述若干个语音片段特征一一对应;根据所述若干个语音片段特征,对所述初始坐标系进行优化处理,获得优化后的坐标系;根据所述优化后的坐标系,对所述声源位置坐标进行调整处理。5.根据权利要求3所述的语音匹配方法,其特征在于,根据所述初始坐标系,对所述目标语音数据进行定位处理,获得所述目标语音数据的声源位置坐标的步骤之前,还包括:对所述目标语音数据进行环境嘈杂音强检测处理,提取出所述目标语音数据中的环境嘈杂音特征,对所述环境嘈...

【专利技术属性】
技术研发人员:王丹崔洋洋杨登舟
申请(专利权)人:深圳市微纳集成电路与系统应用研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1