用于在嘈杂环境中进行语音欺骗检测的方法和装置制造方法及图纸

技术编号：40840835 阅读：8 留言：0更新日期：2024-04-01 15:07

本发明专利技术提供了一种在嘈杂环境中进行语音欺骗检测的方法。所述方法包括：接收用户的语音输入；接收与所述用户的所述语音输入对应的环境噪声测量值；根据所述语音输入对所述用户进行认证；根据所述环境噪声测量值确定噪声参数；根据所述用户的所述语音输入确定用户语音的伦巴第效应相关特征的实际值；通过将所述伦巴第效应相关特征的所述实际值与所述经过认证的用户的与所述确定的噪声参数对应的伦巴第效应相关特征模板进行比较，确定语音欺骗概率。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及语音欺骗检测。更具体地说，本专利技术涉及一种用于在嘈杂环境中进行语音欺骗检测的方法，从而增加保护和提高准确性。本专利技术还涉及一种用于在嘈杂环境中进行语音欺骗检测的装置，从而增加保护和提高准确性。

技术介绍

1、大多数电子设备都采用生物特征安全测量，即生物特征认证，以允许使用电子设备或在电子设备中执行任何操作。语音认证是生物特征认证之一，广泛应用于现代语音助手、语音控制系统，等等。语音认证用于将语音话语与生物特征配置文件进行匹配，以授予访问权限。许多访问服务的语音认证系统配备有语音认证/验证子系统(authentication/verification subsystem，avs)，因此这些语音认证系统可能对每个人有限制。正如在alexa中所知，典型的语音验证系统与激活短语检测器耦合并使用唤醒短语对用户进行认证。例如，唤醒短语是与预录模板相匹配的语音模式。这些类型的语音认证系统可能容易受到欺骗攻击，例如，语音重放和语音合成。

2、目前，已有几种已知的语音反欺骗技术，包括检测录制/重放音频伪迹和检测语音背景连续性断裂。在语音认证系统中，现有的语音反欺骗技术高度依赖于噪声占主导地位的环境参数。汽车应用、工业应用和开放空间应用中的高噪声水平提供了边缘反欺骗引擎，攻击者可以利用噪声注入对语音认证系统发起连续攻击。此外，这些语音认证系统还包括几种互补技术，以建立可行的保护水平。现有的语音反欺骗系统存在噪声容忍度低的问题，这是关键问题之一。欺骗检测错误可能会随着高噪声水平而增加，导致语音认证系统的安全性和用户体验变得不可接受。

3、因此，本专利技术旨在提高现有系统或技术在语音欺骗检测方面的性能。

技术实现思路

1、本专利技术的一个目的是提供一种在嘈杂环境中进行语音欺骗检测的方法和装置，从而加强保护和提高准确性，同时避免现有技术方法的一个或多个缺点。

2、这个目的通过独立权利要求的特征来实现。其他实现方式在从属权利要求、说明书和附图中是显而易见的。

3、本专利技术提供了一种在嘈杂环境中进行语音欺骗检测的方法。本专利技术还提供了一种用于在嘈杂环境中进行语音欺骗检测的装置。

4、根据第一方面，提供了一种在嘈杂环境中进行语音欺骗检测的方法。所述方法包括：接收用户的语音输入。所述方法包括：接收与所述用户的所述语音输入对应的环境噪声测量值。所述方法包括：根据所述语音输入对所述用户进行认证。所述方法包括：根据所述环境噪声测量值确定噪声参数。所述方法包括：根据所述用户的所述语音输入，确定所述用户语音的伦巴第(lombard)效应相关特征的实际值。所述方法包括：通过将所述伦巴第效应相关特征的所述实际值与所述经过认证的用户的与所述确定的噪声参数对应的伦巴第效应相关特征模板进行比较，确定语音欺骗概率。

5、这种方法能更好地防止嘈杂环境中的语音欺骗攻击。上述方法能防止重放、模仿和语音合成攻击。上述方法可以包括额外的独立认证因素，以对用户进行认证，从而确保系统安全。上述方法相对轻量级。即使在非常嘈杂的环境中，上述方法也能通过语音欺骗概率提高用户的语音输入的准确性。上述方法引入了一种利用噪声进行语音欺骗检测的互补技术，大大提高了嘈杂环境中的语音反欺骗能力。

6、可选地，所述伦巴第效应相关特征包括所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在所述嘈杂环境中的变化，包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

7、可选地，所述噪声参数包括噪声类型和噪声水平。

8、可选地，所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

9、可选地，所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

10、可选地，根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板，所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

11、可选地，所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重，所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的加权差值的函数，其中，所述加权差值通过所述权重得到。

12、可选地，所述方法还包括：根据所述语音欺骗概率验证所述用户的认证。

13、可选地，所述方法还包括：响应于所述验证所述用户的认证，使用所述伦巴第效应相关特征的所述实际值更新所述用户的所述伦巴第效应相关特征模板。

14、根据第二方面，提供了一种在嘈杂环境中进行语音欺骗检测的装置。所述装置包括：输入模块，用于接收用户的语音输入和与所述用户的所述语音输入对应的环境噪声测量值；语音验证模块，用于根据所述语音输入对所述用户进行认证；噪声检索器，用于根据所述环境噪声测量值确定噪声参数；伦巴第特征检索器，用于根据所述用户的所述语音输入确定伦巴第效应相关特征的实际值；欺骗检测器，用于通过将所述伦巴第效应相关特征的所述实际值与所述经过认证的用户的与所述确定的噪声参数对应的伦巴第效应相关特征模板进行比较，确定语音欺骗概率。

15、上述装置可以更好地防止嘈杂环境中的语音欺骗攻击。上述装置能防止重放、模仿和语音合成攻击。上述装置可以包括额外的独立认证因素，以对用户进行认证，从而确保系统安全。上述装置相对轻量级。即使在非常嘈杂的环境中，上述装置也能通过语音欺骗概率提高用户的语音输入的准确性。上述装置引入了一种利用噪声进行语音欺骗检测的互补技术，大大提高了嘈杂环境中的语音反欺骗能力。

16、可选地，所述伦巴第特征检索器用于通过估计所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在嘈杂环境中的变化，确定所述伦巴第效应相关特征的所述实际值，其中，所述变化包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

17、可选地，所述噪声检索器用于确定噪声类型和噪声水平。

18、可选地，所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

19、可选地，所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

20、可选地，所述欺骗检测器用于根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板，将所述语音欺骗概率确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

21、可选地，所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重，所述欺骗检测器用于将所述语音欺骗概率确定为所述伦巴第效应相关特征的本文档来自技高网...

【技术保护点】

1.一种在嘈杂环境中进行语音欺骗检测的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述伦巴第效应相关特征包括所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在所述嘈杂环境中的变化，包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

3.根据权利要求1或2所述的方法，其特征在于，所述噪声参数包括噪声类型和噪声水平。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

5.根据权利要求4所述的方法，其特征在于，所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

6.根据权利要求4或5所述的方法，其特征在于，根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板，所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应

7.根据权利要求6所述的方法，其特征在于，所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重，所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的加权差值的函数，其中，所述加权差值通过所述权重得到。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：根据所述语音欺骗概率验证所述用户的认证。

9.根据权利要求8所述的方法，其特征在于，所述方法还包括：响应于所述验证所述用户的认证，使用所述伦巴第效应相关特征的所述实际值更新所述用户的所述伦巴第效应相关特征模板。

10.一种用于在嘈杂环境中进行语音欺骗检测的装置(102、202)，其特征在于，所述装置(102、202)包括：

11.根据权利要求10所述的装置(102、202)，其特征在于，所述伦巴第特征检索器(110)用于通过估计所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在嘈杂环境中的变化，确定所述伦巴第效应相关特征的所述实际值，其中，所述变化包括语音基频、高中低频段之间的能量分布、声音强度、元音持续时间、频谱倾斜、格式中心频率、关键词持续时间和肺容量的变化。

12.根据权利要求10或11所述的装置(102、202)，其特征在于，所述噪声检索器(108)用于确定噪声类型和噪声水平。

13.根据权利要求10至12中任一项所述的装置(102、202)，其特征在于，所述伦巴第效应相关特征模板包括所述用户语音的所述伦巴第效应相关特征在不同噪声参数下的预设值。

14.根据权利要求13所述的装置(102、202)，其特征在于，所述伦巴第效应相关特征的所述预设值包括所述伦巴第效应相关特征的在训练周期内为所述用户语音在不同噪声参数下采集的平均值。

15.根据权利要求13或14所述的装置(102、202)，其特征在于，所述欺骗检测器(112)用于根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板，将所述语音欺骗概率确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

16.根据权利要求15所述的装置(102、202)，其特征在于，所述伦巴第效应相关特征模板还包括所述伦巴第效应相关特征的权重，所述欺骗检测器(112)用于将所述语音欺骗概率确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的加权差值的函数，其中，所述加权差值通过所述权重得到。

17.根据权利要求10至16中任一项所述的装置(102、202)，其特征在于，所述装置(102、202)还包括决策模块(214)，所述决策模块(214)用于根据所述语音欺骗概率验证所述用户的认证。

18.根据权利要求10至17中任一项所述的装置(102、202)，其特征在于，所述装置(102、202)还包括数据采集器，所述数据采集器用于为每个用户采集所述用户语音在正常条件下的特征、噪声参数、所述用户语音的所述伦巴第效应相关特征在所述噪声参数下的实际值和所述伦巴第特征效应相关模板。

19.根据权利要求18所述的装置(102、202)，其特征在于，所述装置(102、202)还包括学习引擎(414)，所述学习引擎(414)用于：响应于所述决策模块和/或学习触发器验证所述用户的认证，使用所述伦巴第效应相关特征的所...

【技术特征摘要】
【国外来华专利技术】

1.一种在嘈杂环境中进行语音欺骗检测的方法，其特征在于，所述方法包括：

3.根据权利要求1或2所述的方法，其特征在于，所述噪声参数包括噪声类型和噪声水平。

6.根据权利要求4或5所述的方法，其特征在于，根据所述经过认证的用户的与所述确定的噪声参数对应的所述伦巴第效应相关特征模板，所述语音欺骗概率被确定为所述伦巴第效应相关特征的所述实际值与所述伦巴第效应相关特征的所述预设值之间的差值的函数。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：根据所述语音欺骗概率验证所述用户的认证。

10.一种用于在嘈杂环境中进行语音欺骗检测的装置(102、202)，其特征在于，所述装置(102、202)包括：

11.根据权利要求10所述的装置(102、202)，其特征在于，所述伦巴第特征检索器(110)用于通过估计所述用户语音在时域、频谱域和功率谱域上的特征在正常条件下和在嘈杂环境中的变化，确定所述伦巴第效应相关特征的所述实际值，其中，所述变化包括语音基频、高中低频段之间的能量分...

【专利技术属性】
技术研发人员：奥列格·波戈尼克，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人