声音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：35860315 阅读：26 留言：0更新日期：2022-12-07 10:49

本申请实施例公开了一种声音识别方法、装置、设备及存储介质，属于计算机技术领域。该方法的执行主体为计算机设备，该方法包括：获取第一传感器采集目标对象的第一声音特征信息；将第一声音特征信息输入概率密度估计模型，输出第一声音特征信息存在异常声音的第一概率值；在第一概率值符合预设概率条件的情况下，获取第二传感器采集目标对象的第二声音特征信息；根据第一声音特征信息和第二声音特征信息生成目标组合特征信息；将目标组合特征信息输入相关度计算模型，输出相关度；在相关度符合预设相关度条件的情况下，确定目标对象发出异常声音，基于该声音识别模型进行声音识别，可以提高声音识别精度。可以提高声音识别精度。可以提高声音识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
声音识别方法、装置、设备及存储介质

[0001]本申请涉及计算机
，特别涉及一种声音识别方法、装置、设备及存储介质。

技术介绍

[0002]随着生产制造领域技术的提升，越来越多的生产设备得以进入生产车间。而生产车间的正常运营依赖于生产设备的正常运转，如果大型设备非常规性停机将造成设备和材料损耗，生产效率受到影响。因此，需要实时监控生产设备的运行状态。传统的生产设备监控方法通常应用视频采集设备进行监控，采集的视频可用于在生产设备出现故障后进行回看检查，而无法预防设备故障。现在已经有通过声音识别模型检测设备生产至少过程中是否存在异常声音的方法来预防设备故障。
[0003]但现有的声音识别模型通常仅考虑单个传感器的数据，而工业现场的环境复杂，依靠单一来源数据判断，异常声音识别精度较低。

技术实现思路

[0004]本申请实施例提供了一种声音识别方法、装置、设备及存储介质，可以提高声音识别精度。该技术方案如下：
[0005]第一方面，提供了一种声音识别方法，方法包括：获取第一传感器采集目标对象的第一声音特征信息；将第一声音特征信息输入概率密度估计模型，输出第一声音特征信息存在异常声音的第一概率值；在第一概率值符合预设概率条件的情况下，获取第二传感器采集目标对象的第二声音特征信息；根据第一声音特征信息和第二声音特征信息生成目标组合特征信息；将目标组合特征信息输入相关度计算模型，输出第一声音特征信息和第二声音特征信息的相关度；在相关度符合预设相关度条件的情况下，确定目标对象发出异常声音。/>[0006]本申请中，首先获取第一传感器采集目标对象的第一声音特征信息，然后计算第一声音特征信息存在异常声音的第一概率值，在第一概率值符合预设概率条件的情况下，获取与第一传感器不同的第二传感器采集目标对象的第二声音特征信息，基于第二声音特征信息结合第一声音特征信息对目标对象是否发出异常声音进行再判断，具体的，根据第一声音特征信息和第二声音特征信息生成目标组合特征信息；将目标组合特征信息输入相关度计算模型，输出第一声音特征信息和第二声音特征信息的相关度；在相关度符合预设相关度条件的情况下，确定目标对象发出异常声音，通过第一概率值和相关度两阶段的判断过程进行异常声音的识别，考虑到了单一传感器采集目标对象声音特征信息可能会存在不准确的情况，在通过第一概率值进行异常声音的初步识别后，再通过第一声音特征信息和第二声音特征信息的相关度进行是否真正存在异常声音再判断，识别异常声音的精度较高。
[0007]在一种实施例中，根据第一声音特征信息和第二声音特征信息生成目标组合特征
信息，包括：计算第一声音特征信息和第二声音特征信息之间的目标相似度特征信息；从目标相似度特征信息中、以及第一声音特征信息和第二声音特征信息中分别至少选取一项信息进行拼接，得到目标组合特征信息；或者，从目标相似度特征信息中至少选取两项信息进行拼接，得到目标组合特征信息。
[0008]在一种实施例中，在获取第一传感器采集目标对象的第一声音特征信息之前，方法还包括：获取多个传感器采集历史对象发出异常声音的多个声音特征信息；根据多个声音特征信息生成第一组合特征信息和第二组合特征信息，第一组合特征信息对应多个声音特征信息，第二组合特征信息对应扰动后的多个声音特征信息；将第一组合特征信息和第二组合特征信息作为训练样本训练相关性网络，得到相关度计算模型。
[0009]在一种实施例中，根据多个声音特征信息生成第一组合特征信息，包括：计算任意两项声音特征信息之间的第一相似度特征信息；从第一相似度特征信息中和多个声音特征信息中分别至少选取一项信息进行拼接，得到第一组合特征信息；或者，从第一相似度特征信息中至少选取两项信息进行拼接，得到第一组合特征信息。
[0010]在一种实施例中，根据多个声音特征信息生成第二组合特征信息，包括：扰动第一组合特征信息，得到第二组合特征信息。
[0011]在一种实施例中，根据多个声音特征信息生成第二组合特征信息，包括：扰动多个声音特征信息；计算任意两项扰动后的声音特征信息之间的第二相似度特征信息；从第二相似度特征信息中和扰动后的多个声音特征信息中分别至少选取一项信息进行拼接，得到第二组合特征信息；或者，从第二相似度特征信息中至少选取两项信息进行拼接，得到第二组合特征信息。
[0012]在一种实施例中，获取多个声音特征信息，包括：获取多个传感器采集历史对象的多个历史声音样本；将多个历史声音样本输入压缩网络，输出多个历史声音特征信息；将多个历史声音特征信息输入概率密度估计模型，输出多个表征历史对象发出异常声音的第二概率值；将符合预设概率条件的第二概率值对应的历史声音特征信息确定为多个声音特征信息。
[0013]在一种可能的实现方式中，根据多个声音特征信息生成第一组合特征信息，包括：计算任意两项声音特征信息之间的第一相似度特征信息；从第一相似度特征信息中和多个声音特征信息中分别至少选取一项信息进行拼接，得到第一组合特征信息；或者，从第一相似度特征信息中至少选取两项信息进行拼接，得到第一组合特征信息。
[0014]在一种可能的实现方式中，根据多个声音特征信息生成第二组合特征信息，包括：扰动第一组合特征信息，得到第二组合特征信息。
[0015]在一种可能的实现方式中，根据多个声音特征信息生成第二组合特征信息，包括：扰动多个声音特征信息；计算任意两项扰动后的声音特征信息之间的第二相似度特征信息；从第二相似度特征信息中和扰动后的多个声音特征信息中分别至少选取一项信息进行拼接，得到第二组合特征信息；或者，从第二相似度特征信息中至少选取两项信息进行拼接，得到第二组合特征信息。
[0016]在一种可能的实现方式中，获取多个传感器采集的历史对象发出异常声音的多个声音特征信息，包括：获取多个传感器采集的多个历史声音样本；将多个历史声音样本输入压缩网络，输出多个历史声音特征信息；将多个历史声音特征信息输入概率密度估计模型，
输出多个表征声音异常的概率值；将符合预设概率条件的概率值对应的历史声音特征信息确定为多个声音特征信息。
[0017]第二方面，提供了一种声音识别模型的训练方法，方法包括：获取多个传感器采集的历史对象发出异常声音的多个声音特征信息；根据多个声音特征信息生成第一组合特征信息和第二组合特征信息，第一组合特征信息对应多个声音特征信息，第二组合特征信息对应扰动后的多个声音特征信息；将第一组合特征信息和第二组合特征信息作为训练样本训练相关性网络，得到声音识别模型。
[0018]本申请中，首先获取多个传感器采集的历史对象发出异常声音的多个声音特征信息，然后根据声音特征信息生成第一组合特征信息和第二组合特征信息，再将第一组合特征信息和第二组合特征信息作为训练样本训练相关性网络，得到声音识别模型，由于声音识别模型的训练样本来源的多样化，有利于提高声音模型的识别精度。并且通过将声音特征信息生成对应声音特征信息的第一组合特征信息和对应扰动后的声音特征信息的第二组合特征信息，模型的训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音识别方法，其特征在于，所述方法包括：获取第一传感器采集目标对象的第一声音特征信息；将所述第一声音特征信息输入概率密度估计模型，输出所述第一声音特征信息存在异常声音的第一概率值；在所述第一概率值符合预设概率条件的情况下，获取第二传感器采集所述目标对象的第二声音特征信息；根据所述第一声音特征信息和所述第二声音特征信息生成目标组合特征信息；将所述目标组合特征信息输入相关度计算模型，输出所述第一声音特征信息和所述第二声音特征信息的相关度；在所述相关度符合预设相关度条件的情况下，确定所述目标对象发出异常声音。2.根据权利要求1所述的方法，其特征在于，所述根据所述第一声音特征信息和第二声音特征信息生成目标组合特征信息，包括：计算所述第一声音特征信息和第二声音特征信息之间的目标相似度特征信息；从所述目标相似度特征信息中、以及所述第一声音特征信息和第二声音特征信息中分别至少选取一项信息进行拼接，得到所述目标组合特征信息；或者，从所述目标相似度特征信息中至少选取两项信息进行拼接，得到所述目标组合特征信息。3.根据权利要求1所述的方法，其特征在于，在获取第一传感器采集目标对象的第一声音特征信息之前，所述方法还包括：获取多个传感器采集历史对象发出异常声音的多个声音特征信息；根据所述多个声音特征信息生成第一组合特征信息和第二组合特征信息，所述第一组合特征信息对应所述多个声音特征信息，所述第二组合特征信息对应扰动后的所述多个声音特征信息；将所述第一组合特征信息和第二组合特征信息作为训练样本训练相关性网络，得到所述相关度计算模型。4.根据权利要求3所述的方法，其特征在于，根据所述多个声音特征信息生成第一组合特征信息，包括：计算任意两项所述声音特征信息之间的第一相似度特征信息；从所述第一相似度特征信息中和所述多个声音特征信息中分别至少选取一项信息进行拼接，得到所述第一组合特征信息；或者，从所述第一相似度特征信息中至少选取两项信息进行拼接，得到所述第一组合特征信息。5.根据权利要求3所述的方法，其特征在于，根据所述多个声音特征信息生成第二组合特征信息，包括：扰动所述第一组合特征信息，得到所述第二组合特征信息。6.根据权利要求3所述的方法，其特征在于，根据所述多个声音特征信息生成第二组合特征信息，包括：扰动所述多个声音特征信息；计算任意两项扰动后的所述声音特征信息之间的第二相似度特征信息；
从所述第二相似度特征信息中和扰动后的所述多个声音特征信息中分别至少选取一项信息进行拼接，得到所述第二组合特征信息；或者，从所述第二相似度特征信息中至少选取两项信息进行拼接，得到所述第二组合特征信息。7.根据权利要求3
‑
6任一项所述的方法，其特征在于，所述获取多个声音特征信息，包括：获取多个传感器采集所述历史对象的多个历史声音样本；将所述多个历史声音样本输入压缩网络，输出多个历史声音特征信息；将所述多个历史声音特征信息输入所述概率密度估计模型，输出多个表征所述历史对象发出异常声音的第二概率值；将符合所述预设概率条件的所述第二概率值对应的所述历史声音特征信息确定为所述多个声音特征信息。8.一种声音识别模型的训练方法，其特征在于，所述方法包括：获取多个传感器采集的历史对象发出异常声音的多个声音特征信息；根据所述多个声音特征信息生成第一组合特征信息和第二组合特征信息，所述第一组合特征信息对应所述多个声音特征信息，所...

【专利技术属性】
技术研发人员：董勤波，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人