基于动态声纹特征匹配的音频分析方法、装置及设备制造方法及图纸

技术编号：41743123 阅读：36 留言：0更新日期：2024-06-19 13:03

本发明专利技术涉及室内监控技术领域，解决了现有技术中在室内监控中对特定个体识别效率低、适应性差的问题，提供了一种基于动态声纹特征匹配的音频分析方法、装置及设备。该方法包括：获取室内监控场景下第一音频数据的实时声纹特征信息；将所述实时声纹特征信息和预设的标准声纹特征信息进行声纹匹配，若所述匹配结果为成功，则将所述第一音频数据作为目标音频数据提取出来；若所述匹配结果为失败，则将第二音频数据与下一时间间隔的第三音频数据进行组合，得出新的第一音频数据，第二音频数据与第三音频数据的时长之和等于第一音频数据的时长。本发明专利技术通过动态声纹匹配，提高了室内监控的安全性、效率和灵活性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及室内监控，尤其涉及一种基于动态声纹特征匹配的音频分析方法、装置及设备。

技术介绍

1、在现有室内监控技术中，对特定个体的识别往往依赖于视频图像分析，这不仅对计算资源的要求较高，而且在光线不足或遮挡情况下容易导致识别效率低下。此外，这种依赖于视觉的监控方式在处理大量数据时适应性差，无法有效区分背景噪音与目标声音，进而影响识别准确性。更严重的是，全时段的视频监控对个人隐私构成了较大威胁，尤其是在不涉及安全威胁的日常场景中，这种监控方式容易引起公众对隐私侵犯的担忧和反感。因此，现有技术在效率、适应性和隐私保护方面面临着显著挑战。

2、现有中国专利cn114302174a提供一种视频剪辑方法、装置、计算设备及存储介质，所述方法包括：获取具有“笑声”和/或“掌声”内容的音频数据，并提取出该将“笑声”和/或“掌声”的声纹特征，然后，计算设备可以将声纹特征与原始视频中的音频数据对应的声纹特征进行逐段比对，并将声纹特征一致的音频数据位置，确定为关键位置，以此确定出原始视频中的多个关键位置，计算所述原始视频中相邻的第一帧图像与第...

【技术保护点】

1.一种基于动态声纹特征匹配的音频分析方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于动态声纹特征匹配的音频分析方法，其特征在于，所述获取室内监控场景下第一音频数据的实时声纹特征信息包括：

3.根据权利要求2所述的基于动态声纹特征匹配的音频分析方法，其特征在于，所述对所述第一音频数据进行声纹提取，得出实时声纹特征信息包括：

4.根据权利要求1所述的基于动态声纹特征匹配的音频分析方法，其特征在于，所述将所述实时声纹特征信息和预设的标准声纹特征信息进行声纹匹配包括：

5.根据权利要求1所述的基于动态声纹特征匹配的音频分析方法，其特...

【技术特征摘要】

1.一种基于动态声纹特征匹配的音频分析方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于动态声纹特征匹配的音频分析方法，其特征在于，所述获取室内监控场景下第一音频数据的实时声纹特征信息包括：

3.根据权利要求2所述的基于动态声纹特征匹配的音频分析方法，其特征在于，所述对所述第一音频数据进行声纹提取，得出实时声纹特征信息包括：

5.根据权利要求1所述的基于动态声纹特征匹配的音频分析方法，其特征在于，在所述若所述匹配结果为失败，则提取出所述第一音频数据中的第二音频数据，将所述第二音频数据与下一时间间隔的第三音频数据进行组合，得出新的第一音频数据，其中，第二音频数据的...

【专利技术属性】
技术研发人员：张智，陈辉，熊章，张青军，杜沛力，
申请(专利权)人：武汉星巡智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人