监控方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38710041 阅读：18 留言：0更新日期：2023-09-08 14:53

本发明专利技术公开了一种监控方法、装置、电子设备及存储介质，该方法包括：获取监控视频和监控音频，确定监控视频中的目标对象和目标对象的视频位置，并确定监控音频中的目标音频的音频类别和音频位置，基于视频位置、音频类别和音频位置确定目标对象的目标音频，根据视频位置、音频位置进行位置融合得到目标音频的目标位置；在检测到目标音频为异常音频时，基于目标对象、目标音频和目标位置进行报警提示。即本发明专利技术的技术方案，实现监控视频和监控音频的音视频融合的智能监控，使得智能监控能够从监控视频和监控音频两方面更加全面的进行场景监控，增加被监控场景的监控全面性，提高智能监控的监控效率。监控的监控效率。监控的监控效率。

全部详细技术资料下载

【技术实现步骤摘要】
监控方法、装置、电子设备及存储介质

[0001]本专利技术实施例涉及人工智能领域，尤其涉及一种监控方法、装置、电子设备及存储介质。

技术介绍

[0002]智能监控在不同行业，如交通、安保、金融场所安防等领域应用广泛。
[0003]智能监控主要是从监控视频中确定监控视频中的目标的类别、坐标和姿态，确定目标的行为是否异常。
[0004]但智能监控目前只能在目标处于监控设备的监控范围之内时的监控视频确定目标的行为是否异常，当目标不在监控设备的监控范围内时，智能监控无法对目标进行有效、全面的监控。

技术实现思路

[0005]本专利技术实施例提供一种监控方法、装置、电子设备及存储介质，可以使得智能监控能够从监控视频和监控音频两方面更加全面的进行场景监控，增加被监控场景的监控全面性，提高智能监控的监控效率。。
[0006]第一方面，本专利技术实施例提供一种监控方法，所述方法包括：
[0007]获取监控视频和监控音频；
[0008]确定所述监控视频中的目标对象和所述目标对象的视频位置，并确定所述监控音频中的目标音频的音频类别和音频位置；
[0009]基于所述视频位置、所述音频类别和所述音频位置确定所述目标对象的所述目标音频；
[0010]根据所述视频位置、所述音频位置进行位置融合得到所述目标音频的目标位置；
[0011]在检测到所述目标音频为异常音频时，基于所述目标对象、所述目标音频和所述目标位置进行报警提示。
[0012]第二方面，本专利技术...

【技术保护点】

【技术特征摘要】
1.一种监控方法，其特征在于，所述方法包括：获取监控视频和监控音频；确定所述监控视频中的目标对象和所述目标对象的视频位置，并确定所述监控音频中的目标音频的音频类别和音频位置；基于所述视频位置、所述音频类别和所述音频位置确定所述目标对象的所述目标音频；根据所述视频位置、所述音频位置进行位置融合得到所述目标音频的目标位置；在检测到所述目标音频为异常音频时，基于所述目标对象、所述目标音频和所述目标位置进行报警提示。2.根据权利要求1所述的方法，其特征在于，所述确定所述监控视频中的目标对象和所述目标对象的视频位置，包括：从所述监控视频中提取多帧监控图像；生成所述多帧监控图像的目标检测框，并识别所述目标检测框中的图像特征得到所述多帧监控图像中的所述目标对象和所述目标对象的所述视频位置。3.根据权利要求2所述的方法，其特征在于，所述多帧监控图像包括第一监控图像和第二监控图像，所述目标检测框包括所述第一监控图像的第一检测框和所述第二监控图像的第二检测框，所述生成所述多帧监控图像的目标检测框，包括：生成所述第一监控图像的第一检测框，并生成所述第二监控图像的第二检测框。4.根据权利要求3所述的方法，其特征在于，所述视频位置包括所述第一检测框的第一位置和所述第二检测框的第二位置，所述目标对象包括第一对象和第二对象，所述识别所述目标检测框中的图像特征得到所述多帧监控图像中的所述目标对象和所述视频位置，包括：识别所述第一检测框中的图像特征得到所述第一检测框中的所述第一对象和所述第一对象的所述第一位置；识别所述第二检测框中的图像特征得到所述第二检测框中的所述第二对象和所述第二对象的所述第二位置；确定所述第一对象和所述第二对象的特征匹配得分；在所述特征匹配得分超过预设阈值时，将所述第一对象或者所述第二对象确定为所述目标对象，并将所述第一位置和所述第二位置确定为所述视频位置。5.根据权利要求1所述的方法，其特征在于，所述确定所述监控音频中的目标音频的音频类别和音频位置，包括：获取所述监控音频中的所述目标音频的多个麦克风采集音频；采用梅尔频率倒谱系数提取所述多个麦...

【专利技术属性】
技术研发人员：陈智林，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人