一种监控系统、方法、装置、设备和介质制造方法及图纸

技术编号:28538793 阅读:23 留言:0更新日期:2021-05-21 09:04
本申请公开了一种监控系统、方法、装置、设备和介质,属于监控技术领域,该方法包括,对周边音频进行采集,获得周边环境的音频数据;获得对音频数据进行音频识别的音频识别结果,当音频识别结果表示存在异常时,启动摄像;根据接收的跟踪视频,向管控终端发送异常通知消息。这样,降低了异常监控时的人力成本和物力成本。

【技术实现步骤摘要】
一种监控系统、方法、装置、设备和介质
本申请涉及监控
,尤其涉及一种监控系统、方法、装置、设备和介质。
技术介绍
随着监控技术以及互联网技术的发展,监控技术的应用范围也越来越广。对于高铁以及电影院等大流量人群的场所进行监控,可以获取监控视频,以便及时解决发生的异常事件。现有技术下,管理人员通常实时查看监控视频,当出现冲突等异常时,确定发生异常的地点,进而解决异常问题。但是,这需要管理人员实时查看监控视频,会耗费大量的人力,并且需要实时进行摄像,这会耗费大量的监控资源。由此,亟待一种可以降低监控时的人力成本和物力成本的监控方案。
技术实现思路
本申请实施例提供一种监控系统、方法、装置、设备和介质,用以在进行异常监控时,降低监控时的人力成本和物力成本。一方面,提供一种监控系统,包括:服务器、多个音频采集设备以及多个图像采集设备,其中,每一音频采集设备,用于对周边音频进行采集,获得周边环境的音频数据,并通过预先训练的音频识别模型对音频数据进行音频识别得到音频识别结果,当音频识别结果表示存在异常时,向图像采集设备发送唤醒指令;或者,用于对周边音频进行采集,获得周边环境的音频数据,并向服务器发送音频数据;每一图像采集设备,用于根据接收的唤醒指令启动摄像,并将获得的跟踪视频发送至服务器;服务器,用于通过音频识别模型对接收的音频数据进行音频识别,当音频识别结果表示存在异常时,向图像采集设备发送唤醒指令,以及用于接收图像采集设备发送的跟踪视频,并向管控终端发送异常通知消息。较佳的,音频识别模型是采用深度学习对语音样本进行训练获得的。较佳的,每一音频采集设备用于:当音频识别结果表示存在异常时,根据音频数据,进行声源定位,获得定位信息;根据定位信息,确定待唤醒的图像采集设备;向待唤醒的图像采集设备,发送包含定位信息的唤醒指令。较佳的,每一图像采集设备用于:获取接收的唤醒指令中包含的定位信息;启动摄像并根据定位信息,调整摄像角度,获得跟踪视频。较佳的,服务器用于:对接收的跟踪视频进行人脸识别;分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;根据匹配成功的视频人脸图像,确定该跟踪视频中的合规的异常人员信息;根据匹配失败的视频人员图像,确定该跟踪视频中的违规的异常人员信息。较佳的,还包括多个监控设备,每一监控设备用于:实时监控,并将监控视频发送至服务器;服务器还用于:对接收的监控视频进行人脸识别,并分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配,以及根据匹配失败的视频人脸图像,确定违规人员信息。较佳的,服务器用于:将匹配失败的视频人脸图像,确定为违规人员的视频人脸图像;对接收的每一监控视频进行人脸识别,当存在监控视频包含匹配失败的视频人脸图像时,获取该监控视频对应的监控设备的位置信息和时间信息;将获取的位置信息、时间信息以及违规人员的视频人脸图像,确定为违规人员信息;将包含违规人员信息的违规提醒消息发送至管控终端。较佳的,服务器还用于分别针对接收的监控视频中的每一座位的视频人脸图像,执行以下步骤:将该座位的合规人员图像与该座位的视频人脸图像进行比对,其中,合规人员图像为根据合规人员信息集合获得的;当比对结果表示不匹配时,向管控终端发送表示座位不匹配的座位通知消息。一方面,提供一种监控方法,包括:对周边音频进行采集,获得周边环境的音频数据;通过预先训练的音频识别模型对音频数据进行音频识别,获得音频识别结果,当音频识别结果表示存在异常时启动摄像;或者,向服务器发送音频数据,并根据接收的服务器返回的唤醒指令启动摄像,其中,唤醒指令是服务器通过预先训练的音频识别模型对音频数据进行音频识别后,确定获得的音频识别结果表示存在异常时发送的;根据接收的跟踪视频,向管控终端发送异常通知消息。较佳的,音频识别模型是采用深度学习对语音样本进行训练获得的。较佳的,当音频识别结果表示存在异常时,启动摄像,包括:当音频识别结果表示存在异常时,根据音频数据,进行声源定位,获得定位信息;根据定位信息,启动摄像并调整摄像角度,获得跟踪视频。较佳的,还包括:对跟踪视频进行人脸识别;分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;根据匹配成功的视频人脸图像,确定该跟踪视频中的合规的异常人员信息;根据匹配失败的视频人员图像,确定该跟踪视频中的违规的异常人员信息。较佳的,还包括:获取实时监控的监控视频;对监控视频进行人脸识别,并分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;根据匹配失败的视频人脸图像,确定违规人员信息。较佳的,根据匹配失败的视频人脸图像,确定违规人员信息,包括:将匹配失败的视频人脸图像,确定为违规人员的视频人脸图像;对接收的每一监控视频进行人脸识别,当存在监控视频包含匹配失败的视频人脸图像时,获取该监控视频对应的位置信息和时间信息;将获取的位置信息、时间信息以及违规人员的视频人脸图像,确定为违规人员信息;将包含违规人员信息的违规提醒消息发送至管控终端。较佳的,还包括:分别针对获取的监控视频中的每一座位的视频人脸图像,将该座位的合规人员图像与该座位的视频人脸图像进行比对,当比对结果表示不匹配时,向管控终端发送表示座位不匹配的座位通知消息;其中,合规人员图像为根据合规人员信息集合获得的。一方面,提供一种监控装置,包括:采集单元,用于对周边音频进行采集,获得周边环境的音频数据;摄像单元,用于通过预先训练的音频识别模型对音频数据进行音频识别,获得音频识别结果,当音频识别结果表示存在异常时启动摄像;或者,向服务器发送音频数据,并根据接收的服务器返回的唤醒指令启动摄像,其中,唤醒指令是服务器通过预先训练的音频识别模型对音频数据进行音频识别后,确定获得的音频识别结果表示存在异常时发送的;通知单元,用于根据接收的跟踪视频,向管控终端发送异常通知消息。较佳的,音频识别模型是采用深度学习对语音样本进行训练获得的。较佳的,摄像单元用于:当音频识别结果表示存在异常时,根据音频数据,进行声源定位,获得定位信息;根据定位信息,启动摄像并调整摄像角度,获得跟踪视频。较佳的,通知单元还用于:对跟踪视频进行人脸识别;分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;根据匹配成功的视频人脸图像,确定该跟踪视频中的合规的异常人员信息;根据匹配失败的视频人员图像,确定该跟踪视频中的违规的异常人员信息。较佳本文档来自技高网...

【技术保护点】
1.一种监控系统,其特征在于,包括服务器、多个音频采集设备以及多个图像采集设备,其中,/n每一音频采集设备,用于对周边音频进行采集,获得周边环境的音频数据,并通过预先训练的音频识别模型对所述音频数据进行音频识别得到音频识别结果,当所述音频识别结果表示存在异常时,向图像采集设备发送唤醒指令;或者,用于对周边音频进行采集,获得周边环境的音频数据,并向所述服务器发送所述音频数据;/n每一图像采集设备,用于根据接收的唤醒指令启动摄像,并将获得的跟踪视频发送至所述服务器;/n所述服务器,用于通过所述音频识别模型对接收的音频数据进行音频识别,当所述音频识别结果表示存在异常时,向图像采集设备发送唤醒指令,以及用于接收图像采集设备发送的跟踪视频,并向管控终端发送异常通知消息。/n

【技术特征摘要】
1.一种监控系统,其特征在于,包括服务器、多个音频采集设备以及多个图像采集设备,其中,
每一音频采集设备,用于对周边音频进行采集,获得周边环境的音频数据,并通过预先训练的音频识别模型对所述音频数据进行音频识别得到音频识别结果,当所述音频识别结果表示存在异常时,向图像采集设备发送唤醒指令;或者,用于对周边音频进行采集,获得周边环境的音频数据,并向所述服务器发送所述音频数据;
每一图像采集设备,用于根据接收的唤醒指令启动摄像,并将获得的跟踪视频发送至所述服务器;
所述服务器,用于通过所述音频识别模型对接收的音频数据进行音频识别,当所述音频识别结果表示存在异常时,向图像采集设备发送唤醒指令,以及用于接收图像采集设备发送的跟踪视频,并向管控终端发送异常通知消息。


2.如权利要求1所述的系统,其特征在于,所述音频识别模型是采用深度学习对语音样本进行训练获得的。


3.如权利要求1所述的系统,其特征在于,每一音频采集设备用于:
当所述音频识别结果表示存在异常时,根据所述音频数据,进行声源定位,获得定位信息;
根据所述定位信息,确定待唤醒的图像采集设备;
向所述待唤醒的图像采集设备,发送包含所述定位信息的唤醒指令。


4.如权利要求3所述的系统,其特征在于,每一图像采集设备用于:
获取接收的唤醒指令中包含的定位信息;
启动摄像并根据所述定位信息,调整摄像角度,获得跟踪视频。


5.如权利要求1所述的系统,其特征在于,所述服务器用于:
对接收的跟踪视频进行人脸识别;
分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;
根据匹配成功的视频人脸图像,确定该跟踪视频中的合规的异常人员信息;
根据匹配失败的视频人员图像,确定该跟踪视频中的违规的异常人员信息。


6.如权利要求1-5任一项所述的系统,其特征在于,还包括多个监控设备,每一监控设备用于:实时监控,并将监控视频发送至所述服务器;
所述服务器还用于:对接收的监控视频进行人脸识别,并分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配,以及根据匹配失败的视频人脸图像,确定违规人员信息。


7.如权利要求6所述的系统,其特征在于,所述服务器用于:
将所述匹配失败的视频人脸图像,确定为违规人员的视频人脸图像;
对接收的每一监控视频进行人脸识别,当存在监控视频包含所述匹配失败的视频人脸图像时,获取该监控视频对应的监控设备的位置信息和时间信息;
将获取的位置信息、时间信息以及所述违规人员的视频人脸图像,确定为违规人员信息;
将包含所述违规人员信息的违规提醒消息发送至管控终端。


8.如权利要求6所述的系统,其特征在于,所述服务器还用于分别针对接收的监控视频中的每一座位的视频人脸图像,执行以下步骤:
将该座位的合规人员图像与该座位的视频人脸图像进行比对,其中,所述合规人员图像为根据所述合规人员信息集合获得的;
当比对结果表示不匹配时,向管控终端发送表示座位不匹配的座位通知消息。


9.一种监控方法,其特征在于,包括:
对周边音频进行采集,获得周边环境的音频数据;
通过预先训练的音频识别模型对所述音频数据进行音频识别,获得音频识别结果,当所述音频识别结果表示存在异常时启动摄像;或者,向服务器发送所述音频数据,并根据接收的所述服务器返回的唤醒指令启动摄像,其中,所述唤醒指令是所述服务器通过预先训练的音频识别模型对所述音频数据进行音频识别后,确定获得的音频识别结果表示存在异常时发送的;
根据接收的跟踪视频,向管控终端发送异常通知消息。


10.如权利要求9所述的方法,其特征在于,所述音频识别模型是采用深度学习对语音样本进行训练获得的。


11.如权利要求9所述的方法,其特征在于,当所述音频识别结果表示存在异常时,启动摄像,包括:
当所述音频识别结果表示存在异常时,根据所述音频数据,进行声源定位,获得定位信息;
根据所述定位信息,启动摄像并调整摄像角度,获得跟踪视频。


12.如权利要求9所述的方法,其特征在于,还包括:
对所述跟踪视频进行人脸识别;
分别将识别出的每一视频人脸图像与获取的合规人员信息集合中的各合规人员图像进行匹配;
根据匹配成功的视频人脸图像,确定该...

【专利技术属性】
技术研发人员:王浩东冯大航陈孝良常乐
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1