具有组合视频和音频识别的视频监视系统和方法技术方案

技术编号：5813476 阅读：174 留言：0更新日期：2012-04-11 18:40

新型的视频监视系统由视频和音频压缩引擎、存储装置及视频和音频识别引擎构成。视频识别引擎检测诸如人脸识别、运动检测之类的事件，而音频识别引擎检测表示可能的报警情况的话音和其它声音特征，例如诸如尖叫和叫嚷之类的恐慌声音，或者诸如枪击、爆炸之类的声音。音频和视频信号的组合识别为监视系统生成真实性更高的警报，并且减少虚假警报。另外，音频识别引擎提供引导视频摄像机对准感兴趣的方向，便于更好地捕捉感兴趣场景的信息。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
专利技术总的涉及用于提供安全性的监视系统和方法，更具体地说，涉及用于监视系统的一种新的在线(实时)视频和音频识别系统和用于监视系统的处理。
技术介绍
常规的视频监视系统一般不包括监视音频的任何功能或者措施；即，监视系统根本不包括音频输入。最多，典型的视频监视系统，比如在美国专利No.6724421和6175382中描述的视频监视系统提供视觉信息和音频信息的同时录制。在这些参考文献中描述的两种视频监视系统中，视频数据由智能监视引擎分析，并被压缩以便进行数字存储。这些引擎实现各种识别算法，比如人脸识别，运动检测，恐慌探测，刺杀(stabbing)运动检测等等。例如，当监视高层建筑的入口时，一种报警情况涉及一个人朝着另一人的突然快速运动，意味可能的抢掠、殴打或类似行动。这种情况下，智能监视引擎将识别(成功率小于100%)快速的突然运动，并在监控站产生警报。由于报警的结果，警力可被调派到被监控位置。显然，快速的突然运动可能由儿童跑向其父母/朋友产生，这种情况下，产生的警报变成虚假警报，这会浪费警力的调派。智能监视f 1擎误检测的另一后果是在真正的紧急情况下，不产生警报。例如，当现场有一个以上的人时可能出现这种情况。当发生真正的紧急情况时却不派遣警力是目前的监视系统的另图1中描述了现有技术的只有视频的监视系统。摄像机阵列10 通过视频链路11把视频信息送入视频压缩引擎12。视频信息被压缩，并通过链路16发给存储装置14以便长期保存。另外，视频信息通过相同的视频链路11被送给视频识别引擎13。视频识别引擎13执行视频识别任务，...

【技术保护点】
一种利用视频和音频识别的监视系统，包括：　生成实时视频信号的装置，所述实时视频信号包含在受监视区内获得的视频信息；　获得实时音频信号的装置，所述实时音频信号包含来自所述受监视区的音频信息；　同时接收所述视频信号和音频信号，从中确定相关的视频和音频识别信息，并使实时音频和视频信息彼此相关以确定特定事件的发生可能性的装置；和　根据所述特定事件的发生，产生报警情况的装置。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：MG基恩兹勒，V舍伊宁，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人