监控调度方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21803676 阅读:23 留言:0更新日期:2019-08-07 11:42
本发明专利技术公开了一种基于语音识别的监控调度方法、装置、计算机设备及存储介质,用户通过语音交互的方式发出语音信号,调度系统接收用户发出的语音信号,并利用声音模型对语音信号进行语音识别,得到对应的语言文本,然后利用语义模型对语言文本进行解析,得到包含有目标摄像头地址的调度命令,从视频数据库中调取对应的视频数据。本发明专利技术无需用户进行鼠标键盘操作,即可实现监控视频的调度,解决了执勤执法民警在执法实践过程中处于远离视频调度终端、移动办公、驾驶车辆等场景时,无法有效使用鼠标键盘进行视频调度操作,而无法调度监控视频的问题。

Monitoring and dispatching methods, devices, computer equipment and storage media

【技术实现步骤摘要】
监控调度方法、装置、计算机设备及存储介质
本专利技术涉及监控
,具体涉及一种基于语音识别的监控调度方法、装置、计算机设备及存储介质。
技术介绍
随着城市化的进程,城市规模不断膨胀,城市人口越来越多,人口的流动性也不断增大,给城市交通、治安监管带来很大的压力。为保障城市安全,可以对一些治安重点监控区域,如居民小区、城区路面、商业中心、娱乐场所、车站广场、重点单位、卡口等场所实施远程实时监控,及时了解现场的车流、人流及异常情况,并进行远程录像备份。接入的监控摄像头的指数级增长,但是在数千乃至数万个监控中选中需要的摄像头,如何准确通过摄像头名称进行快速查找越来越成为一件异常困难的任务,对于许多非专业人员、特别是不懂英语或不熟悉汉语拼音的公安干警而言仍然是人机交互的一个重要的障碍,进而影响到信息化系统的进一步普及,基层警务工作,日益呈现移动性强、突发性强、任务紧迫性强等特点,同时一旦一线执勤执法民警在执法实践过程中处于远离视频调度终端、移动办公、驾驶车辆等场景时,无法有效使用鼠标键盘进行视频调度操作。
技术实现思路
本专利技术要解决现有技术中由于无法通过鼠标键盘等操作导致无法进行监控视频调度的问题,从而提供一种基于语音识别的监控调度方法、装置、计算机设备及存储介质。本专利技术实施例的一方面,提供了一种基于语音识别的监控调度方法,包括:接收用户发出的用于调度监控视频的语音信号;将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本;将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,所述调度指令包括待调度的目标摄像头地址;基于所述调度指令从视频数据库中调取所述目标摄像头的视频数据。可选地,当用户选择模糊搜索模式时,所述语音信号包括用户发出的多个连续的语音命令,将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本,包括:利用所述声音模型对所述多个连续的语音命令进行语音识别,得到多个语言文本;将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,包括:利用所述语义模型对所述多个语言文本进行语义解析,得到包括多个候选监控摄像头的地址列表。可选地,还包括:对所述多个候选监控摄像头的地址列表进行显示;接收用户输入的搜索命令;从所述地址列表中搜索满足所述搜索命令的摄像头地址,作为所述目标摄像头的地址;从视频数据库中调取搜索到的地址对应的视频数据。可选地,所述搜索命令包括:输入关键词的搜索命令和/或语音命令。可选地,在将所述语音信号输入至预先训练得到的声音模型进行语音识别之前,还包括:获取用于进行语音识别训练的样本集,该样本集包括以下内容的语音数据:所有监控场景的建筑名称、所有监控场景的地址名称、时间、操作内容;利用所述样本集对初始声音模型进行训练,得到所述声音模型。可选地,在对所述初始模型训练过程中,将调度指挥中心的声场环境建模放入编码过程,将调度指挥所用的语句结构和语句内容嵌入语音识别的解码过程。可选地,在将所述语言文本输入至预先训练得到的语义模型进行语义解析之前,还包括:获取用于进行语义解析训练的样本集;利用所述样本集对初始语义模型进行训练,得到所述语义模型。本专利技术实施例的另一方面,还提供了一种基于语音识别的监控调度装置,包括:接收模块,用于接收用户发出的用于调度监控视频的语音信号;语音识别模块,用于将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本;语义解析模块,用于将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,所述调度指令包括待调度的目标摄像头地址;调度模块,用于基于所述调度指令从视频数据库中调取所述目标摄像头的视频数据。可选地,当用户选择模糊搜索模式时,所述语音信号包括用户发出的多个连续的语音命令,所述语音识别模块具体用于利用所述声音模型对所述多个连续的语音命令进行语音识别,得到多个语言文本;所述语义解析模块具体用于利用所述语义模型对所述多个语言文本进行语义解析,得到包括多个候选监控摄像头的地址列表。可选地,还包括:显示模块,用于对所述多个候选监控摄像头的地址列表进行显示;接收用户输入的搜索命令;搜索模块,用于从所述地址列表中搜索满足所述搜索命令的摄像头地址,作为所述目标摄像头的地址;调度模块还用于从视频数据库中调取搜索到的地址对应的视频数据。可选地,所述搜索命令包括:输入关键词的搜索命令和/或语音命令。可选地,还包括:第一获取模块,用于获取用于进行语音识别训练的样本集,该样本集包括以下内容的语音数据:所有监控场景的建筑名称、所有监控场景的地址名称、时间、操作内容;第一训练模块,用于利用所述样本集对初始声音模型进行训练,得到所述声音模型。可选地,在对所述初始模型训练过程中,将调度指挥中心的声场环境建模放入编码过程,将调度指挥所用的语句结构和语句内容嵌入语音识别的解码过程。可选地,还包括:第二获取模块,用于获取用于进行语义解析训练的样本集;第二训练模块,用于利用所述样本集对初始语义模型进行训练,得到所述语义模型。本专利技术实施例的另一方面,还提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。根据本专利技术实施例,用户通过语音交互的方式发出语音信号,调度系统接收用户发出的语音信号,并利用声音模型对语音信号进行语音识别,得到对应的语言文本,然后利用语义模型对语言文本进行解析,得到包含有目标摄像头地址的调度命令,从视频数据库中调取对应的视频数据。本专利技术无需用户进行鼠标键盘操作,即可实现监控视频的调度,解决了执勤执法民警在执法实践过程中处于远离视频调度终端、移动办公、驾驶车辆等场景时,无法有效使用鼠标键盘进行视频调度操作,而无法调度监控视频的问题。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中基于语音识别的监控调度方法的流程图;图2为本专利技术实施例中调度系统的逻辑关系图;图3为本专利技术实施例的地址树示意图;图4为本专利技术实施例的匹配算法架构图;图5为本专利技术实施例的分类算法架构图;图6为本专利技术实施例的生成算法架构图;图7为本专利技术实施例中基于语音识别的监控调度装置的示意图;图8为本专利技术实施例计算机设备的硬件结构示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本专利技术不同实施方本文档来自技高网...

【技术保护点】
1.一种基于语音识别的监控调度方法,其特征在于,包括:接收用户发出的用于调度监控视频的语音信号;将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本;将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,所述调度指令包括待调度的目标摄像头地址;基于所述调度指令从视频数据库中调取所述目标摄像头的视频数据。

【技术特征摘要】
1.一种基于语音识别的监控调度方法,其特征在于,包括:接收用户发出的用于调度监控视频的语音信号;将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本;将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,所述调度指令包括待调度的目标摄像头地址;基于所述调度指令从视频数据库中调取所述目标摄像头的视频数据。2.根据权利要求1所述的监控调度方法,其特征在于,当用户选择模糊搜索模式时,所述语音信号包括用户发出的多个连续的语音命令,将所述语音信号输入至预先训练得到的声音模型进行语音识别,得到识别出的语言文本,包括:利用所述声音模型对所述多个连续的语音命令进行语音识别,得到多个语言文本;将所述语言文本输入至预先训练得到的语义模型进行语义解析,得到用于调度监控视频的调度指令,包括:利用所述语义模型对所述多个语言文本进行语义解析,得到包括多个候选监控摄像头的地址列表。3.根据权利要求2所述的监控调度方法,其特征在于,还包括:对所述多个候选监控摄像头的地址列表进行显示;接收用户输入的搜索命令;从所述地址列表中搜索满足所述搜索命令的摄像头地址,作为所述目标摄像头的地址;从视频数据库中调取搜索到的地址对应的视频数据。4.根据权利要求3所述的监控调度方法,其特征在于,所述搜索命令包括:输入关键词的搜索命令和/或语音命令。5.根据权利要求1-4任一项所述的监控调度方法,其特征在于,在将所述语音信号输入至预先训练得到的声音模型进行语音识别之前,还包括:获取...

【专利技术属性】
技术研发人员:吕正东
申请(专利权)人:深度好奇北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1