当前位置: 首页 > 专利查询>龚麟专利>正文

一种音视频识别系统技术方案

技术编号:19067839 阅读:18 留言:0更新日期:2018-09-29 14:52
本发明专利技术公开了一种音视频识别系统,该系统包括:该音视频识别系统包括:视频采集设备、视频内容处理和训练设备和识别结果呈现设备;视频内容处理和训练设备,用于将接收的视频采集设备发送的当前时刻的音视频文件进行协议转换,以及将转换后的音视频文件进行切片,并识别切片后的当前时刻的音视频文件,以及将识别结果发送至识别结果呈现设备进行显示。

【技术实现步骤摘要】
一种音视频识别系统
本专利技术涉及计算机视觉
,具体涉及一种音视频识别系统。
技术介绍
网络摄像机被广泛的运用这个各种场合,比如社区,机场,车站,以及一些特殊的场景比如监狱系统,银行安保等等。有效的,充分的,精确的理解这些摄像机捕获的视频数据,能为安保人员(安保系统)提供强有力的决策信息。传统上,对这些视频数据的分析主要采用人工浏览的方法进行。受人类生理状况的影响,此方法效率底下,并且效果差强人意。并且随着人们安防意识的提升,各式各样的摄像头广泛的分布在环境的各个角落,时时刻刻都不停地生产出一些蕴涵了有用信息的数据。我们急切需要一种全新的技术手段来对这些数据进行实时的分析,并对结果做出一些应对措施(比如,触发报警系统)。
技术实现思路
本专利技术的目的在于提供一种音视频识别系统,用以解决现有技术中存在的问题。为实现上述目的,本专利技术的技术方案为一种音视频识别系统,其特征在于,系统包括:视频采集设备、视频内容处理和训练设备和识别结果呈现设备;视频内容处理和训练设备,用于将接收的视频采集设备发送的当前时刻的音视频文件进行协议转换,以及将转换后的音视频文件进行切片,并识别切片后的当前时刻的音视频文件,以及将识别结果发送至识别结果呈现设备进行显示。可选的,视频采集设备,包括:摄像头;摄像头,通过RTMP协议将当前时刻的音视频文件推送到视频内容处理和训练设备。可选的,视频内容处理和训练设备,包括:GPU服务器集群设备,GPU服务器集群设备与视频采集设备和识别结果呈现设备连接;GPU服务器集群设备,包括:接收模块、转换模块、切片模块、读取模块、识别模块和输出模块;其中,接收模块,用于接收当前时刻的音视频文件;转换模块,用于将RTMP协议转换为HLS协议;切片模块,用于对当前时刻的音视频文件进行切片,生成TS文件,并将TS文件存储至磁盘;读取模块,用于读取HLS协议中的M3U8索引文件,以及M3U8索引文件中的TS的视频文件名,并将TS的视频文件名对应的TS文件加入作业队列;识别模块,用于识别TS的视频文件名对应的TS文件,生成识别结果;输出模块,用于将识别结果输出至识别结果呈现设备。可选的,GPU服务器集群设备,还包括:存储模块;存储模块,用于将M3U8索引文件和TS文件存储至内存。可选的,GPU服务器集群设备,还包括:预测模块;预测模块,用于将当前时刻的音视频文件与历史音视频文件进行对比,得到下一时刻的预测结果;其中,历史音视频文件为当前时刻之前的音视频文件;输出模块,还用于将测试结果和预测结果传输至识别结果呈现设备;其中,测试结果为当前时刻的音视频文件输出的结果。可选的,GPU服务器集群设备,还包括:自动容错模块;当识别结果的精确度低于94%时,自动容错模块,用于将当前时刻的音视频文件传输至切片模块。可选的,GPU服务器集群设备,还包括:训练模块;训练模块,用于读取队列中的作业,并根据作业对应的切片后的当前时刻的音视频文件训练模型进行训练;为实现上述目的,本专利技术的技术方案为一种音视频识别系统,该音视频识别系统,包括:视频采集和处理设备、视频内容训练设备和识别结果呈现设备;其中,视频采集和处理设备,用于采集当前时刻的音视频文件,以及将当前时刻的音视频文件进行协议转换,并将转换后的实时视频文件进行切片,以及识别切片后的当前时刻的音视频文件,并将识别结果经由视频内容训练设备发送至识别结果呈现设备进行显示。可选的,视频采集和处理设备,包括:摄像头、转换模块、切片模块、读取模块、存储模块、读取模块、识别模块和输出模块;其中,摄像头,用于采集当前时刻的音视频文件;转换模块,用于将RTMP协议转换为HLS协议;切片模块,用于对当前时刻的音视频文件进行切片,以及生成TS文件,并将TS文件存储至硬盘;生成模块,用于生成HLS协议中的M3U8索引文件;存储模块,用于将M3U8索引文件和TS文件存储至内存;读取模块,用于读取M3U8索引文件,以及M3U8索引文件中的TS的视频文件名,并将TS视频文件名对应的TS文件加入作业队列;识别模块,用于识别TS视频文件名对应的TS文件,生成识别结果;输出模块,用于将识别结果传输至视频内容训练设备。可选的,视频内容训练设备,包括:GPU服务器集群设备,GPU服务器集群设备与视频采集和处理设备和识别结果呈现设备连接;GPU服务器集群设备,包括:训练模块和输出模块;训练模块,用于读取队列中的作业,并根据作业对应的切片后的当前时刻的音视频文件训练模型进行模型;输出模块,用于将训练后的训练模型更新至视频采集和处理设备中的识别模块。本专利技术具有如下优点:能提高识别的精度,有效内容识别的精度,方便人们的高效识别。附图说明图1为本专利技术实施例提供了一种音视频识别系统的结构示意图。图2为权重赋值示意图。图3为本专利技术实施例提供了另一种音视频识别系统的结构示意图。具体实施方式以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。实施例1图1为本专利技术实施例提供了一种音视频识别系统的结构示意图。如图1,该音视频识别系统包括:至少一个视频采集设备11、视频内容处理和训练设备12和识别结果呈现设备13。视频采集设备11,用于采集当前时刻的音视频文件,可以为实时采集;视频处理和训练内容设备12,用于将当前时刻的音视频文件进行协议转换,以及将转换后的当前时刻的音视频文件存储后进行切片,以及识别切片后的当前时刻的音视频文件,生成并发送识别结果至识别结果呈现设备13;识别结果呈现设备13,用于将识别结果进行显示。可选的,视频采集设备11,包括:至少一个摄像头(例如,1至n个,n为正整数);摄像头通过RTMP协议将采集到的当前时刻的音视频文件推送到视频内容处理和训练设备12。可选的,视频内容处理和训练设备12,包括:GPU集群服务器设备,GPU集群服务器设备与视频采集设备11及识别结果呈现设备13连接,用于将当前时刻的音视频文件进行协议转换后切片,以及识别切片后的当前时刻的音视频文件,并将处理结果送识别结果呈现设备3显示。具体地,GPU服务器集群设备,包括:接收模块、转换模块、切片模块、存储模块、读取模块、识别模块和输出模块;其中,接收模块,用于接收当前时刻的音视频文件;转换模块,用于将RTMP协议转换为HLS协议;切片模块,用于对当前时刻的音视频文件进行切片,生成TS文件,并将TS文件存储至磁盘;读取模块,用于读取HLS协议中的M3U8索引文件,以及M3U8索引文件中的TS的视频文件名,并将TS的视频文件名对应的TS文件加入作业队列;识别模块,用于识别TS的视频文件名对应的TS文件,生成识别结果;输出模块,用于将识别结果输出至识别结果呈现设备13。可选的,GPU服务器集群设备,还包括:预测模块,该预测模块,用于根据当前时刻的音视频文件与历史音视频文件对比,得到下一时刻的预测结果。需要说明的是,预测模块,则是对音视频文件中的连续行为进行预测。通过当前时刻的音视频文件与历史音视频文件进行对比,预测下一时候的音视频文件,其中,历史音视频文件是指当前时刻之前的音视频文件,预测结果测试下一时刻的可能的音视频文件。在进行预测之后,输出模块,用于将预测结果和测试结果传输至识别结果呈现设备13。其中,测试结果,是指当前时刻的音频文件下一时刻产生本文档来自技高网...

【技术保护点】
1.一种音视频识别系统,其特征在于,系统包括:视频采集设备(11)、视频内容处理和训练设备(12)和识别结果呈现设备(13);所述视频内容处理和训练设备(12),用于将接收的视频采集设备(11)发送的当前时刻的音视频文件进行协议转换,以及将转换后的音视频文件进行切片,并识别切片后的当前时刻的音视频文件,以及将识别结果发送至识别结果呈现设备(13)进行显示。

【技术特征摘要】
1.一种音视频识别系统,其特征在于,系统包括:视频采集设备(11)、视频内容处理和训练设备(12)和识别结果呈现设备(13);所述视频内容处理和训练设备(12),用于将接收的视频采集设备(11)发送的当前时刻的音视频文件进行协议转换,以及将转换后的音视频文件进行切片,并识别切片后的当前时刻的音视频文件,以及将识别结果发送至识别结果呈现设备(13)进行显示。2.根据权利要求1所述的系统,其特征在于,视频采集设备(11),包括:摄像头;摄像头,通过RTMP协议将当前时刻的音视频文件推送到视频内容处理和训练设备(12)。3.根据权利要求2所述的系统,其特征在于,视频内容处理和训练设备(12),包括:GPU服务器集群设备,GPU服务器集群设备与视频采集设备(11)和识别结果呈现设备(13)连接;GPU服务器集群设备,包括:接收模块、转换模块、切片模块、读取模块、识别模块和输出模块;其中,所述接收模块,用于接收当前时刻的音视频文件;所述转换模块,用于将RTMP协议转换为HLS协议;所述切片模块,用于对当前时刻的音视频文件进行切片,生成TS文件,并将所述TS文件存储至磁盘;所述读取模块,用于读取HLS协议中的M3U8索引文件,以及M3U8索引文件中的TS的视频文件名,并将所述TS的视频文件名对应的TS文件加入作业队列;所述识别模块,用于识别所述TS的视频文件名对应的TS文件,生成识别结果;所述输出模块,用于将识别结果输出至识别结果呈现设备(13)。4.根据权利要求3所述的系统,其特征在于,所述GPU服务器集群设备,还包括:存储模块;存储模块,用于将M3U8索引文件和TS文件存储至内存。5.根据权利要求4所述的系统,其特征在于,所述GPU服务器集群设备,还包括:预测模块;所述预测模块,用于将当前时刻的音视频文件与历史音视频文件进行对比,得到下一时刻的预测结果;其中,所述历史音视频文件为当前时刻之前的音视频文件;输出模块,还用于将测试结果和所述预测结果传输至识别结果呈现设备(13);其中,所述测试结果为当前时刻的音视频文件输出的结果。6.根据权利要求3所述的系统,其特征在于,所述GPU服务器集群设备,还包括:自动容...

【专利技术属性】
技术研发人员:龚麟
申请(专利权)人:龚麟
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1