智能音视频采集分析装置制造方法及图纸

技术编号:13041516 阅读:52 留言:0更新日期:2016-03-23 11:58
本实用新型专利技术涉及一种智能音视频采集分析装置,为解决影片监播难题,其包括配接电源管理器的中央处理单元,所述中央处理单元连接用于采集观影现场声音的音频采集模块、用于采集屏幕图像的视频图像采集模块、数据存储模块、网络控制器。所述网络控制器通过通讯网络连接数据库服务器。所述中央处理单元连接用于捕捉观众运动情况的运动检测模块。具有能够自动采集分析放映时音视频,显著提高影片播放内容管理和票房统计效率的优点。

【技术实现步骤摘要】

本技术涉及一种音视频采集装置,特别是涉及一种智能音视频采集分析装置
技术介绍
电影越来越受大众的喜爱,电影播放数理的激增,电影内容的监管,票房的统计,都存在很多问题,目前的管理主要依靠人力,人工的管理方法受到了很大的制约,统计过程由于各种原因会有误差,所以使用人工智能、机器识别的方法在观影场景中急需解决。
技术实现思路
本技术目的在于克服现有技术的上述缺陷,提供一种能够自动采集分析放映时音视频的智能音视频采集分析装置。为实现上述目的,本技术智能音视频采集分析装置包括配接电源管理器的中央处理单元,所述中央处理单元连接用于采集观影现场声音的音频采集模块、用于采集屏幕图像的视频图像采集模块、数据存储模块、网络控制器。具有能够自动采集分析放映时音视频,显著提高影片播放内容管理和票房统计效率及精度的优点。作为优化,所述网络控制器通过通讯网络连接数据库服务器。作为优化,所述中央处理单元连接用于捕捉观众运动情况的运动检测模块。作为优化,所述运动检测模块配用观众区图像运动检测器。作为优化,所述中央处理单元配接有用于工作环境空气质量检测的空气质量检测丰旲块。作为优化,所述空气质量检测模块配置有空气温度传感器、空气湿度传感器。作为优化,所述空气质量检测模块配置有空气中二氧化碳浓度检测传感器。 作为优化,所述电源管理器配置有锂电池蓄电电源。作为优化,所述音频采集模块配置有音频传感器。作为优化,所述视频图像采集模块配置有屏幕图像摄像机。该装置是为了代替人工工作而进行的一次创新。基于音频分析的原理和数字信号处理的理论,使用频谱分析的方法对声音进行处理;而图像的分析是在机器视觉识别的基础上,把图像的对比相似度做为视频内容的核心分析方法;将图像图形音频分析功能实现嵌入式设备上,对电影放映过程中的放映内容的跟踪分析。实现人工智能在电影行业的应用。功能组成的补充说明:音频和视频采集做为系统的主要功能,辅助功能包括运动检测,装置工作环境的空气质量检测,以及系统电源管理功能,采集数据的本地存储及网络传输设备具有以下的智能分析能力,根据采集到的声音信息通过智能的分析方法,确定该声音所具有的某些属性,这些属性包括声音传达出的语意,附加的情绪,以及其他一些特征。另一个重要的分析能力是确定环境所发出的声音有声音样本的相似程度,即确定两个声音的物理属性的相似特征。图像的特征智能分析,图像的分析主要是对采集到的图像进行信息筛选,模式识另O,关键信息的提取,信息筛选是在拍摄场景中提取物体的特征,包括轮廓,二维信息。模式是在场景下整幅图所呈现的一种属性,音视频采集转置包括以下部分,音频传感器,图像传感器,运动检测器,空气质量传感器,处理器,数据存储,锂电池及电源管理,网络控制器。其使用一种嵌入式系统,设备具有声音采集,视频采集能力,收集到的声音、图像以压缩的文件格式保存于设备中,设备并具有网络通信能力,连接到数据库服务器,在必要情况下可以将源声音,源图像保存到服务器,视频采集的主要对象是投射屏幕上显示的内容,这样的图像采集方式使得到的图像与原始视频图像存在信息的失真,图像采集过程,采集装置安装于屏幕上边缘外,屏幕的成像出现梯形形变,由此带来的失真,使用软件的图形修正算法实现图像还原。解决的技术问题还有:I)图像的二次采集造成的失真:在实际的电影放映中,影像的场景切换频繁,屏幕的光线变换比较剧烈,由此对摄像头的要求较高,理论用于图像分析的图像,分辨率越高越好,但是高分辨率的图片采集过程会对系统造成沉重的负担,实际上测试1280x1080分辨率的图片,可以很好的还原图像细节信息,在满足系统的对图像分辨率的要求情况,选用200万像素的COMS图像传感器。2)图像米样速率:数字影院放映的影片只能有两种帧率,24fps和48fps。在观影效果上,帧率越高,看到的画面越细致,但对于机器识别来说,同场景下相邻两帧的所呈现的有效信息差别不大。高帧率采样意义不大。所以在采样速率上采用了可变的采样速率,以适应图像分析的需求,同时降低系统的资源开销。3)图像相似度比对算法和音频比对相结合解决翻拍图像识别困难的问题:用到了图像匹配技术和图像数字提取技术。在实现图像匹配时,使用了 SIFT特征匹配算法。SIFT特征匹配算法主要有以下四步,(I)首先建立图像的DOG金字塔,在DOG尺度空间的26个邻域中本层检测极值,一个点如果在DOG尺度空间本层以及上下两层的26个邻域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点。(2)利用特征点邻域像素的梯度方向分布特性,为每个关键点指定方向参数,使算子具备旋转不变性。(3)生成SIFT特征向量,将坐标轴旋转到特征点方向,以保证旋转不变性。(4)图像匹配,当两幅图的SIFT特征向量生成后,就采用欧式距离作为两幅图中关键点的相似性度量,当次距离小于某个阈值时就认为两个点已经匹配上。单一的图像匹配存在误差,所以系统辅助采用语音匹配技术,用二阶Haar小波变换压缩原始音频,以音频帧的方式提取出能代表音频主要信息特征的质心、均方根和前12个Mel倒谱系数,并分别计算这3类参数的欧式距离,比较欧式距离的值与阈值ε之间的关系完成首频间的比对任务。通过实际环境的测试,图像和音频结合的判识方法有效的解决了现实的问题。采用上述技术方案后,本技术智能音视频采集分析装置具有能够自动采集分析放映时音视频,显著提高影片播放内容管理和票房统计效率及精度的优点。【附图说明】图1是本技术智能音视频采集分析装置的电路原理图。【具体实施方式】如图所示,本技术智能音视频采集分析装置包括配接电源管理器8的中央处理单元1,所述中央处理单元1当前第1页1 2 本文档来自技高网...

【技术保护点】
一种智能音视频采集分析装置,其特征在于包括配接电源管理器的中央处理单元,所述中央处理单元连接用于采集观影现场声音的音频采集模块、用于采集屏幕图像的视频图像采集模块、数据存储模块、网络控制器;所述视频图像采集模块配置有屏幕图像摄像机。

【技术特征摘要】

【专利技术属性】
技术研发人员:逢泽沐风
申请(专利权)人:北京丰源星际传媒科技有限公司
类型:新型
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1