一种视频输入实现方法及系统技术方案

技术编号:2820380 阅读:257 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种视频输入实现方法及系统,其中,该系统包括:图像采集模块、运动轨迹提取模块、智能识别模块、联动处理模块,其中,图像采集模块,用于实时采集用户发起的连续运动图像,将转换后的连续图像数据传递给运动轨迹提取模块;运动轨迹提取模块,用于分析采集到的连续运动图像数据,采用运动轨迹提取算法提取用户运动轨迹;智能识别模块,用于通过智能识别算法识别运动轨迹提取模块中提取的用户运动轨迹,并将识别结果传送给联动处理模块;联动处理模块,用于根据收到的识别结果执行预定的联动处理操作。本发明专利技术能够在进行信息输入时,不需要接触键盘或屏幕,为固定设备或移动终端提供了一种新的信息获取源,丰富了现有的接触式输入方法。

【技术实现步骤摘要】

本专利技术涉及多媒体
,特别涉及一种视频输入实现方法及系统
技术介绍
随着计算机技术的发展,各种输入设备及输入方法应运而生,例如键盘、 鼠标、触摸屏、指紋采集器。特别对于移动终端,目前通常的输入方法为通 过键盘输入或触摸屏输入。但是,这些输入方法存在以下一些缺点在进行信息输入时,需要频繁接触键盘或屏幕,对设备有一定损耗;键盘 输入方法比较复杂;触摸屏输入方法输入区域有限,通常取决于屏幕大小;触 摸屏输入法必须要求输入者与输入设备保持接触。目前,随着流媒体技术的发展, 一些视频采集设备(例如摄像头)也成 为计算机或移动终端的常见配置,这也为固定设备或移动终端提供了一种新的 信息获取源。因此,可以通过对视频采集设备进行信息输入,但是,目前视频 釆集设备还不具备该功能。为此,需要找到一种解决办法,能够通过对视频采集设备进行信息输入, 以变革现有的接触式输入方法。
技术实现思路
本专利技术的目的在于,提供一种视频输入系统。 本专利技术的另一目的在于,提供一种视频输入实现方法。 本专利技术的视频输入系统,包括图像釆集模块、运动轨迹提取模块、智能 识别模块、联动处理模块,其中,所述图像采集模块,用于实时采集用户发起 的连续运动图像,将转换后的连续图像数据传递给运动轨迹提取模块;所述运 动轨迹提取模块,用于分析釆集到的连续运动图像数据,采用运动轨迹提取算 法提取用户运动轨迹;所述智能识别模块,用于通过智能识别算法识别所述运 动轨迹提取模块中提取的用户运动轨迹,并将识别结果传送给联动处理模块; 所述联动处理模块,用于根据收到的识别结果执行预定的联动处理操作。其中,所述图像采集模块包括手机摄像头、或者网络摄像头、或者企业监 控摄像头。其中,所述运动轨迹提取模块中,运动轨迹提取算法包括隐马尔科夫模型算法、或者神经网络算法、或者OpenCV运动模板算法。其中,所述智能识别模块采用的智能识别算法通过光学字符识别OCR技 术识别接收到的运动轨迹。其中,所述联动处理模块中预定的联动处理操作,包括显示识别的字母或 笔画操作、或者执行手势控制操作。本专利技术的视频输入实现方法,包括下列步骤步骤A:实时采集用户发起的连续运动图像,并分析采集到的连续运动图 像数据,采用运动轨迹提取算法提取用户运动轨迹;步骤B:通过智能识别算法识别所述提取的用户运动轨迹,并根据识别结 果执行预定的联动处理操作。其中,在所述步骤A中,通过手机摄像头、或者网络摄像头、或者企业 监控摄像头实时采集用户发起的连续运动图像。其中,在所述步骤A中,所述运动轨迹提取算法包括隐马尔科夫模型算 法、或者神经网络算法、或者OpenCV运动模板算法。其中,在所述步骤B中,所述智能识别算法通过光学字符识别OCR技术 识别接收到的运动轨迹。其中,在所述步骤B中,所述预定的联动处理操作,包括显示识别的字 母或笔画操作、或者执行手势控制操作。本专利技术的有益效果是依照本专利技术的视频输入实现方法及系统,能够在进 行信息输入时,不需要接触键盘或屏幕,从而实现对设备的较好维护;另夕卜, 进行信息输入时可以不局限于屏幕大小;更大地发挥视频采集设备(例如摄 像头)的作用,为固定设备或移动终端提供了一种新的信息获取源,丰富了现 有的接触式输入方法。 附图说明图1为本专利技术的视频输入系统的示意图2为本专利技术的视频输入实现方法的流程图。具体实施例方式以下,参考附图1 2详细描述本专利技术的视频输入实现方法及系统。如图l所示,本专利技术的视频输入系统,包括图像采集模块、运动轨迹提 取模块、智能识别模块、联动处理模块。其中,图像采集模块,用于实时釆集用户A发起的连续运动图像,并对 采集到的图像进行模数转换,将转换后的连续图像的RGB数据传递给运动轨 迹提取模块;其中,图像釆集模块可以为手机摄像头、网络摄像头(IP Camera, IPC)、企业监控摄像头等。运动轨迹提取模块,用于分析采集到的连续运动图像RGB数据,采用运 动侦测算法提取用户的运动轨迹,然后可以将用户的运动轨迹进行保存(例如 可以放在内存或存为文件)。其中,运动轨迹提取模块中采用的运动侦测算法可以如下定时侦测(时 间越短精确度越高)图像移动方向与X轴的夹角,则可将图像的移动轨迹抽 象为一串移动方向角度的序列。例如可以采用现有的运动轨迹提取算法有隐马 尔禾牛夫才莫型(Hidden Markov Model , HMM )和-申经网纟各(Neural Network, NN)方法,也可用现有的Intel公司的Open CV库"运动模板"(Motion Templates)实现。智能识别模块,用于通过智能识别算法识别接收到的运动轨迹,并将识别 结果(例如,字母"S")传送给联动处理模块。在本实施例中,因为目标是识别文字,所以可以用现有的光学字符识别技 术(Optical Character Recognition, OCR)进行识别。以识别26个字母为例, 需构造三个滤波器,将26个字母表示成& U=l, 2...26),任选其中l个为 &, &与每一个&做内积得到Kfc/,即将Kw按由大到小排列,通过聚4分'为三组。对于已聚类所得到的3类, 分别给予码值4 = 1 ,0, - 1 , MASK (/)是迭代到第t次时所得到的物空间滤波 函数表示。以字母"S"为例,按输出能量取阈,其标准码值(3个滤波器) 为"011"。可将待识别的轨迹图像的码值与各字母的标准码值进行比较,完成 26个字母的识别。类似地,也可以实现中文汉字笔画的识别。联动处理模块,用于对收到的识别结果做相应的联动处理,包括,触发报 警等操作,另外,对于手机终端,联动处理包括显示识别的字母或笔画等操作。对于联动处理模块,在不同的实施环境下,有不同的识别目的,可采用不 通智能识别算法。例如,目标是识别"手势",则可以采用与识别"鼠标手势,,一样的利用神经网络算法首先从轨迹上取若干采样点,记录相邻釆样点的角 度数值,这样就将轨迹转化为一系列数值序列,然后可通过映射到HopfieW 网络等经典神经网络模型与训练得到的标准手势模型库进行匹配,由Hopfield 网络判定当前的"手势"最接近哪种标准手势,从而识别不同手势。作。例如当识别结果是"手势"时,可原先设定"手势A"对应的联动为"报 警操作","手势B"对应的联动为"摄像头右转"等。如图l所示的应用场景中,用户A面对图像采集模块,例如网络摄像头, 可实时采集视频图像,用手指临空写字(如图示字母"S"),模块B实时釆 集图像,将连续图像的RGB数据传送给运动轨迹提取模块,运动轨迹提取模 块通过对这些图像的处理,提取用户A手指的运动轨迹,智能识别模块对这 些运动轨迹进行处理,提取出字母"S",联动处理模块将智能识别模块传递过 来的字母"S"显示,这样用户通过不接触输入设备实现了信息输入。如图2所示,本专利技术的视频输入实现方法,具体包括下列步骤步骤100:用户A面对图像采集设备,例如,网络摄像头(IP Camera, IPC), 发起的连续运动图像,例如用手临空写字母、划笔画或者打手势;步骤200:图像釆集设备实时采集用户连续运动图像,并对采集到的图像 进行模数转换;步骤300:分析采集到的连续运动图像RGB数据,采用运动本文档来自技高网...

【技术保护点】
一种视频输入系统,其特征在于,包括:图像采集模块、运动轨迹提取模块、智能识别模块、联动处理模块,其中, 所述图像采集模块,用于实时采集用户发起的连续运动图像,将转换后的连续图像数据传递给运动轨迹提取模块; 所述运动轨迹提取模块,用于分析采集到的连续运动图像数据,采用运动轨迹提取算法提取用户运动轨迹; 所述智能识别模块,用于通过智能识别算法识别所述运动轨迹提取模块中提取的用户运动轨迹,并将识别结果传送给联动处理模块; 所述联动处理模块,用于根据收到的识别结果执行预定的联动处理操作。

【技术特征摘要】

【专利技术属性】
技术研发人员:夏正勋
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1