视频检索方法和装置制造方法及图纸

技术编号:6531908 阅读:228 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种视频检索方法和装置,属于智能监控领域。方法包括如下步骤:步骤1:对输入的监控视频进行视频文字提取;步骤2:根据提取到的文本信息建立索引单元,并加入到索引表中;步骤3:根据索引表查找对应的视频。本发明专利技术可以自动定位、二值化并识别出监控视频中的文字信息,并根据识别的结果建立基于监控视频中文字信息的索引表,从而在索引表中搜索输入的查询关键字对监控视频进行查询。本发明专利技术可自动提取出监控视频中的文字信息,从而获得比运动信息以及纹理信息更丰富、更有用的语义信息。与传统的人工查询相比,本发明专利技术可通过查询系统自动查询相关视频,方便了用户进行基于内容的监控视频自动检索与查询,极大地节省了人力。

【技术实现步骤摘要】

本专利技术属于智能监控领域,涉及一种视频检索方法和装置
技术介绍
视频监控系统以其直观方便、内容详实而被广泛应用于生产管理、安防等场合,视频监控系统的一般过程是在一些重要场所安放一个或若干个摄像机拍摄监控现场,然后将视频信号通过一定的传输网络(线缆、无线、光纤或以太网),传到指定的监控中心,再通过存储设备,将媒体存储到存储介质上,同时还可以根据不同需要和途径在现场安装其它的探测装置作为监控系统的辅助设备。视频监控系统目前已被广泛地应用到了各个领域,如交通、医疗、社会安全等。通过视频监控系统,我们不仅能对监控区域进行实时监测,在重大事故发生后,我们还可以通过查询监控录像,还原事故现场。但是由于视频监控系统一般为全天候M小时监控,保存下来的监控视频录像数据量巨大,往往需要兆级以上的硬盘存储器来存储,这为监控视频的检索带来了极大的不便。目前监控视频的检索与查询主要有两种方法,一种是人工查找,即由专业监控人员在硬盘服务器上查找,当监控数据达到一定的量级时,人工检索工作是十分耗时和繁琐的;第二种是基于内容的检索方法,基于内容的检索方法主要是通过对监控视频进行智能分析,获取到一些有用的语义信息,然后根据这些分析结果来进行查询。用于视频检索中较为常用的智能视频分析方法有运动检测、纹理分类等。然而针对监控视频而言,通过这种视频分析方法所获取的语义信息过于简单,难以提供实用、有效的检索查询信息。视频光学字符识别是一种旨在将视频或图像中的文字信息提取并识别出来的关键技术。随着数字视频在各个领域的应用越来越广泛,视频信息的提取、检索、查询技术越来越重要,Video OCR研究也逐渐成为热点。监控视频中的文字信息,如监控地点、监控时间、报警信息等是一种非常有用的语义信息,可用于监控视频的检索与查询。
技术实现思路
本专利技术所要解决的技术问题是提供一种视频检索方法和装置,本方法可以自动定位、二值化并识别出监控视频中的文字信息,并根据识别的结果建立基于监控视频中文字信息的索引表,通过在监控信息索引表中搜索输入的查询关键字对监控视频进行查询。本方法自动提取监控视频中的文字信息,包括监控时间、监控地点、车牌号码、报警信息等,方便了用户进行基于内容的监控视频自动检索与查询。视频检索方法,包括如下步骤步骤1 对输入的监控视频进行视频文字提取;步骤2 根据提取到的文本信息建立索引单元,并加入到索引表中;步骤3 根据索引表查找对应的视频。 所述步骤1包括如下步骤步骤a 对输入的视频进行文本定位;步骤b 对文本定位的结果进行二值化;步骤c 对二值化后的字符进行切分;步骤d 对切分后的字符进行识别。所述步骤a中,将输入的视频经边缘检测后采用滑动窗口扫描得到文本区域,将文本区域合并后得到文本定位结果。所述步骤a中的边缘检测采用索贝尔算子提取视频图像的边缘,得到边缘图像。所述步骤a的滑动窗口扫描中,采用固定窗口逐行对边缘图像扫描,当滑动窗口的平均强度大于既定阈值,且边缘图的滑动窗口内的HOG特征F使得决策函数满足Des(F) = W · F+b 彡 0则滑动窗口内包含文本。式中,Des( ·)为决策函数,W和b为决策函数的决策参数,通过SVM训练得到。所述滑动窗口的平均强度为Eavs(S)Σ 邵·,■/)ρ (οΛ _ (U)^ Area(S)其中,Eavs(S)为滑动窗口 S的平均边缘强度,E(i,j)为点(i,j)的边缘强度, Area⑶为滑动窗口 S的面积。所述文本区域合并过程中,两相邻的含有文本的滑动窗口的共有部分的面积与两含有文本的滑动窗口面积之和的比值如大于合并阈值,则两相邻的含有文本的滑动窗口合并为一文本区域。所述步骤b中文本定位的结果进行二值化时,计算文本定位后的图像中自适应二值化阈值和自适应二值化阈值的扩展阈值,并根据自适应二值化阈值和其扩展阈值对得到的文本定位后的图像进行二值化。所述步骤c中二值化后字符进行切分时,根据二值化后图像的投影直方图计算判定切分点,将文本行中的字符进行切分,得到切分图像。所述步骤d中切分后的字符进行识别时,对多个切分图像计算识别可信度,选取识别可信度最高的结果作为最终识别出的文本信息。所述步骤d中,第i幅切分图像的识U别可信度~.、^R(1,J)其中,R(i,j)表示第i幅切分图像中的第j个字符的识别可信 M度,M为第i幅切分图像中总的字符个数。所述步骤2中,索引表含有多个索引单元。所述步骤3中,包括如下步骤(1).输入查询关键字;(2).查找索引表中含有与查询关键字对应的文本信息的索引单元;(3).由索引单元将相应视频输出。一种视频检索方法装置,包括如下模块文字提取模块,对输入的监控视频进行视频文字提取。索引模块,根据提取到的文本信息建立索引单元,并加入到索引表中。查找模块,根据索引表查找对应的视频。本专利技术一种视频检索方法和装置,与现有技术相比,其优点和效果在于1)采用视频光学字符识别技术自动识别监控视频中的文字信息,将视频中的文字信息进行自动定位;对文本行中的字符有效地切分出来,使得最后的识别信息更加可靠。2)根据视频光学字符识别的识别输出,建立监控视频文本信息与视频文件的对应关系表,即索引表,大大缩小了搜索数据量。3)通过在索引表中搜索与查询关键字相匹配的索引单元,再由索引单元输出监控视频,从而准确查询到待查找的监控视频。与以往基于内容的检索方法相比,本专利技术可自动提取出监控视频中的文字信息, 从而获得比运动信息以及纹理信息更丰富、更有用的语义信息。与传统的人工查询相比,本方法可通过查询系统自动查询相关视频,极大地节省了人力。附图说明图1为本专利技术视频检索方法的流程图;图2为本专利技术视频检索方法的对输入的监控视频进行视频文字提取的流程图;图3为本专利技术视频检索方法的边缘检测过程的示意图;图4为本专利技术视频检索方法的滑动窗口扫描示意图;图fe为本专利技术视频检索方法的实施例的输入图像;图恥为本专利技术视频检索方法的实施例的输入图像的边缘提取的结果图;图5c为本专利技术视频检索方法的实施例中滑动窗口扫描后得到的文本区域图;图5d为本专利技术视频检索方法的实施例中文本合并后得到的定位结果图;图5d为本专利技术视频检索方法的实施例中文本合并后得到的定位结果图;图6a为本专利技术视频检索方法的实施例中经步骤1对输入的视频进行文本定位后得到的文本图像;图6b为本专利技术视频检索方法的对图6a采用阈值Ttl 二值化的结果图;图6c为本专利技术视频检索方法的对图6a采用阈值T1 二值化的结果图;图6d为本专利技术视频检索方法的对图6a采用阈值T2 二值化的结果图;图7a为本专利技术视频检索方法的图6b对应的列投影直方图和切分结果图;图7b为本专利技术视频检索方法的图6c对应的列投影直方图和切分结果图;图7c为本专利技术视频检索方法的图6d对应的列投影直方图和切分结果图;图8为本专利技术视频检索方法的图7a所对应的识别结果;图9为本专利技术视频检索方法的索引单元的结构图;图10为本专利技术视频检索方法的索引表的结构图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术一种视频检索方法,如图1所示,包括如下步骤步骤1 对输入的监控视频进行视频文字提取。如图2所示,步骤a 对输入的视频进行文本定位。对监本文档来自技高网
...

【技术保护点】
1.一种视频检索方法,其特征在于,包括如下步骤:步骤1:对输入的监控视频进行视频文字提取;步骤2:根据提取到的文本信息建立索引单元,并加入到索引表中;步骤3:根据索引表查找对应的视频。

【技术特征摘要】
1.一种视频检索方法,其特征在于,包括如下步骤 步骤1 对输入的监控视频进行视频文字提取;步骤2 根据提取到的文本信息建立索引单元,并加入到索引表中; 步骤3 根据索引表查找对应的视频。2.根据权利要求1所述的方法,其特征在于所述步骤1包括如下步骤 步骤a 对输入的视频进行文本定位;步骤b 对文本定位的结果进行二值化; 步骤c 对二值化后的字符进行切分; 步骤d 对切分后的字符进行识别。3.根据权利要求2所述的方法,其特征在于所述步骤a中,将输入的视频经边缘检测后采用滑动窗口扫描得到文本区域,将文本区域合并后得到文本定位结果。4.根据权利要求3所述的方法,其特征在于所述边缘检测采用索贝尔算子提取视频图像的边缘,得到边缘图像。5.根据权利要求3所述的方法,其特征在于所述滑动窗口扫描中,采用固定窗口逐行对边缘图像扫描,当滑动窗口的平均强度大于既定阈值,且边缘图的滑动窗口内的HOG特征F使得决策函数满足Des (F) = W · F+b 彡 0 则滑动窗口内包含文本,式中,6.根据权利要求5所述的方法,其特征在于所述滑动窗口的平均强度为Eavs(S)其中,Eavs(S)为滑动窗口 S的平均边缘强度,E(i,j)为点(i,j)的边缘强度,Area(S) 为滑动窗口 S的面积。7.根据权利要求3所述的方法,其特征在于所述文本区域合并过程中,两相邻的含有文本的滑动窗口的共有部分的面积...

【专利技术属性】
技术研发人员:王修飞黄磊刘昌平
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1