一种实现与视频中文字进行交互操作的方法及系统技术方案

技术编号:13861908 阅读:78 留言:0更新日期:2016-10-19 09:19
本发明专利技术提供一种实现与视频中文字进行交互操作的方法,包括步骤:A、预读将要播放的视频图像帧;B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容;C、在所述视频图像帧播放时,将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。对应的,还提供一种实现与视频中文字进行交互操作的系统,通过解析视频图像,识别视频图像中的文字,并将识别后的文字以透明方式叠加在视频图像上对应文字的位置,从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。

【技术实现步骤摘要】

本专利技术涉及视频交互领域,特别涉及一种实现与视频中文字进行交互操作的方法及系统
技术介绍
随着科技进步,人们已经逐渐开始习惯在互联网上进行学习和生活。近年来网络带宽飞速提高。通过视频来分享生活的点滴,已经是继文字分享和图片分享之后新的分享方式。也有很多人以在互联网上观看其他人录制的教学视频作为重要的知识获取方式。通过视频分享,可以大大降低成本,想对于书本,也更见贴近于实践,并且可以让朋友更直观的了解自己想要表达的内容。但是视频有一个弊端,人们无法与视频中的文字进行交互。如,通过视频向朋友分享一段名言,这句名言出现在视频画面中,朋友无法复制,只能重新输入,才能获取文本;又如,通过视频向学员教授一段程序,学员不能直接复制这段程序的代码,只能通过照着视频重新输入,才能获取;或者,一段广告视频,当出现购买的网页链接时,观众不能直接点击这个网页链接就跳转到购物页面。上述的原因是,所述文字出现在视频画面中,是以画面的一部分存在的,是所述视频帧画面的一部分,因此用户无法选取、复制、点击等交互操作。
技术实现思路
为了解决上述问题,本专利技术的目的在于提供一种实现与视频中文字进行交互操作的方法及系统,通过解析视频图像,识别视频图像中的文字,并将识别后的文字以透明方式叠加在视频图像上对应文字的
位置,从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。其中,实现与视频中文字进行交互操作的方法包括步骤:A、预读将要播放的视频图像帧;B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容;C、在所述视频图像帧播放时,将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。由上,通过解析视频图像,识别视频图像中的文字,并将识别后的文字以透明方式叠加在视频图像上对应文字的位置,从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。可选的,步骤B还包括:识别所述帧的图像所包含的文字所占位图的宽度和长度;步骤C还包括:将所识别的所述文字进行字号或字符宽度的调整,以填充所述帧图像中所述文字的对应宽度和长度的空间。由上,使得所识别并叠加的文字完美的覆盖原视频图像中的文字,提高用户的使用体验效果。可选的,步骤B所述识别为采用光学字符识别方法进行识别。可选的,步骤B还包括:判断所识别的文字是否具有链接特征,若是,则设置为可被点击操作的超链接格式,否则设置为可被操作的文本格式。由上,可使用户方便的通过链接查看文字,尤其方便于查看链接中可能提供的购物链接或新闻等。可选的,步骤C包括:创建一透明的叠加层;对所解析出的文字以可被操作、且透明格式添加于所述叠加层上;所述叠加层与所述帧的视频图像的时间属性设置相同,在所述视
频图像帧播放时,将对应时间属性的叠加层于所述视频图像帧上叠加播放。由上,实现使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。可选的,步骤B后还包括:对所识别的文字进行违规检查。由上,可保证用户的使用安全,规避钓鱼网站或、病毒网站或不健康内容等。可选的,步骤B后还包括:判断缓存的所识别的连续帧的图像分别包含的文字的位置和内容相同、且帧数超过设定数量时,执行步骤C,若帧数未超过设定数量时,则返回步骤A。由上,避免当文字在视频播放过程中出现时间很短,用户来不及操作的情况。本专利技术所提供的实现与视频中文字进行交互操作的系统包括:视频图像预读模块,用于预读将要播放的视频图像帧;文字解析模块,与所述视频图像预读模块连接,用于识别所述帧的图像所包含的文字的于图像中的位置和文字内容;文字叠加模块,分别与所述视频图像预读模块和文字解析模块连接,用于在所述视频图像帧播放时,将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。由上,通过解析视频图像,识别视频图像中的文字,并将识别后的文字以透明方式叠加在视频图像上对应文字的位置,从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。可选的,所述文字叠加模块包括:叠加内容添加模块,用于依据所述视频图像预读模块所将要播放的视频图像帧的高度和宽度,创建一层透明的大小与视频图像帧相同的叠加层,并覆盖在当前视频图像上;叠加内容生成模块,用于,判断所识别的文字是否具有链接特征,
若是,则设置为可被点击操作的超链接格式,否则设置为可被操作的文本格式;叠加内容更新模块,用于将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示;叠加控制模块,分别与所述叠加内容添加模块、叠加内容生成模块和叠加内容更新模块连接,用于上述三者之间的数据传输统筹。可选的,所述文字叠加模块还包括:存储模块,存储有预警数据库;所述叠加内容生成模块还用于依据预警数据库对所识别的文字进行违规检查。附图说明图1实现与视频中文字进行交互操作系统的结构示意图;图2实现与视频中文字进行交互操作方法的流程图;图3为与视频中文字进行交互的原理示意图;具体实施方式本专利技术所公开的一种实现与视频中文字进行交互操作的方法及系统,通过解析视频图像,识别视频图像中的文字,并将识别后的文字以透明方式叠加在视频图像上对应文字的位置,从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。如图1所示,实现与视频中文字进行交互的系统包括相互连接的视频图像预读模块11和文字解析模块12,以及分别与二者连接的文字叠加模块13。其中,视频图像预读模块11用于预读取视频当前帧图像的下一帧或依次读取要播放的多帧图像。以读取下一帧图像为例,其具体工作方式为:首先判断播放当前帧图像的时间,接着取下一帧图像,并将当前帧图像和下一帧图像,以及两图像出现的时间输出。不难理解,
根据设置的缓存的大小,视频图像预读模块11可以将要播放的多帧图像都进行上述预读操作,以及进行后续的步骤。文字解析模块12与所述视频图像预读模块11连接,用于对所述视频预读模块11发送过来的图像进行解析,以判断图像中是否有文字。具体判断方法可依据光学字符识别技术(OCR,Optical Character Recognition)光学字符识别)检查图像,其判断原理对图像进行扫描,然后对图像进行分析处理,获取文字及版面信息的过程。具体包括对输入图像的预处理,包括二值化,噪声去除,倾斜较正等;此后将图片中的文字进行分段、分行以及字符分割处理;最终通过特征提取已完成字符识别,进一步的,将文字依照在图片中的段落排列进行排版恢复,最后根据特定的语言上下文的关系,对识别结果进行较正。进一步的,文字解析模块12还用于记录所识别出文字的位置并输出。例如现有高清电视机的分辨率为1920x1080,文字解析模块12记录所识别出文字所占的像素的具体位置,由此可判断出所识别出的文字在整个画面中的位置,以便于文字叠加模块13进行文字叠加时,对应图像中文字位置,将文字叠加至相应的位置。文字叠加模块13分别与所述视频图像预读模块11和文字解析模块12连接,用于将所解析出的文字叠加至下一帧图像中。具体的,所述文字叠加模块13包括叠加控制模块131,以及分别与其连接的叠加内容添加模块132、叠加内容生成模块133和叠加内容更新模块13本文档来自技高网
...

【技术保护点】
一种实现与视频中文字进行交互操作的方法,其特征在于,包括步骤:A、预读将要播放的视频图像帧;B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容;C、在所述视频图像帧播放时,将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。

【技术特征摘要】
2014.11.26 CN 20141069761161.一种实现与视频中文字进行交互操作的方法,其特征在于,包括步骤:A、预读将要播放的视频图像帧;B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容;C、在所述视频图像帧播放时,将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。2.根据权利要求1所述的方法,其特征在于,步骤B还包括:识别所述帧的图像所包含的文字所占位图的宽度和长度;步骤C还包括:将所识别的所述文字进行字号或字符宽度的调整,以填充所述帧图像中所述文字的对应宽度和长度的空间。3.根据权利要求1或2所述的方法,其特征在于,步骤B所述识别为采用光学字符识别方法进行识别。4.根据权利要求1所述的方法,其特征在于,步骤B还包括:判断所识别的文字是否具有链接特征,若是,则设置为可被点击操作的超链接格式,否则设置为可被操作的文本格式。5.根据权利要求1所述的方法,其特征在于,步骤C包括:创建一透明的叠加层;对所解析出的文字以可被操作、且透明格式添加于所述叠加层上;所述叠加层与所述帧的视频图像的时间属性设置相同,在所述视频图像帧播放时,将对应时间属性的叠加层于所述视频图像帧上叠加播放。6.根据权利要求1所述的方法,其特征在于,步骤B后还包括:对所识别的文字进行违规检查。7.根据权利要求1所述的方法,其特征在于,步骤B后还包括:...

【专利技术属性】
技术研发人员:王邦军吴安华
申请(专利权)人:中科创达软件股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1