一种实现与视频中文字进行交互操作的方法及系统技术方案

技术编号：13861908 阅读：78 留言：0更新日期：2016-10-19 09:19

本发明专利技术提供一种实现与视频中文字进行交互操作的方法，包括步骤：A、预读将要播放的视频图像帧；B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容；C、在所述视频图像帧播放时，将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。对应的，还提供一种实现与视频中文字进行交互操作的系统，通过解析视频图像，识别视频图像中的文字，并将识别后的文字以透明方式叠加在视频图像上对应文字的位置，从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频交互领域，特别涉及一种实现与视频中文字进行交互操作的方法及系统。
技术介绍
随着科技进步，人们已经逐渐开始习惯在互联网上进行学习和生活。近年来网络带宽飞速提高。通过视频来分享生活的点滴，已经是继文字分享和图片分享之后新的分享方式。也有很多人以在互联网上观看其他人录制的教学视频作为重要的知识获取方式。通过视频分享，可以大大降低成本，想对于书本，也更见贴近于实践，并且可以让朋友更直观的了解自己想要表达的内容。但是视频有一个弊端，人们无法与视频中的文字进行交互。如，通过视频向朋友分享一段名言，这句名言出现在视频画面中，朋友无法复制，只能重新输入，才能获取文本；又如，通过视频向学员教授一段程序，学员不能直接复制这段程序的代码，只能通过照着视频重新输入，才能获取；或者，一段广告视频，当出现购买的网页链接时，观众不能直接点击这个网页链接就跳转到购物页面。上述的原因是，所述文字出现在视频画面中，是以画面的一部分存在的，是所述视频帧画面的一部分，因此用户无法选取、复制、点击等交互操作。
技术实现思路
为了解决上述问题，本专利技术的目的在于提供一种实现与视频中文字进行交互操作的方法及系统，通过解析视频图像，识别视频图像中的文字，并将识别后的文字以透明方式叠加在视频图像上对应文字的
位置，从而使得用户通过与识别后的文字进行的交互操作实现用户与对应文字的交互操作。其中，实现与视频中文字进行交互操作的方法包括步骤：A、预读将要播放的视频图像帧；B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容；C、在所述视频图像帧播放时，将所识别出的所述文...

【技术保护点】
一种实现与视频中文字进行交互操作的方法，其特征在于，包括步骤：A、预读将要播放的视频图像帧；B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容；C、在所述视频图像帧播放时，将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。

【技术特征摘要】
2014.11.26 CN 20141069761161.一种实现与视频中文字进行交互操作的方法，其特征在于，包括步骤：A、预读将要播放的视频图像帧；B、识别所述帧的图像所包含的文字的于图像中的位置和文字内容；C、在所述视频图像帧播放时，将所识别出的所述文字以可被操作、且透明格式叠加在该帧图像中所述文字的对应位置显示。2.根据权利要求1所述的方法，其特征在于，步骤B还包括：识别所述帧的图像所包含的文字所占位图的宽度和长度；步骤C还包括：将所识别的所述文字进行字号或字符宽度的调整，以填充所述帧图像中所述文字的对应宽度和长度的空间。3.根据权利要求1或2所述的方法，其特征在于，步骤B所述识别为采用光学字符识别方法进行识别。4.根据权利要求1所述的方法，其特征在于，步骤B还包括：判断所识别的文字是否具有链接特征，若是，则设置为可被点击操作的超链接格式，否则设置为可被操作的文本格式。5.根据权利要求1所述的方法，其特征在于，步骤C包括：创建一透明的叠加层；对所解析出的文字以可被操作、且透明格式添加于所述叠加层上；所述叠加层与所述帧的视频图像的时间属性设置相同，在所述视频图像帧播放时，将对应时间属性的叠加层于所述视频图像帧上叠加播放。6.根据权利要求1所述的方法，其特征在于，步骤B后还包括：对所识别的文字进行违规检查。7.根据权利要求1所述的方法，其特征在于，步骤B后还包括：...

【专利技术属性】
技术研发人员：王邦军，吴安华，
申请(专利权)人：中科创达软件股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人