视频文字检测方法、装置和计算机可读存储介质制造方法及图纸

技术编号:20273469 阅读:22 留言:0更新日期:2019-02-02 04:00
本公开一种视频文字检测方法、视频文字检测装置、视频文字检测硬件装置和计算机可读存储介质。其中,该视频文字检测方法包括对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。本公开实施例首先对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块,然后根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息,可以提高文字检测准确率。

【技术实现步骤摘要】
视频文字检测方法、装置和计算机可读存储介质
本公开涉及一种信息处理
,特别是涉及一种视频文字检测方法、装置和计算机可读存储介质。
技术介绍
近年来,随着多媒体技术和计算机网络的飞速发展,数字视频的容量正以惊人的速度增长。这样,从数字视频中抓取到的图像中往往包含有重要的文字信息,这在基于文字内容的视频数据库检索中起到重要的作用。即在一定程度上便于视频主要内容进行简练描述和说明,或便于视频分类,或便于非法视频的鉴定等。视频中经常包含有文字,比如广告、介绍,或者视频中出现的标识牌上文字等,在判断视频中是否有文字时,在现在技术中,常常是通过抽取视频中的每一帧进行光学字符识别(OpticalCharacterRecognition,OCR)识别。但是,当图像中包含的文字较小的时候,OCR识别效果并不理想,准确率也不够高。
技术实现思路
本公开解决的技术问题是提供一种视频文字检测方法,以至少部分地解决OCR在识别较小文字的时识别效果不理想且识别准确率低的技术问题。此外,还提供一种视频文字检测装置、视频文字检测硬件装置、计算机可读存储介质和视频文字检测终端。为了实现上述目的,根据本公开的一个方面,提供以下技术方案:一种视频文字检测方法,包括:对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。进一步的,所述根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息的步骤,包括:对各图像块进行文字检测;若检测出任一图像块中包含文字信息,则确定所述待检测视频中包含文字信息。进一步的,所述方法还包括:对已知包含文字信息的图片和/或已知未包含文字信息的图片进行分块,得到至少一个图像块作为训练样本;根据是否包含文字信息对所述训练样本进行标注;采用深度学习分类算法对所述标注后的训练样本进行训练学习,得到图像分类器。进一步的,所述对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块的步骤,包括:将所述待检测图片输入所述图像分类器,通过所述图像分类器对所述待检测图片进行分块,得到至少一个图像块;所述方法还包括:通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果。进一步的,所述通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤,包括:通过所述图像分类器对各图像块进行打分,得到各图像块的分值;根据所述分值确定所述图像块的文字检测结果。进一步的,所述根据所述分值确定所述图像块的文字检测结果的步骤,包括:若所述分值超过预设分值,则确定所述图像块中包含文字信息;或,从所述分值中选取最大分值,若所述最大分值超过预设分值,则确定所述图像块中包含文字信息;或,若所述分值小于预设分值,则确定所述图像块中包含文字信息;或,从所述分值中选取最小分值,若所述最小分值小于预设分值,则确定图像块中包含文字信息。进一步的,所述通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤,包括:通过所述图像分类器对各图像块进行文字检测,并通过所述图像分类器直接输出以下任意一种结果:包含文字信息和不包含文字信息;将输出结果作为所述图像块的文字检测结果。为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:一种视频文字检测装置,包括:图片分块模块,用于对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;文字确定模块,用于根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。进一步的,所述文字确定模块具体用于:对各图像块进行文字检测;若检测出任一图像块中包含文字信息,则确定所述待检测视频中包含文字信息。进一步的,所述装置还包括:分类器训练模块,用于对已知包含文字信息的图片和/或已知未包含文字信息的图片进行分块,得到至少一个图像块作为训练样本;根据是否包含文字信息对所述训练样本进行标注;采用深度学习分类算法对所述标注后的训练样本进行训练学习,得到图像分类器。进一步的,所述图片分块模块具体用于:将所述待检测图片输入所述图像分类器,通过所述图像分类器对所述待检测图片进行分块,得到至少一个图像块;所述装置还包括:文字检测模块,用于通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果。进一步的,所述文字检测模块包括:打分单元,用于通过所述图像分类器对各图像块进行打分,得到各图像块的分值;文字检测单元,用于根据所述分值确定所述图像块的文字检测结果。进一步的,所述文字检测单元具体用于:若所述分值超过预设分值,则确定图像块中包含文字信息;或,从所述分值中选取最大分值,若所述最大分值超过预设分值,则确定图像块中包含文字信息;或,若所述分值小于预设分值,则确定图像块中包含文字信息;或,从所述分值中选取最小分值,若所述最小分值小于预设分值,则确定图像块中包含文字信息。进一步的,所述文字检测模块具体用于:通过所述图像分类器对各图像块进行文字检测,并通过所述图像分类器直接输出以下任意一种结果:包含文字信息和不包含文字信息;将输出结果作为所述图像块的文字检测结果。为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:一种视频文字检测硬件装置,包括:存储器,用于存储非暂时性计算机可读指令;以及处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现上述任一视频文字检测方法技术方案中所述的步骤。为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行上述任一视频文字检测方法技术方案中所述的步骤。为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:一种视频文字检测终端,包括上述任一视频文字检测装置。本公开实施例提供一种视频文字检测方法、视频文字检测装置、视频文字检测硬件装置、计算机可读存储介质和视频文字检测终端。其中,该视频文字检测方法包括对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。本公开实施例首先对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块,然后根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息,可以提高文字检测准确率。上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明图1a为根据本公开一个实施例的视频文字检测方法的流程示意图;图1b为根据本公开另一个实施例的视频文字检测方法的流程示意图;图1c为根据本公开另一个实施例的视频文字检测方法的流程示意图;图2a为根据本公开一个实施例的视频文字检测的装置的结构示意图;图2b为根据本公开另一个实施例的视频文字检测装置的结构示意图;图3为根据本公开一个实施例的视频文字检测硬件装置的结构示意图;图4为根本文档来自技高网...

【技术保护点】
1.一种视频文字检测方法,其特征在于,包括:对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。

【技术特征摘要】
1.一种视频文字检测方法,其特征在于,包括:对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块;根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。2.根据权利要求1所述的方法,其特征在于,所述根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息的步骤,包括:对各图像块进行文字检测;若检测出任一图像块中包含文字信息,则确定所述待检测视频中包含文字信息。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对已知包含文字信息的图片和/或已知未包含文字信息的图片进行分块,得到至少一个图像块作为训练样本;根据是否包含文字信息对所述训练样本进行标注;采用深度学习分类算法对所述标注后的训练样本进行训练学习,得到图像分类器。4.根据权利要求3所述的方法,其特征在于,所述对从待检测视频中抽取的待检测图片进行分块,得到至少一个图像块的步骤,包括:将所述待检测图片输入所述图像分类器,通过所述图像分类器对所述待检测图片进行分块,得到至少一个图像块;所述方法还包括:通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果。5.根据权利要求4所述的方法,其特征在于,所述通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤,包括:通过所述图像分类器对各图像块进行打分,得到各图像块的分值;根据所述分值确定所述图像块的文字检测结果。6.根据权利要求5所述的方法,其特征在于,所述根据所述分值确定所述图像块的文字检测结果的步骤,包括:若所述分值超过预设分值,则确定所述图像块中包含文字信息;或,从所述分值中选取最大分值,若所述最大分值超过预设分值,则确定所述图像块中包含文字信息;或,若所述分值小于预设分值,则确定所述图像块中包含文字信息;或,从所述分值中选取最小分值,若所述最小分值小于预设分值,则确定图像块中包含文字信息。7.根据权利要求4所述的方法,其特征在于,所述通过所述图像分类器对所述图像块进行文字检测,并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤,包括:通过所述图像分类器对各图像块进行文字检测,并通过所述图像分类器直接输出以下任意一种结果:包含文字信息和不包含文字信息;将输出结果作为所述图像块的文字检测结果。8.一种视频文字检测装置,其特征在于,包括:图片分块模块,用于对从待检测...

【专利技术属性】
技术研发人员:周多友王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1