视频文字检测方法、装置和计算机可读存储介质制造方法及图纸

技术编号：20273469 阅读：22 留言：0更新日期：2019-02-02 04:00

本公开一种视频文字检测方法、视频文字检测装置、视频文字检测硬件装置和计算机可读存储介质。其中，该视频文字检测方法包括对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。本公开实施例首先对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块，然后根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息，可以提高文字检测准确率。

全部详细技术资料下载

【技术实现步骤摘要】
视频文字检测方法、装置和计算机可读存储介质
本公开涉及一种信息处理
，特别是涉及一种视频文字检测方法、装置和计算机可读存储介质。
技术介绍
近年来，随着多媒体技术和计算机网络的飞速发展，数字视频的容量正以惊人的速度增长。这样，从数字视频中抓取到的图像中往往包含有重要的文字信息，这在基于文字内容的视频数据库检索中起到重要的作用。即在一定程度上便于视频主要内容进行简练描述和说明，或便于视频分类，或便于非法视频的鉴定等。视频中经常包含有文字，比如广告、介绍，或者视频中出现的标识牌上文字等，在判断视频中是否有文字时，在现在技术中，常常是通过抽取视频中的每一帧进行光学字符识别(OpticalCharacterRecognition，OCR)识别。但是，当图像中包含的文字较小的时候，OCR识别效果并不理想，准确率也不够高。
技术实现思路
本公开解决的技术问题是提供一种视频文字检测方法，以至少部分地解决OCR在识别较小文字的时识别效果不理想且识别准确率低的技术问题。此外，还提供一种视频文字检测装置、视频文字检测硬件装置、计算机可读存储介质和视频文字检测终端。为了实现上述目的，根据本公开的一个方面，提供以下技术方案：一种视频文字检测方法，包括：对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。进一步的，所述根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息的步骤，包括：对各图像块进行文字检测；若检测出任一图像块中包含文字信息，则确定所述待检测视频中包含文字信息。进一步的，所述...

【技术保护点】
1.一种视频文字检测方法，其特征在于，包括：对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。

【技术特征摘要】
1.一种视频文字检测方法，其特征在于，包括：对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块；根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息。2.根据权利要求1所述的方法，其特征在于，所述根据对所述图像块的文字检测结果确定所述待检测视频中是否包含文字信息的步骤，包括：对各图像块进行文字检测；若检测出任一图像块中包含文字信息，则确定所述待检测视频中包含文字信息。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：对已知包含文字信息的图片和/或已知未包含文字信息的图片进行分块，得到至少一个图像块作为训练样本；根据是否包含文字信息对所述训练样本进行标注；采用深度学习分类算法对所述标注后的训练样本进行训练学习，得到图像分类器。4.根据权利要求3所述的方法，其特征在于，所述对从待检测视频中抽取的待检测图片进行分块，得到至少一个图像块的步骤，包括：将所述待检测图片输入所述图像分类器，通过所述图像分类器对所述待检测图片进行分块，得到至少一个图像块；所述方法还包括：通过所述图像分类器对所述图像块进行文字检测，并根据所述图像分类器的分类结果确定所述图像块的文字检测结果。5.根据权利要求4所述的方法，其特征在于，所述通过所述图像分类器对所述图像块进行文字检测，并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤，包括：通过所述图像分类器对各图像块进行打分，得到各图像块的分值；根据所述分值确定所述图像块的文字检测结果。6.根据权利要求5所述的方法，其特征在于，所述根据所述分值确定所述图像块的文字检测结果的步骤，包括：若所述分值超过预设分值，则确定所述图像块中包含文字信息；或，从所述分值中选取最大分值，若所述最大分值超过预设分值，则确定所述图像块中包含文字信息；或，若所述分值小于预设分值，则确定所述图像块中包含文字信息；或，从所述分值中选取最小分值，若所述最小分值小于预设分值，则确定图像块中包含文字信息。7.根据权利要求4所述的方法，其特征在于，所述通过所述图像分类器对所述图像块进行文字检测，并根据所述图像分类器的分类结果确定所述图像块的文字检测结果的步骤，包括：通过所述图像分类器对各图像块进行文字检测，并通过所述图像分类器直接输出以下任意一种结果：包含文字信息和不包含文字信息；将输出结果作为所述图像块的文字检测结果。8.一种视频文字检测装置，其特征在于，包括：图片分块模块，用于对从待检测...

【专利技术属性】
技术研发人员：周多友，王长虎，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人