一种视频文字检测方法、装置、设备及存储介质制造方法及图纸

技术编号：38997865 阅读：12 留言：0更新日期：2023-10-07 10:29

本申请公开了一种视频文字检测方法、装置、设备及存储介质，其中，所述方法包括：基于预设采样间隔获取三张单帧图像；利用特征提取网络获取图像一的初始特征图一、图像二的特征图二和图像三的初始特征图三；确定图像一与图像二的第一光流信息，和图像三与所述图像二的第二光流信息；将初始特征图一基于第一光流信息对齐至所述特征图二，得到特征图一；将初始特征图三基于第二光流信息对齐至所述特征图二，得到特征图三；基于特征图一的文字概率图一和权重一、特征图二的文字概率图二和权重二、特征图三的文字概率图三和权重三确定所述图像二的文字区域。这样，通过时空聚合的方式改善视频帧的特征学习，有效提升文字检测精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频文字检测方法、装置、设备及存储介质

[0001]本申请实施例涉及信息处理领域，涉及但不限于一种视频文字检测方法、装置、设备及存储介质。

技术介绍

[0002]现有技术方案对于视频文字的检测依据单帧图片的检测，方法是对视频帧进行间隔提取，再根据提取的图片进行文字检测；或者是依据视频的时间间隔提取视频图片，再进行文字检测。以上方法采用对视频中单独某一帧图片的文字进行检测。
[0003]对于视频中的文字检测，以上检测方法存在局限性。在视频中的文字因为视频移动而导致外形变化、光照变化、快速运动、模糊等等情况的发生，视频中的每一帧的文字信息不都适用于静态图片的检测，对于单帧图片的检测忽略了视频的时间上的特征变化。没有区分视频文字与图片文字的区别，静态图片的检测方式运用于视频上效果往往会恶化很多，使得文字检测精度较低。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种视频文字检测方法、装置、设备及存储介质。
[0005]本申请实施例的技术方案是这样实现的：
[0006]第一方面，本申请实施例提供一种视频文字检测方法，所述方法包括：基于预设采样间隔获取三张单帧图像，其中，所述三张单帧图像包括图像一、图像二和图像三，所述图像二位于所述图像一和所述图像三中间；利用特征提取网络获取所述图像一的初始特征图一、所述图像二的特征图二和所述图像三的初始特征图三；确定所述图像一与所述图像二的第一光流信息，和所述图像三与所述图像二的第二光流信息；将所述初始特征图一基于所述第一光流信息对齐至所述...

【技术保护点】

【技术特征摘要】
1.一种视频文字检测方法，其特征在于，所述方法包括：基于预设采样间隔获取三张单帧图像，其中，所述三张单帧图像包括图像一、图像二和图像三，所述图像二位于所述图像一和所述图像三中间；利用特征提取网络获取所述图像一的初始特征图一、所述图像二的特征图二和所述图像三的初始特征图三；确定所述图像一与所述图像二的第一光流信息，和所述图像三与所述图像二的第二光流信息；将所述初始特征图一基于所述第一光流信息对齐至所述特征图二，得到特征图一；将所述初始特征图三基于所述第二光流信息对齐至所述特征图二，得到特征图三；基于所述特征图一的文字概率图一和权重一、所述特征图二的文字概率图二和权重二、所述特征图三的文字概率图三和权重三确定所述图像二的文字区域。2.如权利要求1所述的方法，其特征在于，所述将所述初始特征图一基于所述第一光流信息对齐至所述特征图二，得到特征图一，包括：基于所述第一光流信息，利用双线性差值算法结合所述初始特征图一和所述特征图二，得到特征图一；对应地，所述将所述初始特征图三基于所述第二光流信息对齐至所述特征图二，得到特征图三，包括：基于所述第二光流信息，利用所述双线性差值算法结合所述初始特征图三和所述特征图二，得到特征图三。3.如权利要求1所述的方法，其特征在于，所述基于所述特征图一的文字概率图一和权重一、所述特征图二的文字概率图二和权重二、所述特征图三的文字概率图三和权重三确定所述图像二的文字区域，包括：利用分类子网络分别检测所述特征图一、所述特征图二和所述特征图三，得到所述特征图一的文字概率图一、所述特征图二的文字概率图二和所述特征图三的文字概率图三；利用权重子网络分别获取所述特征图一的权重一、所述特征图二的权重二和所述特征图三的权重三；分别点乘所述权重一与所述权重二、点乘所述权重二与所述权重二和点乘所述权重三与所述权重二，得到所述特征图一的第一点乘相似度、所述特征图二的第二点乘相似度和所述特征图三的第三点乘相似度；基于所述特征图一的文字概率图一和第一点乘相似度、所述特征图二的文字概率图二和第二点乘相似度、所述特征图三的文字概率图三和第三点乘相似度确定所述图像二的目标概率图；基于所述目标概率图确定所述文字区域。4.如权利要求3所述的方法，其特征在于，所述基于所述特征图一的文字概率图一和第一点乘相似度、所述特征图二的文字概率图二和第二点乘相似度、所述特征图三的文字概率图三和第三点乘相似度确定所述图像二的目标概率图，包括：基于所述特征图一的文字概率图一和第一点乘相似度、所述特征图二的文字概率图二和第二点乘相似度、所述特征图三的文字概率图三和第三点乘相似度相应确定所述特征图一的第一聚合权重、所述特征图二的第二聚合权重和所述特征图三的第三聚合权重；
基于将所述第一聚合权重，所述第二聚合权重和所述第三聚合权重，对所述文字概率图一、所述文字概率图二和所述文字概率图三加权求和，得到所述目标概率图。5.如权利要求4所述的方法，其特征在于，所述基于所述特征图一的文字概率图一和第一点乘相似度、所述特征图二的文字概率...

【专利技术属性】
技术研发人员：姚成辉，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人