视频文本的识别方法和装置、存储介质及电子设备制造方法及图纸

技术编号：31229998 阅读：28 留言：0更新日期：2021-12-08 10:00

本发明专利技术公开了一种视频文本的识别方法和装置、存储介质及电子设备。其中，该方法包括：获取从待识别的目标视频中提取到的视频文本，其中，视频文本中包括与目标视频的各个视频帧分别对应的帧文本子集；从视频文本中确定出携带有停用词的目标帧文本子集；去除目标帧文本子集中携带的停用词，以将视频文本更新为候选文本；确定候选文本中任意两个视频帧各自对应的帧文本子集中的文本片段之间的编辑距离；根据编辑距离对候选文本进行整合，以得到为目标视频识别出的目标文本。本发明专利技术解决了由于文本提取工具忽略视频帧中的部分文字信息所导致的视频文本的内容识别准确度较低的技术问题。的视频文本的内容识别准确度较低的技术问题。的视频文本的内容识别准确度较低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
视频文本的识别方法和装置、存储介质及电子设备

[0001]本专利技术涉及计算机领域，具体而言，涉及一种视频文本的识别方法和装置、存储介质及电子设备。

技术介绍

[0002]如今在很多视频播放平台都允许用户自行上传所要发布的视频。作为视频内容创作者，为了吸引更多的用户观看，常常会对视频中的内容进行丰富的编辑创作，其中，除了提供直观的视频帧画面之外，更加重要的是对视频内容提供相关的文字说明。
[0003]为了方便对视频进行管理，后台往往需要对视频帧中的文本内容进行识别分析。目前对上述视频帧中的文本内容进行识别时常用的方式是依赖于光学字符识别(Optical Character Recognition，简称OCR)等提取工具。但相关技术中提供的提取工具的识别精度较低，而且往往会忽视一些比较视频帧中较为边缘位置的文字，从而导致对视频文本进行内容识别时存在识别准确度较低的问题。
[0004]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种视频文本的识别方...

【技术保护点】

【技术特征摘要】
1.一种视频文本的识别方法，其特征在于，包括：获取从待识别的目标视频中提取到的视频文本，其中，所述视频文本中包括与所述目标视频的各个视频帧分别对应的帧文本子集；从所述视频文本中确定出携带有停用词的目标帧文本子集；去除所述目标帧文本子集中携带的所述停用词，以将所述视频文本更新为候选文本；确定所述候选文本中任意两个视频帧各自对应的帧文本子集中的文本片段之间的编辑距离；根据所述编辑距离对所述候选文本进行整合，以得到为所述目标视频识别出的目标文本。2.根据权利要求1所述的方法，其特征在于，所述从所述视频文本中确定出携带有停用词的目标帧文本子集包括：在所述视频文本中查找与停用词词集中记录的参考停用词相匹配的停用词；在查找到所述停用词的情况下，将所述停用词所在的帧文本子集确定为所述目标帧文本子集。3.根据权利要求2所述的方法，其特征在于，在所述获取从待识别的目标视频中提取到的视频文本之前，还包括：确定参考视频在播放平台中的发布信息，其中，所述发布信息包括以下至少之一：所述参考视频在所述播放平台中注册的登录账号的水印、所述播放平台的平台标识；将所述发布信息添加到所述停用词词集中。4.根据权利要求2所述的方法，其特征在于，在所述获取从待识别的目标视频中提取到的视频文本之后，还包括：统计在所述视频文本的各个帧文本子集中每个文本片段的词频，其中，所述文本片段的词频用于指示所述文本片段在所述视频文本中的出现次数；获取各个所述文本片段的词频分别与所述目标视频中所包含的文本片段的总数量之间的比值；将所述比值大于第一阈值的目标文本片段添加到所述停用词词集中。5.根据权利要求1所述的方法，其特征在于，所述确定所述候选文本中任意两个视频帧各自对应的帧文本子集中的文本片段之间的编辑距离包括：从所述候选文本中确定出待处理的当前帧文本子集；遍历所述当前帧文本子集，获取当前待比对的第一文本片段；从所述候选文本中除所述当前帧文本子集之外的参考帧文本子集中，获取当前待比对的第二文本片段；计算所述第一文本片段与所述第二文本片段之间的编辑距离。6.根据权利要求5所述的方法，其特征在于，所述计算所述第一文本片段与所述第二文本片段之间的编辑距离包括：确定所述第一文本片段对应的第一字符串长度，以及所述第二文本片段对应的第二字符串长度；基于所述第一字符串长度与所述第二字符串长度构建计算矩阵，其中，以所述第一文本片段中包含的各个第一字符，以及所述第二文本片段中包含的各个第二字符作为所述计
算矩阵的矩阵参考元素，所述矩阵参考元素为所述计算矩阵中的首行元素或首列元素；依序遍历所述计算矩阵中包含的各个字符，基于所述第一字符确定出当前待计算的第一字符串，并基于所述第二字符确定出当前待计算的第二字符串；计算出所述第一字符串与所述第二字符串之间的字符串距离，其中，所述第一文本片段与所述第二文本片段之间的编辑距离包括多个所述字符串距离。7.根据权利要求5所述的方法，其特征在于，在所述从所述候选文本中除所述当前帧文本子集之外的参考帧文本子集中，获取当前待比对的第二文本片段之前，还包括：从所述候选文本中确定出除所述当前帧文本子集之外的候选帧文本子集；在所述候选帧文本子集尚未被用于计算编辑距离的情况下，将所述候选帧文本子集确定为所述参考帧文本子集。8.根据权利要求5所述的方法，其特征在于，所述根据所述编辑距离对所述候选文本进行整合，以得到为所述目标视频识别出的目标文本包括：在所述第一...

【专利技术属性】
技术研发人员：康战辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人