用于确定视频中文本的轨迹的方法、装置、设备和介质制造方法及图纸

技术编号:38465112 阅读:27 留言:0更新日期:2023-08-11 14:41
本公开的实施例涉及用于确定视频中文本的轨迹的方法、装置、设备和介质。该方法包括确定与第一文本集合相对应的第一特征集合和与第二文本集合相对应的第二特征集合,第一文本集合位于视频的目标帧中,第二文本集合位于视频中目标帧之前的多个帧中,并且第二文本集合中的文本关联于文本轨迹集合中的文本轨迹。该方法还包括基于第一特征集合和第二特征集合,确定关联度集合,关联度集合中的关联度指示第一文本集合中的文本在文本轨迹集合中的文本轨迹上的可能性。该方法还包括基于关联度集合,确定与第一文本集合中的文本相对应的文本轨迹。通过该方法,减少了识别过程中出现的文本轨迹识别错误,提高了文本轨迹识别的准确率,改进了用户体验。改进了用户体验。改进了用户体验。

【技术实现步骤摘要】
用于确定视频中文本的轨迹的方法、装置、设备和介质


[0001]本公开的实施例总体涉及视频处理领域,具体涉及用于确定视频中文本的轨迹的方法、装置、设备和介质。

技术介绍

[0002]随着计算机技术的快速发展以及视频文件的大范围应用,对视频中的信息的检测变得越来越重要。例如,检测视频中的人物、文本等。为了便于对视频进行更深入的分析,现在视频文本检测成为了视频检测中的一个重要发展方向。视频文本检测主要是为了定位和跟踪视频中的文本实例。通过定位和跟踪视频中的文本,使得视频在视频分析和多媒体信息检索方面具有更大的应用前景。尽管已经在文本检测和跟踪方面都做出了巨大的努力,但由于视频中文本的检测会受到各种因素的影响,因此还存在许多需要解决的问题。

技术实现思路

[0003]本公开的实施例提供了一种用于确定视频中文本的轨迹的方法、装置、设备和介质。
[0004]根据本公开的第一方面,提供了一种用于确定视频中文本的轨迹的方法。该方法包括确定与第一文本集合相对应的第一特征集合和与第二文本集合相对应的第二特征集合,第一文本集合位于视频的目标帧本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于确定视频中文本的轨迹的方法,包括:确定与第一文本集合相对应的第一特征集合和与第二文本集合相对应的第二特征集合,所述第一文本集合位于所述视频的目标帧中,所述第二文本集合位于所述视频中所述目标帧之前的多个帧中,并且所述第二文本集合中的文本关联于文本轨迹集合中的文本轨迹;基于所述第一特征集合和所述第二特征集合,确定关联度集合,所述关联度集合中的关联度指示所述第一文本集合中的文本在所述文本轨迹集合中的文本轨迹上的可能性;以及基于所述关联度集合,确定与所述第一文本集合中的文本相对应的文本轨迹。2.根据权利要求1所述的方法,其中所述关联度集合为第一关联度集合,其中确定关联度集合包括:基于所述第一特征集合和所述第二特征集合,确定第二关联度集合,所述第二关联度集合中的关联度指示所述第一文本集合中的文本与所述第二文本集合中的文本之间的相似度;基于所述第二关联度集合和所述文本轨迹集合,确定所述第一关联度集合。3.根据权利要求2所述的方法,其中确定第二关联度集合包括:基于所述第二特征集合和所述第二文本集合中的文本之间的关联关系,确定第三特征集合;以及基于所述第三特征集合和所述第一特征集合,确定所述第二关联度集合。4.根据权利要求2所述的方法,其中确定所述第一关联度集合包括:从所述第二关联度集合中选取与所述第一文本集合中的目标文本相对应的第一关联度子集;从所述第一关联度子集中选取与所述文本轨迹集合中的目标文本轨迹相对应的第二关联度子集;以及基于所述第二关联度子集,确定所述目标文本与所述目标文本轨迹的关联度。5.根据权利要求4所述的方法,其中第二关联度子集中的关联度为概率值,其中确定所述目标文本与所述目标文本轨迹的关联度包括:通过将所述第二关联度子集中的概率值进行相加,来确定所述目标文本与所述目标文本轨迹的关联度。6.根据权利要求2所述的方法,其中基于所述第一特征集合和所述第二特征集合,确定第二关联度集合包括:通过将神经网络模型应用于第一文本集合和所述第二文本集合来确定所述第二关联度集合,所述神经网络模型包括编码器和解码器。7.根据权利要求6所述方法,还包括:确定与样本视频中的多个样本帧中的样本文本集合相对应的样本特征集合以及所述样本特征集合与其自身的样本关联度集合;以及通过将所述样本特征集合分别用作所述编码器和所述解码器的样本输入并且将所述样本关联度集合用作所述神经网络模型的样本输出来训练所述神经网络模型。8.根据权利要求1所述的方法,其中确定与所述第一文本集合中的文本相对应的文本
轨迹包括:确定第一文本的第一边界框与第二文本的第二边界框的相似度,所述第一文本被包括在所述第一文本集合中,所述第二文本被包括在所述第二文本集合中并且位于所述目标帧的先前帧中;以及基于所述关联度集合和所述相似度,确定与所述第一文本集合中的文本相对应的文本轨迹。9.根据权利要求8所述的方法,其中确定第一文本的第一边界框与第二文本的第二边界框的相似度包括:确定用于指示所述第一边界框的大小和位置的第一表示;确定用于指示...

【专利技术属性】
技术研发人员:王涵王彦杰李阳黄灿
申请(专利权)人:抖音视界有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1