文本属性识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37971352 阅读:22 留言:0更新日期:2023-06-30 09:46
本公开实施例提供的一种文本属性识别方法、装置、电子设备及存储介质,涉及计算机技术领域。本公开中,通过基于待识别视频中连续的至少两个视频帧中的文本行,获取各视频帧中文本行的文本行相关信息;通过预先训练的视频属性识别模型对各视频帧中文本行的文本行相关信息进行特征编码,得到各视频文本行对应的文本行特征;通过视频属性识别模型基于至少两个视频帧对应的文本行特征,获取各文本行对应的文本行帧间特征;对文本行帧间特征进行属性识别,确定待识别视频帧中的各文本行对应的文本属性。这样,在视频文本分析过程中,由于兼顾了连续多个视频帧中的文本行帧间特征,一定程度上提帧中各高了视频中文本属性识别的准确性。上提帧中各高了视频中文本属性识别的准确性。上提帧中各高了视频中文本属性识别的准确性。

【技术实现步骤摘要】
文本属性识别方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种文本属性识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展,短视频以及时、快速、有动态画面、娱乐性更强的特点广受用户的欢迎,因此,需要基于视频内容中的文本内容的属性,应用于视频搜索,视频文案提取等业务,即需要利用视频中文本内容的文本属性的业务越来越多。
[0003]相关技术中,主要是通过对单帧图像中的文本进行文本属性识别,但是,这种识别方法由于只使用了单帧图像的文本信息进行分析识别,识别得到的文本属性的准确度较低。

技术实现思路

[0004]本公开提供一种文本属性识别方法、装置、电子设备及存储介质,以至少解决如何提高文本属性识别的准确度的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供了一种文本属性识别方法,包括:
[0006]基于待识别视频中连续的至少两个视频帧中的文本行,获取各所述视频帧中文本行的文本行相关信息;
[0007]通过预先训练的视频属本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本属性识别方法,其特征在于,所述方法包括:基于待识别视频中连续的至少两个视频帧中的文本行,获取各所述视频帧中文本行的文本行相关信息;通过预先训练的视频属性识别模型对各所述视频帧中文本行的文本行相关信息进行特征编码,得到各所述视频帧中各文本行对应的文本行特征;通过所述视频属性识别模型基于所述至少两个视频帧对应的文本行特征,获取各文本行对应的文本行帧间特征;对所述文本行帧间特征进行属性识别,确定所述待识别视频帧中的各文本行对应的文本属性。2.根据权利要求1所述的方法,其特征在于,所述文本行相关信息包括文字信息、图像信息以及位置信息;所述基于待识别视频中连续的至少两个视频帧中的文本行,获取各所述视频帧中文本行的文本行相关信息,包括:针对所述至少两个视频帧中的任一视频帧,获取所述视频帧中各文本行所在区域的局部图像特征,以作为所述图像信息;获取所述视频帧中各文本行中的文本内容,以作为所述文字信息;获取所述视频帧中各文本行在所述视频帧中的位置坐标,以作为所述位置信息。3.根据权利要求2所述的方法,其特征在于,所述通过预先训练的视频属性识别模型对各所述视频帧中文本行的文本行相关信息进行特征编码,得到各所述视频帧中各文本行对应的文本行特征,包括:通过所述视频属性识别模型中的第一处理层,基于各所述文本行的所述位置信息以及所述文字信息,生成各所述文本行的第一拼接信息,以及,基于各所述文本行的所述位置信息以及所述图像信息,生成各所述文本行的第二拼接信息;将各所述文本行的所述第一拼接信息以及所述第二拼接信息进行拼接,得到各所述文本行的拼接信息;基于所述各所述文本行的拼接信息,生成各所述文本行的文本行特征。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:对于任一所述视频帧,通过所述第一处理层确定所述视频帧中文本行的文字信息的文字序列标识以及图像信息的图像序列标识;同一文本行的文字序列标识与图像序列标识相同;为所述视频帧中所有文本行的目标信息设置连续的第一位置标识;所述目标信息包括所述文字信息以及图像信息;所述基于各所述文本行的所述位置信息以及所述文字信息,生成各所述文本行的第一拼接信息,包括:将各所述文本行的所述位置信息、所述文字信息、所述文字信息的第一位置标识以及所述文字序列标识进行拼接,得到各所述文本行的第一拼接信息;所述基于各所述文本行的所述位置信息以及所述图像信息,生成各所述文本行的第二拼接信息,包括:将各所述文本行的所述位置信息、所述图像信息、所述图像信息的第一位置标识以及所述图像序列标识进行拼接,得到各所述文本行的第二拼接信息。5.根据权利要求3或4所述的方法,其特征在于,所述通过所述视频属性识别模型基于所述至少两个视频帧对应的文本行特征,获取各文...

【专利技术属性】
技术研发人员:李聪夏魁李家宏
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1