一种文本特征提取方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:25709622 阅读:21 留言:0更新日期:2020-09-23 02:56
本发明专利技术实施例提供了一种文本特征提取方法、装置、电子设备及可读存储介质,方案如下:可以获取包含第一文本区域的待处理图像;将待处理图像输入预设卷积神经网络,得到第一文本区域的第一文本特征信息。其中,预设卷积神经网络是通过包含样本文本区域的多组样本图像训练得到的,每组样本图像包括:样本文本区域中包含相同文本内容信息的第一样本图像,以及样本文本区域中包含的文本内容信息与所述第一样本图像的文本内容信息不同的第二样本图像。通过本发明专利技术实施例提供的方案,可以在文本特征提取过程中,提高文本特征信息提取的准确度,进而提高视频数据中文本区域图像匹配的准确度。

【技术实现步骤摘要】
一种文本特征提取方法、装置、电子设备及可读存储介质
本专利技术涉及流媒体视频
,特别是涉及一种特征提取方法、装置、电子设备及可读存储介质。
技术介绍
近些年来出现了众多基于静态图像的文本识别方法,但是基于视频数据的文本识别方法却相对较少。因为视频数据相比静态图像更易受到外界环境中各种噪声的干扰,例如,光照的变化、运动模糊、文本字体大小的变化、遮挡等都会影响视频数据。因此,为了保证视频数据中所有帧的图像质量均保持较高的水准,可以采用文本追踪技术在视频数据的不同帧之间匹配关联属于同一文本的文本区域图像,获取相同文本的文本图像序列,从而根据匹配关联的结果,结合质量较高帧的识别结果来修正质量较低帧中不可信的识别结果。在视频数据的不同帧之间匹配关联的属于同一文本的文本区域图像时,通过边缘检测、图像直方图等技术对文本区域图像进行处理,提取到文本区域图像的文本特征,如文本位置信息、颜色直方图信息、运动信息等低层的图像外观信息。根据不同文本区域图像的低层的图像外观信息,将属于同一文本的文本图像区域进行匹配关联。在上述文本特征提取过程中,由本文档来自技高网...

【技术保护点】
1.一种文本特征提取方法,其特征在于,包括:/n获取包含第一文本区域的待处理图像;/n将所述待处理图像输入预设卷积神经网络,得到所述第一文本区域的第一文本特征信息,其中,所述预设卷积神经网络是通过包含样本文本区域的多组样本图像训练得到的,每组样本图像包括:样本文本区域中包含相同文本内容信息的第一样本图像,以及样本文本区域中包含的文本内容信息与所述第一样本图像的文本内容信息不同的第二样本图像。/n

【技术特征摘要】
1.一种文本特征提取方法,其特征在于,包括:
获取包含第一文本区域的待处理图像;
将所述待处理图像输入预设卷积神经网络,得到所述第一文本区域的第一文本特征信息,其中,所述预设卷积神经网络是通过包含样本文本区域的多组样本图像训练得到的,每组样本图像包括:样本文本区域中包含相同文本内容信息的第一样本图像,以及样本文本区域中包含的文本内容信息与所述第一样本图像的文本内容信息不同的第二样本图像。


2.根据权利要求1所述的方法,其特征在于,所述预设卷积神经网络采用如下步骤训练得到,包括:
获取所述预设卷积神经网络和所述多组样本图像;
将所述多组样本图像分别输入所述预设卷积神经网络中,得到每组样本图像中各样本图像的样本文本区域的样本文本特征信息;
基于得到的各样本图像的样本文本特征信息,确定各样本图像之间的特征距离;
基于所述特征距离确定所述预设卷积神经网络是否收敛;
若未收敛,则调节所述预设卷积神经网络的参数,并返回执行所述将所述将所述多组样本图像分别输入所述预设卷积神经网络中,得到每组样本图像中各样本图像的样本文本区域的样本文本特征信息的步骤;
若收敛,则结束所述预设卷积神经网络的训练。


3.根据权利要求2所述的方法,其特征在于,所述基于得到的各样本图像的样本文本特征信息,确定各样本图像之间的特征距离的步骤,包括:
根据每组样本图像中所述第一样本图像的样本文本特征信息,确定所述多组样本图像中各第一样本图像之间的第一特征距离;
根据每组样本图像中所述第一样本图像的样本文本特征信息,以及所述第二样本图像的样本文本特征信息,确定所述多组样本图像中各样本图像之间的第二特征距离。


4.根据权利要求1所述的方法,其特征在于,所述获取包含第一文本区域的待处理图像的步骤,包括:
获取待处理视频中的包含第一文本区域的目标帧图像;
从所述目标帧图像中截取第一文本区域处的图像,作为待处理图像。


5.根据权利要求4所述的方法,其特征在于,所述待处理图像为待处理视频的一帧图像中的包含文本区域的图像;
在所述将所述待处理图像输入预设卷积神经网络中,得到所述第一文本区域的第一文本特征信息的步骤之后,还包括:
确定所述待处理视频中其他图像中的第二文本区域的第二文本特征信息;
计算所述第一文本特征信息与所述第二文本特征信息的相似度;
基于所述相似度,确定所述待处理图像...

【专利技术属性】
技术研发人员:卢晶
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1