文本识别方法及装置制造方法及图纸

技术编号:28422049 阅读:33 留言:0更新日期:2021-05-11 18:29
本公开涉及计算机视觉技术领域,具体提供了一种文本识别方法及装置。文本识别方法包括:对文本图像进行特征提取,得到第一特征序列;第一特征序列包括多个特征切片,特征切片表示待识别文本的特征向量;基于第一特征序列的多个特征切片之间的上下文信息,对第一特征序列进行处理,得到第二特征序列;根据第二特征序列,确定第二特征序列中各个特征切片的注意力权值;基于第二特征序列和注意力权值,得到待识别文本的识别结果。本公开方法提高文本识别精度。

【技术实现步骤摘要】
文本识别方法及装置
本公开涉及计算机视觉
,具体涉及一种文本识别方法及装置。
技术介绍
场景文本识别是计算机视觉以及智能视频分析领域的重要问题之一,其在众多场景均有广泛的应用,例如车牌识别、文档文本行识别、自然场景文字识别等。对于场景文本识别,如何提高识别精度是重要研究方向。
技术实现思路
为提高场景文本识别的精度,本公开实施方式提供了一种文本识别方法及装置。第一方面,本公开实施方式提供了一种文本识别方法,包括:对文本图像进行特征提取,得到第一特征序列;所述第一特征序列包括多个特征切片,所述特征切片表示待识别文本的特征向量;基于所述第一特征序列的多个特征切片之间的上下文信息,对所述第一特征序列进行处理,得到第二特征序列;根据所述第二特征序列,确定所述第二特征序列中各个所述特征切片的注意力权值;基于所述第二特征序列和所述注意力权值,得到所述待识别文本的识别结果。在一些实施方式中,所述对文本图像进行特征提取,得到第一特征序列,包括:对所述文本图像进行卷积处理,得到所述本文档来自技高网...

【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n对文本图像进行特征提取,得到第一特征序列;所述第一特征序列包括多个特征切片,所述特征切片表示待识别文本的特征向量;/n基于所述第一特征序列的多个特征切片之间的上下文信息,对所述第一特征序列进行处理,得到第二特征序列;/n根据所述第二特征序列,确定所述第二特征序列中各个所述特征切片的注意力权值;/n基于所述第二特征序列和所述注意力权值,得到所述待识别文本的识别结果。/n

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
对文本图像进行特征提取,得到第一特征序列;所述第一特征序列包括多个特征切片,所述特征切片表示待识别文本的特征向量;
基于所述第一特征序列的多个特征切片之间的上下文信息,对所述第一特征序列进行处理,得到第二特征序列;
根据所述第二特征序列,确定所述第二特征序列中各个所述特征切片的注意力权值;
基于所述第二特征序列和所述注意力权值,得到所述待识别文本的识别结果。


2.根据权利要求1所述的方法,其特征在于,所述对文本图像进行特征提取,得到第一特征序列,包括:
对所述文本图像进行卷积处理,得到所述文本图像的特征图;
基于所述特征图处理得到所述第一特征序列。


3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一特征序列的多个特征切片之间的上下文信息,对所述第一特征序列进行处理,得到第二特征序列,包括:
对所述第一特征序列进行空洞卷积处理,得到所述第二特征序列。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述第二特征序列和所述注意力权值,得到所述待识别文本的识别结果,包括:
基于所述第二特征序列和所述注意力权值,得到各所述特征切片的分类结果;
对各所述特征切片的所述分类结果进行解析处理,得到所述待识别文本的所述识别结果。


5.根据权利要求1至4任一项所述的方法,其特征在于,在所述对文本图像进行特征提取,得到第一特征序列之前,所述方法还包括:
获取场景图像,并由所述场景图像中检测得到至少一个所述文本图像。


6.根据权利要求5所述的方法,其特征在于,所述场景图像包括车辆,所述由所述场景图像中检测得到至少一个所述文本图像,包括:
由所述场景图像中检测得到至少一个车牌图像,作为所述文本图像。


7.根据权利要求1至6任一项所述的方法,其特征在于,所述注意力权值包括以下中至少之一:
空间注意力权值、通道注意力权值以及混合注意力权值。


8.根据权利要求1至7任一项所述的方法,其特征在于,
所述对文本图像进行特征提取,得到第一特征序列,包括:
通过特征提取网络对所述文本图像进行特征提取,得到所述第一特征序列;
...

【专利技术属性】
技术研发人员:蔡晓聪侯军伊帅
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1