一种文字识别方法及装置制造方法及图纸

技术编号：42083043 阅读：37 留言：0更新日期：2024-07-19 17:00

本申请公开了一种文字识别方法及装置，获取待识别图像；将待识别图像输入至预先训练的文字识别模型中，得到文字识别模型输出的特征向量；其中，文字识别模型预先基于样本图像训练得到；文字识别模型基于图像视觉编码模块、文字语义编码模块及解码模块构建得到；利用束搜索算法对特征向量进行计算，得到待识别图像的文字识别结果。通过视觉编码模块、文字语义编码模块和解码模块所构建的文字识别模型来对待识别图像进行识别，即使图像中存在大量的背景信息也不会影响文字识别结果，因此，提升了文字识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，尤其涉及一种文字识别方法及装置。

技术介绍

1、随着计算机视觉领域的加速发展，文本识别作为该领域中的一个热门任务，其应用也越来越广泛。

2、目前，一般是将整个图像导入到文字识别模型来实现对图像中文字的识别，整个图像中可能存在大量的背景信息，包括噪声、其他文本或图形等，这些信息会干扰模型对文字区域的识别，导致文字识别的准确率较低。

3、因此，如何提升文字识别的准确率，成为本领域亟需解决的问题。

技术实现思路

1、本申请提供了一种文字识别方法及装置，目的在于提升文字识别的准确率。

2、为了实现上述目的，本申请提供了以下技术方案：

3、一种文字识别方法，包括：

4、获取待识别图像；

5、将所述待识别图像输入至预先训练的文字识别模型中，得到所述文字识别模型输出的特征向量；其中，所述文字识别模型预先基于样本图像训练得到；所述文字识别模型基于图像视觉编码模块、文字语义编码模块及解码模块构建得到；

6...

【技术保护点】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，基于样本图像预先训练得到所述文字识别模型的过程，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述文字语义向量和所述特征向量，计算所述文字识别模型的损失值，包括：

4.根据权利要求2所述的方法，其特征在于，还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述验证样本图像对应的文字标签和所述目标特征向量，计算损失值，包括：

6.一种文字识别装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述输...

【技术特征摘要】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，基于样本图像预先训练得到所述文字识别模型的过程，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述文字语义向量和所述特征向量，计算所述文字识别模型的损失值，包括：

4.根据权利要求2所述的方法，其特征在于，还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述验...

【专利技术属性】
技术研发人员：徐佳宏，王少娜，
申请(专利权)人：深圳市茁壮网络股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人