【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种文字识别方法及装置。
技术介绍
1、随着计算机视觉领域的加速发展,文本识别作为该领域中的一个热门任务,其应用也越来越广泛。
2、目前,一般是将整个图像导入到文字识别模型来实现对图像中文字的识别,整个图像中可能存在大量的背景信息,包括噪声、其他文本或图形等,这些信息会干扰模型对文字区域的识别,导致文字识别的准确率较低。
3、因此,如何提升文字识别的准确率,成为本领域亟需解决的问题。
技术实现思路
1、本申请提供了一种文字识别方法及装置,目的在于提升文字识别的准确率。
2、为了实现上述目的,本申请提供了以下技术方案:
3、一种文字识别方法,包括:
4、获取待识别图像;
5、将所述待识别图像输入至预先训练的文字识别模型中,得到所述文字识别模型输出的特征向量;其中,所述文字识别模型预先基于样本图像训练得到;所述文字识别模型基于图像视觉编码模块、文字语义编码模块及解码模块构建得到;
6
...【技术保护点】
1.一种文字识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于样本图像预先训练得到所述文字识别模型的过程,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述文字语义向量和所述特征向量,计算所述文字识别模型的损失值,包括:
4.根据权利要求2所述的方法,其特征在于,还包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述验证样本图像对应的文字标签和所述目标特征向量,计算损失值,包括:
6.一种文字识别装置,其特征在于,包括:
7.根据权利要求6所述的装置
...【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于样本图像预先训练得到所述文字识别模型的过程,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述文字语义向量和所述特征向量,计算所述文字识别模型的损失值,包括:
4.根据权利要求2所述的方法,其特征在于,还包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述验...
【专利技术属性】
技术研发人员:徐佳宏,王少娜,
申请(专利权)人:深圳市茁壮网络股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。