文本识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27835091 阅读:21 留言:0更新日期:2021-03-30 11:56
本申请涉及一种文本识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别文本图像;将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。采用本方法能够提高文本内容的识别效率。采用本方法能够提高文本内容的识别效率。采用本方法能够提高文本内容的识别效率。

【技术实现步骤摘要】
文本识别方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种文本识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,计算机的硬件性能越来越高,这使得近年来深度学习计算机视觉领域在硬件设备的支持下飞速发展。其中,深度学习技术在文本识别领域有着极大的技术突破和丰富的应用场景。
[0003]当前主要的文本识别已经从传统的分割字符、特征提取、字符分类流程替代为深度学习的方法,研究人员通过CNN网络和RNN网络能够有效的进行文本识别。
[0004]但目前的文本识别网络不能很好的判断出检测到文本的排列方向,使得文本内容信息的识别效率低下。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高图像文本内容识别效率的文本识别方法、装置、计算机设备和存储介质。
[0006]一种文本识别方法,方法包括:
[0007]获取待识别文本图像;
[0008]将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。
[0009]在一个实施例中,根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,包括:
[0010]根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本排列方向识别结果,以及多个文本内容识别结果;
[0011]从多个文本内容识别结果中提取与文本排列方向识别结果对应的文本内容识别结果,并将提取到的文本内容识别结果作为待识别文本图像的文本识别内容。
[0012]在一个实施例中,机器学习模型包括文本排列方向识别模型以及文本内容识别模型;文本排列方向识别模型以及文本内同识别模型的训练方式,包括:
[0013]获取多个训练文本图像;
[0014]将训练文本图像分别输入至初始文本排列方向识别模型中,以根据初始文本排列方向识别模型中的初始排列方向识别参数对训练文本图像中的文本内容的文本排列方向进行识别,得到文本排列方向初始识别结果;
[0015]根据文本排列方向初始识别结果确定与训练文本图像对应的初始文本内容识别模型,并利用确定的初始文本内容识别模型对应的初始内容识别参数对训练文本图像的文
本内容进行识别得到文本内容初始识别结果;
[0016]根据文本排列方向初始识别结果、文本内容初始识别结果以及真实标签确定目标损失函数;
[0017]根据目标损失函数对初始排列方向识别参数以及初始内容识别参数进行调整,直至满足训练结束条件时,获取当前排列方向识别参数以及当前内容识别参数,并根据当前排列方向识别参数得到文本排列方向识别模型以及根据当前内容识别参数得到文本内容识别模型。
[0018]在一个实施例中,将训练文本图像分别输入至初始文本排列方向识别模型中,包括:
[0019]提取训练文本图像的图像特征,得到训练文本图像特征;
[0020]将训练文本图像特征分别输入至初始文本排列方向识别模型中。
[0021]在一个实施例中,初始文本内容识别模型包括正排列方向文本内容识别模型以及倒排列方向文本内容识别模型;根据文本排列方向初始识别结果确定与训练文本图像对应的初始文本内容识别模型,包括:
[0022]当文本排列方向初始识别结果对应为正排列方向时,确定正排列方向文本内容识别模型是与训练文本图像对应的初始文本内容识别模型;
[0023]当文本排列方向初始识别结果对应为倒排列方向时,确定倒排列方向文本内容识别模型是与训练文本图像对应的初始文本内容识别模型。
[0024]在一个实施例中,根据文本排列方向初始识别结果、文本内容初始识别结果以及真实标签确定目标损失函数,包括:
[0025]当初始文本内容识别模型对应为正排列方向文本内容识别模型时,获取正排列方向文本内容识别模型对训练文本图像进行识别得到的正排列方向文本内容识别结果,并根据正排列方向文本内容识别结果、文本初始识别结果以及真实标签确定目标损失函数;
[0026]当初始文本内容识别模型对应为倒排列方向文本内容识别模型时,获取倒排列方向文本内容识别模型对训练文本图像进行识别得到的倒排列方向文本内容识别结果,并根据倒排列方向文本内容识别结果、文本初始识别结果以及真实标签确定目标损失函数。
[0027]在一个实施例中,获取多个训练文本图像,包括:
[0028]获取文本内容在正排列方向分布的正排列方向文本图像;
[0029]对正排列方向文本图像进行转换处理得到倒排列方向文本图像;
[0030]对正排列方向文本图像以及倒排列方向文本图像进行干扰扩充处理得到干扰文本图像;
[0031]根据正排列方向文本图像、倒排列方向文本图像以及干扰文本图像得到训练文本图像。
[0032]一种文本识别装置,装置包括:
[0033]获取模块,用于获取待识别文本图像;
[0034]识别模块,用于将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。
[0035]一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任意实施例的方法的步骤。
[0036]一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的方法的步骤。
[0037]上述文本识别方法、装置、计算机设备和存储介质,获取待识别文本图像;将待识别文本图像输入至预先训练的机器学习模型中,以根据机器学习模型中预训练的模型参数对待识别文本图像进行识别得到文本识别内容,机器学习模型是根据多个训练文本图像训练得到,每一个训练文本图像中的文本内容在同一个排列方向上分布且不同的训练文本图像中的文本内容包括在不同排列方向上分布。由于机器学习模型预先被训练成同时具备识别文本排列方向以及文本内容的能力,故而通过本方案能够实现对文本内容以及文本排列方向的同时识别,进而使得对文本内容的识别能力更强,提高了对文本内容的识别效率。
附图说明
[0038]图1为一个实施例中文本识别方法的应用环境图;
[0039]图2为一个实施例中文本识别方法的流程示意图;
[0040]图3为一个实施例中提供的一个待识别文本图像;
[0041]图4为另一实施例中提供的一个待识别文本图像;
[0042]图5为一个实施例中提供的中机器学习模型的结构示意图;
[0043]图6为一个实施例中提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:获取待识别文本图像;将所述待识别文本图像输入至预先训练的机器学习模型中,以根据所述机器学习模型中预训练的模型参数对所述待识别文本图像进行识别得到文本识别内容,所述机器学习模型是根据多个训练文本图像训练得到,每一个所述训练文本图像中的文本内容在同一个排列方向上分布且不同的所述训练文本图像中的所述文本内容包括在不同排列方向上分布。2.根据权利要求1所述的方法,其特征在于,所述根据所述机器学习模型中预训练的模型参数对所述待识别文本图像进行识别得到文本识别内容,包括:根据所述机器学习模型中预训练的模型参数对所述待识别文本图像进行识别得到文本排列方向识别结果,以及多个文本内容识别结果;从多个所述文本内容识别结果中提取与所述文本排列方向识别结果对应的文本内容识别结果,并将提取到的所述文本内容识别结果作为所述待识别文本图像的文本识别内容。3.根据权利要求1所述的方法,其特征在于,所述机器学习模型包括文本排列方向识别模型以及文本内容识别模型;所述文本排列方向识别模型以及所述文本内同识别模型的训练方式,包括:获取多个训练文本图像;将所述训练文本图像分别输入至初始文本排列方向识别模型中,以根据所述初始文本排列方向识别模型中的初始排列方向识别参数对所述训练文本图像中的文本内容的文本排列方向进行识别,得到文本排列方向初始识别结果;根据所述文本排列方向初始识别结果确定与所述训练文本图像对应的初始文本内容识别模型,并利用确定的所述初始文本内容识别模型对应的初始内容识别参数对所述训练文本图像的文本内容进行识别得到文本内容初始识别结果;根据所述文本排列方向初始识别结果、所述文本内容初始识别结果以及真实标签确定目标损失函数;根据所述目标损失函数对所述初始排列方向识别参数以及所述初始内容识别参数进行调整,直至满足训练结束条件时,获取当前排列方向识别参数以及当前内容识别参数,并根据所述当前排列方向识别参数得到文本排列方向识别模型以及根据所述当前内容识别参数得到文本内容识别模型。4.根据权利要求3所述的方法,其特征在在于,所述将所述训练文本图像分别输入至初始文本排列方向识别模型中,包括:提取所述训练文本图像的图像特征,得到训练文本图像特征;将所述训练文本图像特征分别输入至初始文本排列方向识别模型中。5.根据权利要求3所述的方法,其特征在于,所述初始文本内容识别模型包括正排列方向文本内容识别模型以及倒排列方向文本内容...

【专利技术属性】
技术研发人员:陈光
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1