一种英文单词的识别方法及装置制造方法及图纸

技术编号:24497925 阅读:176 留言:0更新日期:2020-06-13 03:47
本申请适用于计算机技术领域,提供了一种英文单词的识别方法,包括:获取待识别的第一目标图像;其中,所述第一目标图像包括英文信息;将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。相对于现有技术,本申请提出的英文单词的识别方法提高了英文单词识别的准确率。

An English word recognition method and device

【技术实现步骤摘要】
一种英文单词的识别方法及装置
本申请属于计算机
,尤其涉及一种英文单词的识别方法及装置。
技术介绍
随着互联网的发展,各种类型的搜题库涌现,越来越多的用户使用搜题库进行试题搜索,其中,较为常用的搜索方式就是拍照搜题,用户通过拍摄图像输入搜题库,搜题库返回用户与图像中内容相符的试题。现有基于图片识别的搜题方法主要是通过光学字符识别(OpticalCharacterRecognition,OCR)算法实现的,但是对于中英文混排的图像进行识别时,使用现有的OCR识别算法会导致英文单词识别的准确率较低。
技术实现思路
本申请实施例提供了英文单词的识别方法及装置,可以解决英文单词识别准确率较低的问题。第一方面,本申请实施例提供了一种英文单词的识别方法,包括:获取待识别的第一目标图像;其中,所述第一目标图像包括英文信息;将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。进一步地,所述基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词,包括:对所述英文字符串进行分词处理,得到所述英文字符串对应的英文单词。进一步地,所述对所述英文字符串进行分词处理,得到所述英文字符串对应的英文单词,包括:获取所述第二目标图像对应的英文字符串的第一位置信息;基于所述第一位置信息对所述英文字符串进行划分,得到英文字符串组;对所述英文字符串组进行分词处理,得到所述英文字符串组对应的英文单词。进一步地,所述基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词,包括:基于预设纠错信息从所述英文字符串中提取易错英文字符串,并从所述预设纠错信息中获取所述易错英文字符串对应的标准英文单词;其中,所述预设纠错信息包括预设易错英文字符串及其对应的预设标准英文单词;将所述易错英文字符串替换为标准英文单词。进一步地,所述获取待识别的第一目标图像,包括:获取待识别的第一原始图像,基于预设霍夫直线检测算法计算所述第一原始图像的倾斜角度;根据所述倾斜角度和预设仿射变换算法,对所述第一原始图像进行倾斜矫正,得到第一目标图像。进一步地,在所述基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词之后,还包括:获取所述英文单词在所述第一目标图像中的第二位置信息;基于所述第二位置信息对所述英文单词进行排列,得到英文搜题关键信息;基于所述英文搜题关键信息从预设题库中获取所述英文搜题关键信息对应的目标题目。第二方面,本申请实施例提供了一种英文单词的识别装置,包括:采集单元,用于获取待识别的第一目标图像;其中,所述第一目标图像包括英文信息;定位单元,用于将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;识别单元,用于将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;确定单元,用于基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。进一步地,所述确定单元包括:分词单元,对所述英文字符串进行分词处理,得到所述英文字符串对应的英文单词。进一步地,所述分词单元包括:第一位置获取单元,用于获取所述第二目标图像对应的英文字符串的第一位置信息;划分单元,用于基于所述第一位置信息对所述英文字符串进行划分,得到英文字符串组;第一分词单元,用于对所述英文字符串组进行分词处理,得到所述英文字符串组对应的英文单词。进一步地,所述确定单元包括:纠错单元,用于基于预设纠错信息从所述英文字符串中提取易错英文字符串,并从所述预设纠错信息中获取所述易错英文字符串对应的标准英文单词;其中,所述预设纠错信息包括预设易错英文字符串及其对应的预设标准英文单词。替换单元,用于将所述易错英文字符串替换为标准英文单词。进一步地,所述采集单元,具体用于:获取待识别的第一原始图像,基于预设霍夫直线检测算法计算所述第一原始图像的倾斜角度;根据所述倾斜角度和预设仿射变换算法,对所述第一原始图像进行倾斜矫正,得到第一目标图像。进一步地,所述英文单词的识别装置,还包括:第二位置获取单元,获取所述英文单词在所述第一目标图像中的第二位置信息;排列单元,基于所述第二位置信息对所述英文单词进行排列,得到英文搜题关键信息;搜题单元,基于所述英文搜题关键信息从预设题库中获取所述英文搜题关键信息对应的目标题目。第三方面,本申请实施例提供了一种英文单词的识别设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面提供的英文单词的识别方法。第四方面,本申请实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面提供的英文单词的识别方法。可以理解的是,上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。本申请实施例中,获取待识别的第一目标图像;将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。上述方法,通过将第一目标图像输入已训练的英文定位模型,能够准确定位第一目标图像中包括的英文信息,再通过将英文信息对应的第二目标图像输入已训练的英文识别模型,得到第二目标图像对应的英文字符串,确定英文字符串对应的英文单词,提高英文单词识别的准确率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请第一实施例提供的英文单词的识别方法的示意流程图;图2为本申请第一实施例提供的英文单词的识别方法中S101的示意流程图;图3为本申请第一实施例提供的英文单词的识别方法中S104的示意流程图;图4为本申请第一实施例提供的英文单词的识别方法中S105的示意流程图;图5为本申请第二实施例提供的英文单词的识别方法的示意流程图;图6为本申请第三实施本文档来自技高网...

【技术保护点】
1.一种英文单词的识别方法,其特征在于,包括:/n获取待识别的第一目标图像;其中,所述第一目标图像包括英文信息;/n将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;/n将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;/n基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。/n

【技术特征摘要】
1.一种英文单词的识别方法,其特征在于,包括:
获取待识别的第一目标图像;其中,所述第一目标图像包括英文信息;
将所述第一目标图像输入已训练的英文定位模型,定位所述第一目标图像包括的所述英文信息,得到所述英文信息对应的第二目标图像;
将所述第二目标图像输入已训练的英文识别模型进行识别,得到所述第二目标图像对应的英文字符串;
基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词。


2.如权利要求1所述的英文单词的识别方法,其特征在于,所述基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词,包括:
对所述英文字符串进行分词处理,得到所述英文字符串对应的英文单词。


3.如权利要求2所述的英文单词的识别方法,其特征在于,所述对所述英文字符串进行分词处理,得到所述英文字符串对应的英文单词,包括:
获取所述第二目标图像对应的英文字符串的第一位置信息;
基于所述第一位置信息对所述英文字符串进行划分,得到英文字符串组;
对所述英文字符串组进行分词处理,得到所述英文字符串组对应的英文单词。


4.如权利要求1所述的英文单词的识别方法,其特征在于,所述基于所述第二目标图像对应的英文字符串,确定所述英文字符串对应的英文单词,包括:
基于预设纠错信息从所述英文字符串中提取易错英文字符串,并从所述预设纠错信息中获取所述易错英文字符串对应的标准英文单词;其中,所述预设纠错信息包括预设易错英文字符串及其对应的预设标准英文单词;
将所述易错英文字符串替换为标准英文单词。


5.如权利要求1所述的英文单词的识别方法,其特征在于,所述获取待识别的第一目标图像,包括:
获取待识别的第一原始图像,基于预设霍夫直线检测算法计算所述第一原始图像的倾斜角度;
根据所述倾斜角度和预设仿射变换算法,对所述第一...

【专利技术属性】
技术研发人员:邓小兵
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1