文本检测方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:32580686 阅读:10 留言:0更新日期:2022-03-09 17:11
本申请提供的文本检测方法、装置、存储介质及计算机设备,在对包含文本的待检测图像进行文本检测时,将文本检测范围从整个待检测图像缩小至单个的文本区域,有利于后续文本识别的效率和精度,避免其他非文本区域的影响;接着本申请可以对待识别的文本区域中的文本进行识别,并得到相应的文本识别结果,该文本识别结果中包含待检测图像中所有的文本信息,在此基础上,本申请可以对文本信息中的关键词进行检查,如对文本识别结果中的目标实体进行抽取后,根据目标实体与标准实体之间的比对结果来确定待检测图像中的文本是否编写正确,这样既可以保证待检测图像中的关键词的正确性,还可以减少文本检测的计算量,进一步提高文本检测的效率。测的效率。测的效率。

【技术实现步骤摘要】
文本检测方法、装置、存储介质及计算机设备


[0001]本申请涉及文本识别
,尤其涉及一种文本检测方法、装置、存储介质及计算机设备。

技术介绍

[0002]目前,绝大部分产品在售出时都会附带有对应的实物标签,而实物标签主要是用于标明物品的品名、重量、体积、用途等信息的简要标牌。如产品说明标签、价格标签、主要成分标签、规格标签、材质标签、地址标签、日期标签等。
[0003]一般地,在产品上架前,需要对该产品的实物标签中的内容进行检查,如核对实物标签中的价格是否错误、地址是否正确、产品说明中是否有文本错误等。现有的检查方式主要是采用人工进行核对,核对时,将该实物标签与PLM(产品生命周期管理)系统中存储的真实标签进行逐字比对,如果出现错误,则返回给设计师重新进行修改,修改后重新进行人工核对,直到设计正确为止。
[0004]但是,由于产品的上新速度较快,而人工核对的速度较慢,无法在短时间内完成大量的检查工作,从而导致检查效率较低,且由于检查量过大,还可能会出现漏检、错检的情况,使得人工检查的准确率较低。

技术实现思路

[0005]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中产品的上新速度较快,而人工核对的速度较慢,无法在短时间内完成大量的检查工作,从而导致检查效率较低,且由于检查量过大,还可能会出现漏检、错检的情况,使得人工检查的准确率较低的技术缺陷。
[0006]本申请提供了一种文本检测方法,所述方法包括:
[0007]获取包含文本的待检测图像;/>[0008]确定所述待检测图像中待识别的文本区域;
[0009]对所述待识别的文本区域中的文本进行识别,得到文本识别结果;
[0010]抽取所述文本识别结果中的目标实体,并将所述目标实体与标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确。
[0011]可选地,所述确定所述待检测图像中待识别的文本区域,包括:
[0012]获取目标文本区域检测模型;
[0013]将所述待检测图像输入到所述目标文本区域检测模型中,得到所述目标文本区域检测模型输出的所述待检测图像中待识别的文本区域。
[0014]可选地,所述获取目标文本区域检测模型,包括:
[0015]获取包含文本的第一样本图像;
[0016]按照预设的划分策略,将所述第一样本图像划分为多个子样本图像;
[0017]标注每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在
所述第一样本图像中的真实图像坐标;
[0018]将各个子样本图像依次输入至预设的初始文本区域检测模型中,得到所述初始文本区域检测模型输出的每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标;
[0019]以每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标,趋近于每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标为目标,训练所述初始文本区域检测模型;
[0020]当所述初始文本区域检测模型满足预设的第一训练条件时,将训练完成的初始文本区域检测模型作为目标文本区域检测模型。
[0021]可选地,对所述待识别的文本区域中的文本进行识别,得到文本识别结果,包括:
[0022]对所述待识别的文本区域中的文本行进行定位,得到至少一个文本行;
[0023]获取目标文本识别模型;
[0024]将每个文本行依次输入至所述目标文本识别模型中,得到所述目标文本识别模型输出的文本识别结果。
[0025]可选地,所述获取目标文本识别模型,包括:
[0026]获取包含文本的第二样本图像,对所述第二样本图像中的文本行进行截取后,得到多个训练图像;
[0027]对各个训练图像中的文本分别进行标注后得到第二样本标签,所述第二样本标签为各个训练图像中的文本所对应的字符在字典中映射得到的索引;
[0028]将各个训练图像分别输入至预设的初始文本识别模型,得到所述初始文本识别模型输出的与各个训练图像对应的预测标签;
[0029]以所述预测标签趋近于所述第二样本标签为目标,训练所述初始文本识别模型;
[0030]当所述初始文本识别模型满足预设的第二训练条件时,将训练完成的初始文本识别模型作为目标文本识别模型。
[0031]可选地,所述将各个训练图像分别输入至预设的初始文本识别模型之前,还包括:
[0032]按照预设的增强策略,对各个训练图像分别进行数据增强。
[0033]可选地,所述抽取所述文本识别结果中的目标实体,包括:
[0034]确定目标NLP模型;
[0035]将所述文本识别结果输入至所述目标NLP模型中,得到所述目标NLP模型输出的所述文本识别结果中的目标实体。
[0036]可选地,所述确定目标NLP模型,包括:
[0037]获取包含文本的第三样本图像;
[0038]对所述第三样本图像中的文本进行分词,并对分词后的单词的词性进行标注,确定标注词性后的每一单词所对应的真实实体类别;
[0039]将所述第三样本图像输入至预设的初始NLP模型中,得到所述初始NLP模型输出的所述第三样本图像中预测的每一单词对应的预测实体类别;
[0040]以预测的每一单词对应的预测实体类别趋近于所述单词对应的真实实体类别为目标,训练所述初始NLP模型;
[0041]当所述初始NLP模型满足预设的第三训练条件时,将训练完成的初始NLP模型作为目标NLP模型。
[0042]可选地,所述将所述目标实体与数据库中的标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确,包括:
[0043]根据所述目标实体对应的产品类别,从数据库中提取与所述产品类别对应的标准实体;
[0044]计算所述目标实体对应的词向量与所述标准实体对应的词向量之间的余弦值;
[0045]将所述余弦值与预设的余弦阈值进行比对;
[0046]若所述余弦值小于所述预设的余弦阈值,则确定所述待检测图像中的文本编写错误;
[0047]若所述余弦值不小于所述预设的余弦阈值,则确定所述待检测图像中的文本编写正确。
[0048]本申请还提供了一种文本检测装置,包括:
[0049]图像获取模块,用于获取包含文本的待检测图像;
[0050]文本区域检测模块,用于确定所述待检测图像中待识别的文本区域;
[0051]文本识别模块,用于对所述待识别的文本区域中的文本进行识别,得到文本识别结果;
[0052]文本检测模块,用于抽取所述文本识别结果中的目标实体,并将所述目标实体与标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确。
[0053]本申请还提供了一种存储介质,所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法,其特征在于,所述方法包括:获取包含文本的待检测图像;确定所述待检测图像中待识别的文本区域;对所述待识别的文本区域中的文本进行识别,得到文本识别结果;抽取所述文本识别结果中的目标实体,并将所述目标实体与数据库中的标准实体进行比对,根据比对结果确定所述待检测图像中的文本是否编写正确。2.根据权利要求1所述的文本检测方法,其特征在于,所述确定所述待检测图像中待识别的文本区域,包括:获取目标文本区域检测模型;将所述待检测图像输入到所述目标文本区域检测模型中,得到所述目标文本区域检测模型输出的所述待检测图像中待识别的文本区域。3.根据权利要求2所述的文本检测方法,其特征在于,所述获取目标文本区域检测模型,包括:获取包含文本的第一样本图像;按照预设的划分策略,将所述第一样本图像划分为多个子样本图像;标注每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标;将各个子样本图像依次输入至预设的初始文本区域检测模型中,得到所述初始文本区域检测模型输出的每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标;以每一子样本图像的预测图像中心点、预测图像大小,以及每一子样本图像在所述第一样本图像中的预测图像坐标,趋近于每一子样本图像的真实图像中心点、真实图像大小,以及每一子样本图像在所述第一样本图像中的真实图像坐标为目标,训练所述初始文本区域检测模型;当所述初始文本区域检测模型满足预设的第一训练条件时,将训练完成的初始文本区域检测模型作为目标文本区域检测模型。4.根据权利要求1

3任一项所述的文本检测方法,其特征在于,对所述待识别的文本区域中的文本进行识别,得到文本识别结果,包括:对所述待识别的文本区域中的文本行进行定位,得到至少一个文本行;获取目标文本识别模型;将每个文本行依次输入至所述目标文本识别模型中,得到所述目标文本识别模型输出的文本识别结果。5.根据权利要求4所述的文本检测方法,其特征在于,所述获取目标文本识别模型,包括:获取包含文本的第二样本图像,对所述第二样本图像中的文本行进行截取后,得到多个训练图像;对各个训练图像中的文本分别进行标注后得到第二样本标签,所述第二样本标签为各个训练图像中的文本所对应的字符在字典中映射得到的索引;将各个训练图像分别输入至预设的初始文本识别模型,得到所述初始文本识别模型输
出的与各个训练图像对应的预测标签;以所述预测标签趋近于所述第二样本标签为目标,训练所述初始文本识别模型;当所述初始文本识别模型满足预设的第二训练条件时,将训练完成的初始文...

【专利技术属性】
技术研发人员:叶俊科
申请(专利权)人:创优数字科技广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1