文本图像检测方法、装置、设备及存储介质制造方法及图纸

技术编号:29936244 阅读:12 留言:0更新日期:2021-09-04 19:13
本发明专利技术涉及人工智能,提供一种文本图像检测方法、装置、设备及存储介质。该方法能够根据训练图像及图像文本对预设网络进行训练,得到文本识别模型,对待测图像进行尺度变换,得到多个尺度图像,对待测图像进行旋转,得到多个旋转图像,确定多个旋转图像的旋转顺序,基于文本识别模型对多个尺度图像进行文本检测,得到第一字符识别量,并对多个旋转图像进行文本检测,得到第二字符识别量,根据正态分布算法生成图像权值,根据第一字符识别量及图像权值计算图像清晰度,根据第二字符识别量及旋转顺序计图像角度。本发明专利技术能够提高所述图像清晰度的检测准确度。此外,本发明专利技术还涉及区块链技术,所述图像清晰度及所述图像角度可存储于区块链中。链中。链中。

【技术实现步骤摘要】
文本图像检测方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本图像检测方法、装置、设备及存储介质。

技术介绍

[0002]在保险处理环节中,无论是智能化识别还是人工处理,用户上传的文本图像越清晰或者图像处于正常视角范围都有利于提高保险投保环节的响应效率,然而,目前主要通过拉普拉斯算子计算图像的水平梯度和竖直梯度确定图像清晰度,然而,由于这种方式的清晰度评价标准受到主观因素影响,从而造成清晰度检测度低下。

技术实现思路

[0003]鉴于以上内容,有必要提供一种文本图像检测方法、装置、设备及存储介质,能够提高图像清晰度的检测准确度。
[0004]一方面,本专利技术提出一种文本图像检测方法,所述文本图像检测方法包括:
[0005]接收图像检测请求,并根据所述图像检测请求获取训练样本,所述训练样本包括训练图像及图像文本;
[0006]根据所述训练图像及所述图像文本对预设网络进行训练,得到文本识别模型;
[0007]根据所述图像检测请求获取待测图像;
[0008]对所述待测图像进行尺度变换,得到所述待测图像的多个尺度图像;
[0009]对所述待测图像进行旋转,得到所述待测图像的多个旋转图像,并确定所述多个旋转图像的旋转顺序;
[0010]基于所述文本识别模型对所述多个尺度图像进行文本检测,得到第一字符识别量,并基于所述文本识别模型对所述多个旋转图像进行文本检测,得到每个旋转图像的第二字符识别量;
[0011]根据正态分布算法生成每个尺度图像的图像权值;
[0012]根据所述第一字符识别量及所述图像权值计算所述待测图像的图像清晰度,并根据所述第二字符识别量及所述旋转顺序计算所述待测图像的图像角度。
[0013]根据本专利技术优选实施例,所述方法还包括:
[0014]根据第一预设标识及第二预设标识生成图像爬取请求,所述第一预设标识用于指示图像,所述第二预设标识用于指示所述图像中的文本框;
[0015]将所述图像爬取请求发送至预设网站中;
[0016]若在预设时间内接收到基于所述图像爬取请求反馈的授权响应结果,从所述预设网站中爬取与所述授权响应结果对应的目标图像;
[0017]获取所述目标图像中的文本信息作为目标信息,并根据所述目标信息确定信息类别;
[0018]根据所述信息类别对所述目标图像进行领域标注,得到图像领域;
[0019]基于所述图像领域、所述目标图像及对应的所述目标信息构建所述样本库;
[0020]计算所述样本库中每一图像领域中的目标图像的数量;
[0021]判断所述数量是否小于预设数量阈值;
[0022]若所述数量小于所述预设数量阈值,基于扰动法增加与所述数量对应的图像领域中所述目标图像的数量。
[0023]根据本专利技术优选实施例,所述根据所述目标信息确定信息类别包括:
[0024]对所述目标信息进行分词处理,得到目标分词;
[0025]基于多个预设类别中的类别词汇遍历所述目标分词,并计算所述目标分词与每个预设类别中所述类别词汇相同的词汇数量;
[0026]计算所述目标分词的分词总量,并根据所述分词总量及所述词汇数量确定每个预设类别的类别比例;
[0027]将所述类别比例最大的所述预设类别确定为所述信息类别。
[0028]根据本专利技术优选实施例,所述根据所述训练图像及所述图像文本对预设网络进行训练,得到文本识别模型包括:
[0029]获取所述训练图像的像素信息,并根据所述像素信息对所述训练图像进行向量化处理,得到图像向量;
[0030]将所述图像向量输入至所述预设网络,得到输出向量;
[0031]对所述图像文本进行向量化处理,得到文本向量;
[0032]根据所述文本向量及所述输出向量对所述预设网络中的参数进行调整,直至所述预设网络的识别准确率大于预设准确率,得到所述文本识别模型。
[0033]根据本专利技术优选实施例,所述根据所述文本向量及所述输出向量对所述预设网络中的参数进行调整包括:
[0034]计算所述输出向量与所述文本向量的相似度;
[0035]选取大于预设相似度阈值的所述相似度对应的输出向量作为目标向量;
[0036]确定所述预设网络中生成所述目标向量对应的学习率;
[0037]根据所述学习率对所述预设网络的参数进行调整。
[0038]根据本专利技术优选实施例,所述基于所述文本识别模型对所述多个尺度图像进行文本检测,得到第一字符识别量包括:
[0039]对每个尺度图像进行向量化处理,得到尺度向量;
[0040]将所述尺度向量输入至所述文本识别模型中,得到识别向量;
[0041]对所述识别向量进行映射处理,得到每个尺度图像的第一文本字符;
[0042]计算所述第一文本字符的数量,得到所述第一字符识别量。
[0043]根据本专利技术优选实施例,所述根据所述第一字符识别量及所述图像权值计算所述待测图像的图像清晰度包括:
[0044]采用下列公式计算所述待测图像中字符识别成功的数量作为识别成功量:
[0045][0046]其中,N为所述识别成功量,n为所述多个尺度图像的图像总量,wi为第i个图像对应的图像权值,ai为第i个图像的第一字符识别量;
[0047]将识别量最大的所述第一字符识别量确定为目标识别量;
[0048]将所述识别成功量除以所述目标识别量,得到所述图像清晰度。
[0049]另一方面,本专利技术还提出一种文本图像检测装置,所述文本图像检测装置包括:
[0050]获取单元,用于接收图像检测请求,并根据所述图像检测请求获取训练样本,所述训练样本包括训练图像及图像文本;
[0051]训练单元,用于根据所述训练图像及所述图像文本对预设网络进行训练,得到文本识别模型;
[0052]所述获取单元,还用于根据所述图像检测请求获取待测图像;
[0053]变换单元,用于对所述待测图像进行尺度变换,得到所述待测图像的多个尺度图像;
[0054]旋转单元,用于对所述待测图像进行旋转,得到所述待测图像的多个旋转图像,并确定所述多个旋转图像的旋转顺序;
[0055]检测单元,用于基于所述文本识别模型对所述多个尺度图像进行文本检测,得到第一字符识别量,并基于所述文本识别模型对所述多个旋转图像进行文本检测,得到每个旋转图像的第二字符识别量;
[0056]生成单元,用于根据正态分布算法生成每个尺度图像的图像权值;
[0057]计算单元,用于根据所述第一字符识别量及所述图像权值计算所述待测图像的图像清晰度,并根据所述第二字符识别量及所述旋转顺序计算所述待测图像的图像角度。
[0058]另一方面,本专利技术还提出一种电子设备,所述电子设备包括:
[0059]存储器,存储计算机可读指令;及
[0060]处理器,执本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本图像检测方法,其特征在于,所述文本图像检测方法包括:接收图像检测请求,并根据所述图像检测请求获取训练样本,所述训练样本包括训练图像及图像文本;根据所述训练图像及所述图像文本对预设网络进行训练,得到文本识别模型;根据所述图像检测请求获取待测图像;对所述待测图像进行尺度变换,得到所述待测图像的多个尺度图像;对所述待测图像进行旋转,得到所述待测图像的多个旋转图像,并确定所述多个旋转图像的旋转顺序;基于所述文本识别模型对所述多个尺度图像进行文本检测,得到第一字符识别量,并基于所述文本识别模型对所述多个旋转图像进行文本检测,得到每个旋转图像的第二字符识别量;根据正态分布算法生成每个尺度图像的图像权值;根据所述第一字符识别量及所述图像权值计算所述待测图像的图像清晰度,并根据所述第二字符识别量及所述旋转顺序计算所述待测图像的图像角度。2.如权利要求1所述的文本图像检测方法,其特征在于,所述方法还包括:根据第一预设标识及第二预设标识生成图像爬取请求,所述第一预设标识用于指示图像,所述第二预设标识用于指示所述图像中的文本框;将所述图像爬取请求发送至预设网站中;若在预设时间内接收到基于所述图像爬取请求反馈的授权响应结果,从所述预设网站中爬取与所述授权响应结果对应的目标图像;获取所述目标图像中的文本信息作为目标信息,并根据所述目标信息确定信息类别;根据所述信息类别对所述目标图像进行领域标注,得到图像领域;基于所述图像领域、所述目标图像及对应的所述目标信息构建所述样本库;计算所述样本库中每一图像领域中的目标图像的数量;判断所述数量是否小于预设数量阈值;若所述数量小于所述预设数量阈值,基于扰动法增加与所述数量对应的图像领域中所述目标图像的数量。3.如权利要求2所述的文本图像检测方法,其特征在于,所述根据所述目标信息确定信息类别包括:对所述目标信息进行分词处理,得到目标分词;基于多个预设类别中的类别词汇遍历所述目标分词,并计算所述目标分词与每个预设类别中所述类别词汇相同的词汇数量;计算所述目标分词的分词总量,并根据所述分词总量及所述词汇数量确定每个预设类别的类别比例;将所述类别比例最大的所述预设类别确定为所述信息类别。4.如权利要求1所述的文本图像检测方法,其特征在于,所述根据所述训练图像及所述图像文本对预设网络进行训练,得到文本识别模型包括:获取所述训练图像的像素信息,并根据所述像素信息对所述训练图像进行向量化处理,得到图像向量;
将所述图像向量输入至所述预设网络,得到输出向量;对所述图像文本进行向量化处理,得到文本向量;根据所述文本向量及所述输出向量对所述预设网络中的参数进行调整,直至所述预设网络的识别准确率大于预设准确率,得到所述文本识别模型。5.如权利要求4所述的...

【专利技术属性】
技术研发人员:欧阳高询
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1