【技术实现步骤摘要】
一种建立识别模型的方法及装置
本申请涉及信息处理
,尤其涉及一种建立识别模型的方法及装置。
技术介绍
在机器学习领域,利用大量图像样本进行训练,可以获得识别模型,该识别模型能够识别图像中的文本信息。如,通过识别模型可以识别监控图像或照片中的车牌号、建筑物标识、集装箱箱号、证件号码等文本信息。目前,可通过有监督学习、半监督学习和无监督学习来获得识别模型。其中,无监督学习是利用一组未知类别的图像样本进行训练,以获得满足性能要求的识别模型。而训练识别模型所使用的图像样本是否准确,将直接决定训练过程中的迭代次数以及识别模型的识别率。因此,为确保使用的图像样本相对准确,无监督学习需要先对图像样本进行处理。相关技术中,主要采用人工标定的方式对图像样本进行处理,而人工标定不仅耗费人力,而且错误率高,处理后的图像样本的准确率也较低,这不仅会大幅增加训练识别模型时的迭代次数,而且会直接影响识别模型的识别率。
技术实现思路
本专利技术的目的是通过以下技术方案实现的。一种建立识别模型的方法,包括: ...
【技术保护点】
1.一种建立识别模型的方法,包括:/n利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;/n利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;/n利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。/n
【技术特征摘要】
1.一种建立识别模型的方法,包括:
利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的所述图像样本中包含的字符串;
利用预先配置的字符校验规则对所述预测结果进行校验,并以校验通过的预测结果所对应的图像样本形成训练集,所述字符校验规则用于对所述预测结果中的所述字符串进行校验;
利用所述训练集进行训练,以获得用于图像中字符识别的识别模型。
2.根据权利要求1所述的方法,其特征在于,所述利用所述训练集进行训练,以获得识别模型,包括:
当获得的所述识别模型未满足预设的迭代条件时,利用所述识别模型对所述批量图像样本进行预测,得到新的预测结果;
利用所述字符校验规则对所述预测结果进行校验,并以校验通过的所述预测结果所对应的图像样本更新所述训练集;
利用更新的所述训练集进行训练,直到训练得到的所述识别模型满足预设的迭代条件。
3.根据权利要求2所述的方法,其特征在于:所述迭代条件为所述识别模型的识别率不低于预先设定的识别率阈值。
4.根据权利要求1或2所述的方法,其特征在于,所述以校验通过的预测结果所对应的图像样本形成训练集,包括:
所述字符校验规则为多个时,对于所述校验通过的预测结果,根据其对应的不同字符校验规则,将其对应的图像样本加入不同的训练集。
5.根据权利要求4所述的方法,其特征在于,所述利用所述训练集进行训练,以获得识别模型,包括:
分别利用不同的训练集进行训练,以获得不同字符校验规则对应的识别模型。
6.一种建立识别模型的装置,其特征在于,包括:
预测模块,用于利用预先得到的基准模型对批量图像样本进行预测,得到预测结果,所述预测结果包括预测出的为所述图像样本中包含的字符串;
校验模块,用于利用预先配置的字符校验规则对所述预测结果进行校验...
【专利技术属性】
技术研发人员:朱丽,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。