识别模型的优化方法和装置制造方法及图纸

技术编号：21893112 阅读：163 留言：0更新日期：2019-08-17 14:58

本发明专利技术涉及图像处理的技术领域，本发明专利技术提供一种识别模型的优化方法和装置，所述方法包括获取识别模型在生产中待识别的第一字段图片；将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。本发明专利技术避免了不能在短时间内不能获取可信度高的训练字段图片的问题，保证及时对所述识别模型的训练样本进行更新，提升了所述识别模型的识别能力。

Optimizing Method and Device of Recognition Model

全部详细技术资料下载

【技术实现步骤摘要】
识别模型的优化方法和装置
本专利技术涉及图像处理的
，具体而言，本专利技术涉及一种识别模型的优化方法和装置。
技术介绍
随着智能识别发展的趋势，文字智能识别已经运用至各领域中。目前，文字识别技术主要是通过训练字段识别模型，然后再对目标字段进行识别。但是，生成字段识别模型常常受限于业务方提供的数据，且难以在短时间内完成对字段识别模型进行优化，不利于提高识别模型的识别度。
技术实现思路
为克服以上技术问题，特别是现有技术中识别模型常常受限于业务方提供的数据的问题，特提出以下技术方案：第一方面，本专利技术提供一种识别模型的优化方法，包括以下步骤：获取识别模型在生产中待识别的第一字段图片；将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。在其中一个实施例中，所述标注信息包括所述第一字段图片的标注编码和众包平台对带有标注编码的第一字段图片的第一识别结果；所述根据所述第一字段图片的标注信息，获取训练字段图片的步骤包括：根据所述标注编码对对应的字段图片的所述第一识别结果进行编码；根据编码的结果，为所述第一识别结果分配对应的标注编码，得到的完成识别的第一字段图片作为训练字段图片。在其中一个实施例中，所述将所述训练字段图片添加至所述识别模型的训练数据集中的步骤前，还包括：对所述第一字段图片进行数据增强处理，得到第...

【技术保护点】
1.一种识别模型的优化方法，其特征在于，包括以下步骤：获取识别模型在生产中待识别的第一字段图片；将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。

【技术特征摘要】
1.一种识别模型的优化方法，其特征在于，包括以下步骤：获取识别模型在生产中待识别的第一字段图片；将所述第一字段图片发送至众包平台进行标注，得到对应的标注信息；其中，所述众包平台的用户对所述第一字段图片进行识别标注；定期接收所述众包平台返回的第一字段图片的标注信息，根据所述第一字段图片的标注信息，获取训练字段图片；将所述训练字段图片添加至所述识别模型的训练数据集中，并利用所述训练数据集对所述识别模型进行优化。2.根据权利要求1所述的方法，其特征在于，所述标注信息包括所述第一字段图片的标注编码和众包平台对带有标注编码的第一字段图片的第一识别结果；所述根据所述第一字段图片的标注信息，获取训练字段图片的步骤包括：根据所述标注编码对对应的第一字段图片的所述第一识别结果进行编码；根据编码的结果，为所述第一识别结果分配对应的标注编码，得到完成识别的第一字段图片作为训练字段图片。3.根据权利要求2所述的方法，其特征在于，所述将所述训练字段图片添加至所述识别模型的训练数据集中的步骤前，还包括：对所述第一字段图片进行数据增强处理，得到第二字段图片；将所述第二字段图片发送至所述众包平台进行标注，根据对应的标注编码获取所述第二字段图片的第二识别结果；将所述第一识别结果与所述第二识别结果进行比较；若两者一致，则将所述第二字段图片作为训练字段图片。4.根据权利要求3所述的方法，其特征在于，所述对所述第一字段图片进行数据增强处理，得到第二字段图片的步骤，包括：对所述第一字段图片进行有效内容的识别，确定所述第一字段图片的第一有效区域；在所述第一有效区域的边界外对所述第一字段图片进行裁剪；其中，裁剪得到的区域边框为检测框；将所述检测框向内缩减若干个像素，得到第二有效区域，根据所述第二有效区域截取第二字段图片；其中...

【专利技术属性】
技术研发人员：许洋，刘鹏，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人