预标注模型训练、证件预标注方法、装置、设备及介质制造方法及图纸

技术编号:28785316 阅读:18 留言:0更新日期:2021-06-09 11:20
本发明专利技术涉及人工智能的分类模型领域,提供一种预标注模型训练、证件预标注方法、装置、设备及介质,方法包括:通过获取目标标注类别、目标描述、模型性能参数和图像样本集;运用文本相似度技术,在目标分类识别库中爬取待迁移类别;通过模拟目标识别技术,从目标分类识别库中查找待迁移模型,以及识别出的各图像样本的目标区域;进行目标微调得到微调区域,并将图像样本、微调区域和目标标注类别输入待迁移模型中;运用迁移学习技术,获取标注出目标标注区域;根据目标标注区域和微调区域,确定损失值;训练待迁移模型直至训练完成得到预标注模型。本发明专利技术实现了零标注的图像样本集自动训练,并获得预标注模型,减少了人工标注时间和工作量。工作量。工作量。

【技术实现步骤摘要】
预标注模型训练、证件预标注方法、装置、设备及介质


[0001]本专利技术涉及人工智能的分类模型领域,尤其涉及一种预标注模型训练、证件预标注方法、装置、计算机设备及存储介质。

技术介绍

[0002]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,计算机视觉技术(CV,Computer Vision)是一门研究如何使机器“看”的科学,通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别文字识别(OCR,Optical Character Recognition)等技术。
[0003]而随着人工智能技术逐渐成熟,图像识别技术越来越广泛地应用到日常生活中。为了得到识别精确更高的图像识别模型,需要通过大量的已标注样本对图像识别模型进行训练,而在现有技术中在构建训练样本时,通常采用手动输入等人工标注的方式实现,不仅耗费人力成本,还大大降低了样本的标注效率,给模型训练上带来了极大的困难。

技术实现思路

[0004]本专利技术提供一种预标注模型训练、证件预标注方法、装置、计算机设备及存储介质,实现了通过文本相似度技术、爬取技术和模拟目标识别技术和迁移学习技术,能够进行零标注的图像样本集自动训练,减少了人工标注时间和工作量,提高了标注效率,节省了投入成本,提高了预标注的准确性。
[0005]一种预标注模型训练方法,包括:
[0006]获取目标标注类别、与所述目标标注类别对应的目标描述、模型性能参数和图像样本集;所述图像样本集包括至少一个图像样本;所述图像样本与所述目标标注类别对应;
[0007]运用文本相似度技术,在目标分类识别库中爬取与所述目标描述相似的历史类别,将爬取到的所述历史类别确定为待迁移类别;
[0008]通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域;
[0009]对所有所述目标区域进行目标微调,得到与各所述图像样本对应的微调区域,并将所述图像样本、与所述图像样本对应的所述微调区域和所述目标标注类别输入所述待迁移模型中;所述待迁移模型包含迁移参数;
[0010]运用迁移学习技术,通过所述待迁移模型自适应学习目标类别特征的提取,获取所述待迁移模型标注出与所述图像样本对应的目标标注区域;
[0011]根据与所述图像样本对应的所述目标标注区域和所述微调区域,确定损失值;
[0012]在所述损失值未达到预设的收敛条件时,迭代更新所述待迁移模型的迁移参数,直至所述损失值达到所述预设的收敛条件时,将收敛之后的所述待迁移模型记录为训练完
成的预标注模型。
[0013]一种证件预标注方法,包括:
[0014]接收到图像标注指令,获取所述图像标注指令中的证件图像;
[0015]所述证件图像输入如上述预标注模型训练方法训练完成的证件预标注模型,通过所述证件预标注模型提取学习的证件特征,获取所述证件预标注模型根据所述证件特征输出的标注结果;所述证件预标注模型为通过将证件作为目标标注类别、证件描述作为目标描述、预设的证件模型性能参数和历史收集的证件照片作为图像样本集进行训练的模型;所述标注结果标注出所述证件图像中的含有证件的区域。
[0016]一种预标注模型训练装置,包括:
[0017]获取模块,用于获取目标标注类别、与所述目标标注类别对应的目标描述、模型性能参数和图像样本集;所述图像样本集包括至少一个图像样本;所述图像样本与所述目标标注类别对应;
[0018]爬取模块,用于运用文本相似度技术,在目标分类识别库中爬取与所述目标描述相似的历史类别,将爬取到的所述历史类别确定为待迁移类别;
[0019]识别模块,用于通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域;
[0020]微调模块,用于对所有所述目标区域进行目标微调,得到与各所述图像样本对应的微调区域,并将所述图像样本、与所述图像样本对应的所述微调区域和所述目标标注类别输入所述待迁移模型中;所述待迁移模型包含迁移参数;
[0021]迁移模块,用于运用迁移学习技术,通过所述待迁移模型自适应学习目标类别特征的提取,获取所述待迁移模型标注出与所述图像样本对应的目标标注区域;
[0022]损失模块,用于根据与所述图像样本对应的所述目标标注区域和所述微调区域,确定损失值;
[0023]训练模块,用于在所述损失值未达到预设的收敛条件时,迭代更新所述待迁移模型的迁移参数,直至所述损失值达到所述预设的收敛条件时,将收敛之后的所述待迁移模型记录为训练完成的预标注模型。
[0024]一种证件预标注装置,包括:
[0025]接收模块,用于接收到图像标注指令,获取所述图像标注指令中的证件图像;
[0026]标注模块,用于所述证件图像输入如上述预标注模型训练方法训练完成的证件预标注模型,通过所述证件预标注模型提取学习的证件特征,获取所述证件预标注模型根据所述证件特征输出的标注结果;所述证件预标注模型为通过将证件作为目标标注类别、证件描述作为目标描述、预设的证件模型性能参数和历史收集的证件照片作为图像样本集进行训练的模型;所述标注结果标注出所述证件图像中的含有证件的区域。
[0027]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述预标注模型训练方法的步骤,或者所述处理器执行所述计算机程序时实现上述证件预标注方法的步骤。
[0028]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述预标注模型训练方法的步骤,或者所述计算机程序
被处理器执行所述计算机程序时实现上述证件预标注方法的步骤。
[0029]本专利技术提供的预标注模型训练方法、装置、计算机设备及存储介质,通过获取目标标注类别、与所述目标标注类别对应的目标描述、模型性能参数和图像样本集;运用文本相似度技术,在目标分类识别库中爬取与所述目标描述相似的历史类别,将爬取到的所述历史类别确定为待迁移类别;通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域;对所有所述目标区域进行目标微调,得到与各所述图像样本对应的微调区域,并将所述图像样本、与所述图像样本对应的所述微调区域和所述目标标注类别输入所述待迁移模型中;运用迁移学习技术,通过所述待迁移模型自适应学习目标类别特征的提取,获取所述待迁移模型标注出目标标注区域;根据所述目标标注区域和所述微调区域,确定损失值;在所述损失值未达本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预标注模型训练方法,其特征在于,包括:获取目标标注类别、与所述目标标注类别对应的目标描述、模型性能参数和图像样本集;所述图像样本集包括至少一个图像样本;所述图像样本与所述目标标注类别对应;运用文本相似度技术,在目标分类识别库中爬取与所述目标描述相似的历史类别,将爬取到的所述历史类别确定为待迁移类别;通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域;对所有所述目标区域进行目标微调,得到与各所述图像样本对应的微调区域,并将所述图像样本、与所述图像样本对应的所述微调区域和所述目标标注类别输入所述待迁移模型中;所述待迁移模型包含迁移参数;运用迁移学习技术,通过所述待迁移模型自适应学习目标类别特征的提取,获取所述待迁移模型标注出与所述图像样本对应的目标标注区域;根据与所述图像样本对应的所述目标标注区域和所述微调区域,确定损失值;在所述损失值未达到预设的收敛条件时,迭代更新所述待迁移模型的迁移参数,直至所述损失值达到所述预设的收敛条件时,将收敛之后的所述待迁移模型记录为训练完成的预标注模型。2.如权利要求1所述的预标注模型训练方法,其特征在于,所述通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域,包括:在所述目标分类识别库中查找到与所述待迁移类别关联的目标检测深度模型集合;所述目标检测深度模型集合包括至少一个目标检测深度模型;将各所述图像样本输入各所述目标检测深度模型中,通过各所述目标检测深度模型对各所述图像样本进行目标识别,获取各所述目标检测深度模型识别出与各所述图像样本对应的所述目标区域,以及输出与各所述目标区域一一对应的预测性能参数;根据所有所述目标区域和所述预测性能参数,确定出与所述模型性能参数匹配的所述目标检测深度模型,并将与所述模型性能参数匹配的所述目标检测深度模型确定为待迁移模型。3.如权利要求2所述的预标注模型训练方法,其特征在于,所述根据所有所述目标区域和所述预测性能参数,确定出与所述模型性能参数匹配的所述目标检测深度模型,并将与所述模型性能参数匹配的所述目标检测深度模型确定为待迁移模型,包括:对与相同的所述图像样本对应的所有所述目标区域进行交集分析,得到与该图像样本对应的交集区域,并根据与各所述图像样本对应的交集区域和各所述目标区域,确定出与各所述图像样本对应的各所述目标检测深度模型的中标率;根据对同一个所述目标检测深度模型的所述中标率,确定出与该目标检测深度模型对应的目标指数权重,同时根据对同一个所述目标检测深度模型输出的所述预测性能参数,预测出与该目标检测深度模型对应的最终预测性能参数;根据所述模型性能参数、与各所述目标检测深度模型对应的所述目标指数权重和所述最终预测性能参数,得到与各所述目标检测深度模型对应的中标系数;
将与最大的所述中标系数对应的所述目标检测深度模型确定为所述待迁移模型。4.如权利要求3所述的预标注模型训练方法,其特征在于,所述根据所述模型性能参数、与各所述目标检测深度模型对应的所述目标指数权重和所述最终预测性能参数,得到与各所述目标检测深度模型对应的中标系数,包括:将所述模型性能参数和与各所述目标检测深度模型对应的所述最终预测性能参数相除,得到与各所述目标检测深度模型对应的性能比值;将与相同的所述目标检测深度模型对应的所述性能比值和所述目标指数权重相乘,得到与各...

【专利技术属性】
技术研发人员:王晟宇
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1