【技术实现步骤摘要】
预标注模型训练、证件预标注方法、装置、设备及介质
[0001]本专利技术涉及人工智能的分类模型领域,尤其涉及一种预标注模型训练、证件预标注方法、装置、计算机设备及存储介质。
技术介绍
[0002]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,计算机视觉技术(CV,Computer Vision)是一门研究如何使机器“看”的科学,通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别文字识别(OCR,Optical Character Recognition)等技术。
[0003]而随着人工智能技术逐渐成熟,图像识别技术越来越广泛地应用到日常生活中。为了得到识别精确更高的图像识别模型,需要通过大量的已标注样本对图像识别模型进行训练,而在现有技术中在构建训练样本时,通常采用手动输入等人工标注的方式实现,不仅耗费人力成本,还大大降低了样本的标注效率,给模型训练上带来了极大的困难。
技术实现思路
[0004]本专利技术提供一种预标注模型训练、证件预标注方法、装置、计算机设备及存储介质,实现了通过文本相似度技术、爬取技术和模拟目标识别技术和迁移学习技术,能够进行零标注的图像样本集自动训练,减少了人工标注时间和工作量,提高了标注效率,节省了投入成本,提高了预标注的准确性。
[0005]一种预标注模型训练方法,包括:
[0006]获取目标标 ...
【技术保护点】
【技术特征摘要】
1.一种预标注模型训练方法,其特征在于,包括:获取目标标注类别、与所述目标标注类别对应的目标描述、模型性能参数和图像样本集;所述图像样本集包括至少一个图像样本;所述图像样本与所述目标标注类别对应;运用文本相似度技术,在目标分类识别库中爬取与所述目标描述相似的历史类别,将爬取到的所述历史类别确定为待迁移类别;通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域;对所有所述目标区域进行目标微调,得到与各所述图像样本对应的微调区域,并将所述图像样本、与所述图像样本对应的所述微调区域和所述目标标注类别输入所述待迁移模型中;所述待迁移模型包含迁移参数;运用迁移学习技术,通过所述待迁移模型自适应学习目标类别特征的提取,获取所述待迁移模型标注出与所述图像样本对应的目标标注区域;根据与所述图像样本对应的所述目标标注区域和所述微调区域,确定损失值;在所述损失值未达到预设的收敛条件时,迭代更新所述待迁移模型的迁移参数,直至所述损失值达到所述预设的收敛条件时,将收敛之后的所述待迁移模型记录为训练完成的预标注模型。2.如权利要求1所述的预标注模型训练方法,其特征在于,所述通过模拟目标识别技术,从所述目标分类识别库中查找到与所述待迁移类别和所述模型性能参数匹配的待迁移模型,以及通过所述待迁移模型识别出的各所述图像样本的目标区域,包括:在所述目标分类识别库中查找到与所述待迁移类别关联的目标检测深度模型集合;所述目标检测深度模型集合包括至少一个目标检测深度模型;将各所述图像样本输入各所述目标检测深度模型中,通过各所述目标检测深度模型对各所述图像样本进行目标识别,获取各所述目标检测深度模型识别出与各所述图像样本对应的所述目标区域,以及输出与各所述目标区域一一对应的预测性能参数;根据所有所述目标区域和所述预测性能参数,确定出与所述模型性能参数匹配的所述目标检测深度模型,并将与所述模型性能参数匹配的所述目标检测深度模型确定为待迁移模型。3.如权利要求2所述的预标注模型训练方法,其特征在于,所述根据所有所述目标区域和所述预测性能参数,确定出与所述模型性能参数匹配的所述目标检测深度模型,并将与所述模型性能参数匹配的所述目标检测深度模型确定为待迁移模型,包括:对与相同的所述图像样本对应的所有所述目标区域进行交集分析,得到与该图像样本对应的交集区域,并根据与各所述图像样本对应的交集区域和各所述目标区域,确定出与各所述图像样本对应的各所述目标检测深度模型的中标率;根据对同一个所述目标检测深度模型的所述中标率,确定出与该目标检测深度模型对应的目标指数权重,同时根据对同一个所述目标检测深度模型输出的所述预测性能参数,预测出与该目标检测深度模型对应的最终预测性能参数;根据所述模型性能参数、与各所述目标检测深度模型对应的所述目标指数权重和所述最终预测性能参数,得到与各所述目标检测深度模型对应的中标系数;
将与最大的所述中标系数对应的所述目标检测深度模型确定为所述待迁移模型。4.如权利要求3所述的预标注模型训练方法,其特征在于,所述根据所述模型性能参数、与各所述目标检测深度模型对应的所述目标指数权重和所述最终预测性能参数,得到与各所述目标检测深度模型对应的中标系数,包括:将所述模型性能参数和与各所述目标检测深度模型对应的所述最终预测性能参数相除,得到与各所述目标检测深度模型对应的性能比值;将与相同的所述目标检测深度模型对应的所述性能比值和所述目标指数权重相乘,得到与各...
【专利技术属性】
技术研发人员:王晟宇,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。