【技术实现步骤摘要】
样本类别识别方法、装置、计算机设备及存储介质
本专利技术涉及人工智能的图像分类领域,尤其涉及一种样本类别识别方法、装置、计算机设备及存储介质。
技术介绍
目前,随着科技的发展,在生活中图形识别的应用已经越来越普遍。在图像识别中要想得到比较好的识别效果就必须需要每一种类的大量样本图像来进行训练。但是,对于大量收集每一种类的训练样本在实际应用中往往很难实现,特别是对一种含有已知描述且难以收集的异常种类或者新的种类进行识别时,很难收集到这些种类的图像作为样本来进行训练,因为都是靠人工识别出这些异常种类或者新的种类,并且出现的概率极低(是由于需要靠破坏性实验得出或者需耗费代价成本高得出等等),导致无法训练出可以准确识别出上述种类的模型,还需要花费较高的人工成本进行识别分类,所以在零样本的识别问题上就显得极为重要,而且这个问题越来越受到工业界的关注。比如,在零件质检上,正常零件、断裂零件的图像容易收集,出现轻微裂痕、轻微凹陷、内部断裂等异常情况的零件的图像就难于收集,识别结果不佳;在车辆定损识别上,划痕、刮擦、撕裂、凹陷的车辆损伤照片容易收集,出现褶皱、死折、缺失等严重损伤的车辆损伤照片就难于收集,定损识别就不佳;在医学影像检验上,肺部正常、肺炎、肺积水等常见的X光片容易收集,但是肺结核早期、肺癌早期等罕见的X光片就难于收集,肺部医学检测不佳等等。
技术实现思路
本专利技术提供一种样本类别识别方法、装置、计算机设备及存储介质,实现了通过基于端到端的第一样本检测模型和基于零样本学习的第二样本检测模型,自动识别 ...
【技术保护点】
1.一种样本类别识别方法,其特征在于,包括:/n获取待识别样本;/n将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;/n在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;/n通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;/n根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。/n
【技术特征摘要】
1.一种样本类别识别方法,其特征在于,包括:
获取待识别样本;
将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;
在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;
通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;
根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。
2.如权利要求1所述的样本类别识别方法,其特征在于,所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果之后,还包括:
在所述第一样本检测结果与任一所述第一样本类别匹配时,将匹配的所述第一样本类别确定为所述待识别样本的样本类别。
3.如权利要求1所述的样本类别识别方法,其特征在于,所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别之前,包括:
获取训练样本集;所述训练样本集包含多个训练样本,一个所述训练样本与一个第一样本类别以及一个第一样本描述关联;
将所述训练样本输入含有初始参数的多分支卷积神经网络模型;
通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取,得到图像特征空间结果;
通过所述多分支卷积神经网络模型中的嵌入空间模型对所述图像特征空间结果进行语义特征识别,得到语义特征空间结果;所述嵌入空间模型为通过构建图像特征向量与语义特征向量之间的关联关系获得;
通过K-means聚类算法,对所述图像特征空间结果进行识别,得到训练类别结果,并将所述训练类别结果、所述图像特征空间结果和所述语义特征空间结果确定为样本训练结果;
根据所述图像特征空间结果和与所述训练样本对应的所述第一样本类别,得到第一损失值;根据所述语义特征空间结果和与所述训练样本对应的所述第一样本描述,得到第二损失值;
根据所述第一损失值和所述第二损失值,得到总损失值;
在所述总损失值未达到预设的收敛条件时,迭代更新所述多分支卷积神经网络模型的初始参数,并触发所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取,得到图像特征空间结果的步骤,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。
4.如权利要求3所述的样本类别识别方法,其特征在于,所述将所述训练样本输入含有初始参数的多分支卷积神经网络模型之前,包括:
通过迁移学习,获取训练完成的无监督域训练模型的所有迁移参数,将所有所述迁移参数确定为所述多分支卷积神经网络模型中的所述初始参数。
<...
【专利技术属性】
技术研发人员:吴海萍,陶蓉,徐尚良,张芮溟,周鑫,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。