样本类别识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26172925 阅读:39 留言:0更新日期:2020-10-31 13:53
本发明专利技术涉及人工智能领域,本发明专利技术公开了一种样本类别识别方法、装置、计算机设备及存储介质,所述方法包括:获取待识别样本;输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;在与所有第一样本类别均不匹配时,将样本特征空间结果和样本语义空间结果输入至第二样本检测模型中;对样本特征空间结果进行聚类处理得到第一异常结果,并对样本语义空间结果进行相似度匹配得到第二异常结果;输出待识别样本的样本类别。本发明专利技术实现了自动识别样本类别,节省人工成本,提高识别准确率。本发明专利技术适用于智慧交通或智慧医疗等领域,可进一步推动智慧城市的建设,本发明专利技术还涉及区块链技术,第一样本检测模型可存储于区块链中。

Sample type identification method, device, computer equipment and storage medium

【技术实现步骤摘要】
样本类别识别方法、装置、计算机设备及存储介质
本专利技术涉及人工智能的图像分类领域,尤其涉及一种样本类别识别方法、装置、计算机设备及存储介质。
技术介绍
目前,随着科技的发展,在生活中图形识别的应用已经越来越普遍。在图像识别中要想得到比较好的识别效果就必须需要每一种类的大量样本图像来进行训练。但是,对于大量收集每一种类的训练样本在实际应用中往往很难实现,特别是对一种含有已知描述且难以收集的异常种类或者新的种类进行识别时,很难收集到这些种类的图像作为样本来进行训练,因为都是靠人工识别出这些异常种类或者新的种类,并且出现的概率极低(是由于需要靠破坏性实验得出或者需耗费代价成本高得出等等),导致无法训练出可以准确识别出上述种类的模型,还需要花费较高的人工成本进行识别分类,所以在零样本的识别问题上就显得极为重要,而且这个问题越来越受到工业界的关注。比如,在零件质检上,正常零件、断裂零件的图像容易收集,出现轻微裂痕、轻微凹陷、内部断裂等异常情况的零件的图像就难于收集,识别结果不佳;在车辆定损识别上,划痕、刮擦、撕裂、凹陷的车辆损伤照片容易收集,出现褶皱、死折、缺失等严重损伤的车辆损伤照片就难于收集,定损识别就不佳;在医学影像检验上,肺部正常、肺炎、肺积水等常见的X光片容易收集,但是肺结核早期、肺癌早期等罕见的X光片就难于收集,肺部医学检测不佳等等。
技术实现思路
本专利技术提供一种样本类别识别方法、装置、计算机设备及存储介质,实现了通过基于端到端的第一样本检测模型和基于零样本学习的第二样本检测模型,自动识别出待识别样本的样本类别,本专利技术适用于智慧交通或智慧医疗等领域,可进一步推动智慧城市的建设,从而减少了人工识别的成本,并且提高了识别准确率。一种样本类别识别方法,包括:获取待识别样本;将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。一种样本类别识别装置,包括:获取模块,用于获取待识别样本;识别模块,用于将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;匹配模块,用于在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;异常模块,用于通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;输出模块,用于根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述样本类别识别方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述样本类别识别方法的步骤。本专利技术提供的样本类别识别方法、装置、计算机设备及存储介质,通过获取待识别样本;将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出,如此,实现了首先通过端到端的第一样本检测模型对待识别样本进行识别,在第一样本检测模型输出的第一样本检测结果与第一样本类别不匹配时,根据样本特征空间结果与样本语义空间结果之间的关联关系,通过基于零样本学习的第二样本检测模型,识别出待识别样本的样本类别,从而能够自动对难以收集或者新的样本类别的样本进行准确的样本类别识别,减少了人工识别的成本,自动给难以收集或者新的样本类别的样本标注样本类别,节省了人工成本,并且提高了识别准确率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中样本类别识别方法的应用环境示意图;图2是本专利技术一实施例中样本类别识别方法的流程图;图3是本专利技术另一实施例中样本类别识别方法的流程图;图4是本专利技术一实施例中样本类别识别方法的步骤S20的流程图;图5是本专利技术一实施例中样本类别识别方法的步骤S206的流程图;图6是本专利技术一实施例中样本类别识别方法的步骤S2063的流程图;图7是本专利技术一实施例中样本类别识别方法的步骤S40的流程图;图8是本专利技术一实施例中样本类别识别装置的原理框图;图9是本专利技术一实施例中计算机设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供的样本类别识别方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一实施例中,如图2所示,提供一种样本类别识别方法,其技术方案主要包括以下步骤S10-S50:S10,获取待识别样本。可理解地,在对收集的样本进行识别样本类别的应用场景下触发样本识别请求,获取所述样本识别请求中的所述待识别样本,所述应用场景可以根据需求设定,比如在汽车零件的质检上对收集的零件样本图像进行识别,或者在车辆定损上对用于训练定损识别模型的样本进行识别,或者在医学影像检验上对用于训练肺部识别模型的样本进行识别等等,所述待识别样本为需要进本文档来自技高网...

【技术保护点】
1.一种样本类别识别方法,其特征在于,包括:/n获取待识别样本;/n将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;/n在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;/n通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;/n根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。/n

【技术特征摘要】
1.一种样本类别识别方法,其特征在于,包括:
获取待识别样本;
将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果;所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果;
在所述第一样本检测结果与所有第一样本类别均不匹配时,则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中;
通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理,得到第一异常结果,同时对所述样本语义空间结果进行相似度匹配,得到第二异常结果;
根据所述第一异常结果和所述第二异常结果,确定所述待识别样本的样本类别并输出。


2.如权利要求1所述的样本类别识别方法,其特征在于,所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别,得到待处理样本识别结果之后,还包括:
在所述第一样本检测结果与任一所述第一样本类别匹配时,将匹配的所述第一样本类别确定为所述待识别样本的样本类别。


3.如权利要求1所述的样本类别识别方法,其特征在于,所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别之前,包括:
获取训练样本集;所述训练样本集包含多个训练样本,一个所述训练样本与一个第一样本类别以及一个第一样本描述关联;
将所述训练样本输入含有初始参数的多分支卷积神经网络模型;
通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取,得到图像特征空间结果;
通过所述多分支卷积神经网络模型中的嵌入空间模型对所述图像特征空间结果进行语义特征识别,得到语义特征空间结果;所述嵌入空间模型为通过构建图像特征向量与语义特征向量之间的关联关系获得;
通过K-means聚类算法,对所述图像特征空间结果进行识别,得到训练类别结果,并将所述训练类别结果、所述图像特征空间结果和所述语义特征空间结果确定为样本训练结果;
根据所述图像特征空间结果和与所述训练样本对应的所述第一样本类别,得到第一损失值;根据所述语义特征空间结果和与所述训练样本对应的所述第一样本描述,得到第二损失值;
根据所述第一损失值和所述第二损失值,得到总损失值;
在所述总损失值未达到预设的收敛条件时,迭代更新所述多分支卷积神经网络模型的初始参数,并触发所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取,得到图像特征空间结果的步骤,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。


4.如权利要求3所述的样本类别识别方法,其特征在于,所述将所述训练样本输入含有初始参数的多分支卷积神经网络模型之前,包括:
通过迁移学习,获取训练完成的无监督域训练模型的所有迁移参数,将所有所述迁移参数确定为所述多分支卷积神经网络模型中的所述初始参数。

<...

【专利技术属性】
技术研发人员:吴海萍陶蓉徐尚良张芮溟周鑫
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1