基于孤立森林的开集识别方法、装置、设备及存储介质制造方法及图纸

技术编号：38248059 阅读：13 留言：0更新日期：2023-07-25 18:07

本发明专利技术提供了一种基于孤立森林的开集识别方法、装置、设备及存储介质，属于计算机视觉技术领域。开集识别方法包括：构建基于孤立森林的开集识别模型，开集识别模型中包含图像识别模型和孤立森林模型；将待识别图像输入图像识别模型中获取图像的类别向量和低维表示；将图像的低维表示输入孤立森林模型中获取决策路径长度；利用决策路径长度剔除异常图像，利用图像的类别向量判断该图像的类别。本发明专利技术所提供的开集识别算法结合了图像识别模型和孤立森林模型，能够剔除未知类别的图像，也能识别正常图像的具体类别，处理效率高；图像识别模型能够将图像数据处理为孤立森林模型能够处理的低维数据，能够提高孤立森林模型的效率、准确性和泛化能力。准确性和泛化能力。准确性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
基于孤立森林的开集识别方法、装置、设备及存储介质

[0001]本专利技术属于计算机视觉
，具体涉及一种基于孤立森林的开集识别方法、装置、设备及存储介质。

技术介绍

[0002]常规的机器学习分类模型属于封闭集识别（Closed Set Recognition）任务，只能对已知类别给出是与否的判断，实际使用过程中会把未知类型数据识别成已知的某类数据，这会极大的影响模型的识别效果。与封闭集识别对应的为开集识别（Open Set Recognition），与传统的封闭集识别不同，封闭集识别假设所有的测试样本都来自于已知的类别，而开集识别则要求模型能够在测试时识别出未知类别的样本。
[0003]由于开集识别能够检测并拒绝未知类别的样本，因此可以将开集识别作为机器学习算法的补充算法，预先识别并拒绝未知类型数据，能够避免机器学习分类模型将未知类别的样本误判为已知类别的样本，从而提高机器学习分类模型的识别率。开集识别能够应用于如猫狗图片识别、设备缺陷外观检测、欺诈邮件检测等多种机器学习分类任务中。但现有开集识别算法在处理图像数据时效率不佳。

技术实现思路

[0004]本专利技术所要解决的技术问题是，针对现有技术的不足，提供一种基于孤立森林的开集识别方法、装置、设备及存储介质。
[0005]为解决上述技术问题，本专利技术所采用的技术方案是：一种基于孤立森林的开集识别方法，包括：构建基于孤立森林的开集识别模型，所述开集识别模型中包含图像识别模型和孤立森林模型；将待识别图像输入图像识别模型中获取图像...

【技术保护点】

【技术特征摘要】
1.一种基于孤立森林的开集识别方法，其特征在于：所述识别方法包括：构建基于孤立森林的开集识别模型，所述开集识别模型中包含图像识别模型和孤立森林模型；将待识别图像输入图像识别模型中获取图像的类别向量和低维表示；将图像的低维表示输入孤立森林模型中获取决策路径长度；利用决策路径长度剔除异常图像，利用图像的类别向量判断图像的类别。2.根据权利要求1所述的基于孤立森林的开集识别方法，其特征在于：所述开集识别模型的构建方法包括：构建样本图像集、构建图像识别模型、构建孤立森林模型。3.根据权利要求2所述的基于孤立森林的开集识别方法，其特征在于：所述图像识别模型包括：主干网络、卷积网络、全连接层、多个线性变换层和结果层。4.根据权利要求3所述的基于孤立森林的开集识别方法，其特征在于：所述低维表示为所有所述线性变换层单层1D池化结果的拼接向量。5.根据权利要求3所述的基于孤立森林的开集识别方法，其特征在于：所述类别向量为所述结果层的输出。6.根据权利要求1所述的基于孤立森林的开集识别方法，其特征在于：利用决策路径长度剔除异常图像的方法包括：如果决策路径过短，则剔除该图像。7.根据权利要求1所述的...

【专利技术属性】
技术研发人员：井友鼎，崔磊，杜创胜，路利光，王亚勇，黄加军，邓攀，郝增财，马庆伟，王旭峰，
申请(专利权)人：河南合众伟奇云智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人