一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统技术方案

技术编号:38862436 阅读:14 留言:0更新日期:2023-09-17 10:04
本发明专利技术涉及一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统,包括:图片预处理:对图片执行裁剪、旋转和转置等操作,将野山参方向进行归一化;图片增广:对图片执行背景替换、翻转等操作,提升输入特征,增加模型鲁棒性;搭建网络模型并训练:输入野山参图片,提取野山参特征矩阵;网络输出后处理:对模型输出的野山参特征矩阵进行拼接、归一化,选取最大索引作为标签值;模型评估:使用验证集评估模型的性能;推理部署:将模型进行推理部署,提升推理性能。本发明专利技术将人工神经网络加入野山参等级鉴定技术中,极大提升等级鉴定的泛化能力,提高了模型的鲁棒性。本发明专利技术所提供的方法简单、高效、可复用,可降低人工成本、时间成本。间成本。间成本。

【技术实现步骤摘要】
一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统


[0001]本专利技术属于图像处理及应用
,涉及一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统。

技术介绍

[0002]野山参一般几十年、上百年不等,是生长于深山密林的原生态人参,是参中之最,人参皂苷含量最高,数量极其稀少。野山参具备大补元气、益气生血、消炎抗癌、安神健体、养颜益寿、黑发防脱、治糖尿病等药用功效。不同生长年份、不同生长环境、不同形体的野山参可以鉴定为不同等级,不同等级野山参的药用功效、经济价值亦是截然不同。目前主要根据形态学、显微特征和理化性状等对人参品种进行鉴别。
[0003]在行业中,做到准确、快速鉴定野山参等级关键是快速、准确提取野山参五行六体的特征同时鉴定等级。目前,人工智能技术运用越来越广泛,将人工智能技术运用于野山参等级鉴定能显著提高鉴定效率和精确度。以人工智能的泛化能力和鲁棒性提取野山参形体特征,也是野山参等级鉴定由人工向数字化技术转变得以实现的关键所在。目前采用人工智能技术开展野山参等级鉴定的现有技术中,存在着定位速度慢、定位不准确、鉴定模型缺乏普适性等问题。例如,目前采用人工智能方法对形体差异化明显的野山参进行等级鉴定主要会面对以下几个难点:1)野山参等级鉴定是通过鉴定野山参五行六体特征实现的,如何快速定位,重点关注其五行六体特征,是实现准确鉴定的第一个难点。2)野山形体参良莠不齐,其五行六体特征尺寸大小不等,在野山参等级鉴定等级中,如何快速提取不同视觉尺度的五行六体特征,是第二个难点。3)野山参生长参差不齐,其五行六体特征不尽相同,在野山参等级鉴定等级中,如何通过有限的数据,建立具备普适性的野山参等级鉴定模型是第三个难点。
[0004]因此,目前急需一种能克服现有技术中上述问题并能解决相应技术难点的野山参等级鉴定技术。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统,本方案主要采用了以下技术手段:
[0006]1)注意力机制人工神经网络,实现快速定位,重点关注野山参五行六体特征。
[0007]注意力机制是从大量信息中筛选出少量重要信息,同时聚焦到重要特征信息上,忽略无关紧要的冗余信息。
[0008]本专利技术使用基于通道和空间的注意力机制,网络中全局平均池化对野山参特征图上的每一个像素点都有反馈,而全局最大池化在进行梯度反向传播计算中,在野山参特征图中响应最大的地方反馈梯度,从而实现快速定位,重点解决野山参五行六体特征这一研究关键技术难点。
[0009]2)特征金字塔人工神经网络,可融合不同视觉尺度的五行六体特征。
[0010]特征金字塔人工神经网络每一层不同尺度的特征图都具有较强的语义信息,能够在增加较少计算量的前提下融合低分辨率语义信息较强的特征图和高分辨率语义信息较弱但空间信息丰富的特征图。独特之处在于,它是在以特征金字塔为基础结构上,将浅层的特征传递到深层,即融合浅层和高层的特征图,同时对每一层级的特征图分别进行预测,以解决卷积神经网络由浅到深,语义信息越来越丰富,但特征图越来越小,分辨率越来越低,深层特征图容易忽略小目标的研究难点。
[0011]3)结合注意力机制人工神经网络和特征金字塔人工神经网络,构建野山参等级鉴定人工神经网络,人工神经网络的泛化能力和鲁棒性可确保本专利技术在野山参等级鉴定中的普适性。
[0012]人工神经网络具备很多亮眼的性能,其中鲁棒性、泛化能力尤为突出。鲁棒性是指在某些参数略微改变或控制量稍微偏离最优值时,系统仍然保持一定稳定性和有效性;泛化能力是指根据有限样本得到的网络模型对其他变量域也有良好的预测能力。两者同时存在于人工神经网络模型中,本专利技术通过手动配置超参数控制、训练网络权重和数据增广,实现野山参等级鉴定模型泛化能力、鲁棒性的优良性能。
[0013]为达到上述目的,本专利技术提供如下技术方案:
[0014]一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法,该方法包括以下步骤:
[0015]S1、图片预处理:对图片执行包括裁剪、旋转和转置在内的操作,将野山参方向进行归一化;
[0016]S2、图片增广:对图片执行包括背景替换、翻转在内的操作,提升输入特征,增加模型鲁棒性;
[0017]S3、搭建网络模型并训练:输入野山参图片,提取野山参特征矩阵;
[0018]S4、网络输出后处理:对模型输出的野山参特征矩阵进行拼接、归一化,选取最大索引作为标签值,使用多尺度输出,对等级数量取模,最后得到真正的等级值;
[0019]S5、模型评估:使用验证集评估模型的性能;本方法采用mAp作为评价指标;
[0020]S6、推理部署:将模型进行推理部署,提升推理性能。
[0021]进一步,在步骤S1中,图像输入模型之前,对输入的图片进行预处理,这样做的目的,是为了减少背景特征区域大小,从而提升野山参特征在输入中的比重,让模型更加专注于提取野山参的特征,减少不必要的计算量,可显著提升推理速度,具体包括:
[0022]S11、从本地读取图片;
[0023]S12、转为灰度图,本步骤有两种方法,彩图转灰度图或选取其中一个通道。本方法采用通道法,并选择G通道作为灰度图;
[0024]S13、进行二值化操作,对上一步骤中的灰度图,像素值大于等于90点,设置为255,小于90的点设置为0,此刻,将得到一张仅包含0、255两种像素的黑白图片;
[0025]S14、目标区域识别,选取步骤S13中的图片,提取最大的白色区域,作为野山参的特征区域;
[0026]S15、提取步骤S14中野山参特征区域的坐标点,选择左上角最小索引、右下角最大索引,得到一个矩形区域的对角坐标点;
[0027]S16、裁剪山参目标,通过步骤S15的对角线坐标点,在第S11步读取的图片中截取矩形区域,此刻,得到的就是去除多余背景,包含山参的图片;
[0028]S17、比较第S16步骤中结果图片的高、宽,如果高小于宽,则将图片做一次转置,反之,跳过这一步;
[0029]S18、通过上一步的比较计算,保存一张高大于宽的图片,此刻,得到一张野山参竖直放置于的图片数据。
[0030]进一步,在步骤S2中,数据采集初期,能够使用的数据通常较少,为了保证模型训练的顺利进行,采用数据增广方式增加可使用的数据量,具体包括以下步骤:
[0031]S21、读取裁剪后的图片;
[0032]S22、转为灰度图,本步骤有2种方法,彩图转灰度图或选取其中一个通道。本方法采用通道法,并选择G通道作为灰度图;
[0033]S23、进行二值化操作,对上一步骤中的灰度图,像素值大于等于200的点,设置为1,小于200的点设置为0,此刻,将得到一张仅包含0、1两种像素,高宽与输入图像一致的单通道特征矩阵;
[0034]S24、遍历第S23步所得的特征矩阵,获取像素值等于1的索引本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法,其特征在于:该方法包括以下步骤:S1、图片预处理:对图片执行包括裁剪、旋转和转置在内的操作,将野山参方向进行归一化;S2、图片增广:对图片执行包括背景替换、翻转在内的操作,提升输入特征,增加模型鲁棒性;S3、搭建网络模型并训练:输入野山参图片,提取野山参特征矩阵;S4、网络输出后处理:对模型输出的野山参特征矩阵进行拼接、归一化,选取最大索引作为标签值,使用多尺度输出,对等级数量取模,最后得到真正的等级值;S5、模型评估:使用验证集评估模型的性能;S6、推理部署:将模型进行推理部署,提升推理性能。2.根据权利要求1所述的一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法,其特征在于:在步骤S1中,图像输入模型之前,对输入的图片进行预处理,具体包括:S11、从本地读取图片;S12、转为灰度图,采用通道法,并选择G通道作为灰度图;S13、进行二值化操作,对上一步骤中的灰度图,像素值大于等于90点,设置为255,小于90的点设置为0,此刻,将得到一张仅包含0、255两种像素的黑白图片;S14、目标区域识别,选取步骤S13中的图片,提取最大的白色区域,作为野山参的特征区域;S15、提取步骤S14中野山参特征区域的坐标点,选择左上角最小索引、右下角最大索引,得到一个矩形区域的对角坐标点;S16、裁剪山参目标,通过步骤S15的对角线坐标点,在第S11步读取的图片中截取矩形区域,此刻,得到的就是去除多余背景,包含山参的图片;S17、比较第S16步骤中结果图片的高、宽,如果高小于宽,则将图片做一次转置,反之,跳过这一步;S18、通过上一步的比较计算,保存一张高大于宽的图片,此刻,得到一张野山参竖直放置于的图片数据。3.根据权利要求2所述的一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法,其特征在于:在步骤S2中,采用数据增广方式增加可使用的数据量,具体包括以下步骤:S21、读取裁剪后的图片;S22、转为灰度图,采用通道法,并选择G通道作为灰度图;S23、进行二值化操作,对上一步骤中的灰度图,像素值大于等于200的点,设置为1,小于200的点设置为0,此刻,将得到一张仅包含0、1两种像素,高宽与输入图像一致的单通道特征矩阵;S24、遍历第S23步所得的特征矩阵,获取像素值等于1的索引,改变第S21步所读取图片所有通道的像素值,...

【专利技术属性】
技术研发人员:刘太林
申请(专利权)人:沪渝人工智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1