一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统技术方案

技术编号：38862436 阅读：14 留言：0更新日期：2023-09-17 10:04

本发明专利技术涉及一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统，包括：图片预处理：对图片执行裁剪、旋转和转置等操作，将野山参方向进行归一化；图片增广：对图片执行背景替换、翻转等操作，提升输入特征，增加模型鲁棒性；搭建网络模型并训练：输入野山参图片，提取野山参特征矩阵；网络输出后处理：对模型输出的野山参特征矩阵进行拼接、归一化，选取最大索引作为标签值；模型评估：使用验证集评估模型的性能；推理部署：将模型进行推理部署，提升推理性能。本发明专利技术将人工神经网络加入野山参等级鉴定技术中，极大提升等级鉴定的泛化能力，提高了模型的鲁棒性。本发明专利技术所提供的方法简单、高效、可复用，可降低人工成本、时间成本。间成本。间成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统

[0001]本专利技术属于图像处理及应用
，涉及一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法及系统。

技术介绍

[0002]野山参一般几十年、上百年不等，是生长于深山密林的原生态人参，是参中之最，人参皂苷含量最高，数量极其稀少。野山参具备大补元气、益气生血、消炎抗癌、安神健体、养颜益寿、黑发防脱、治糖尿病等药用功效。不同生长年份、不同生长环境、不同形体的野山参可以鉴定为不同等级，不同等级野山参的药用功效、经济价值亦是截然不同。目前主要根据形态学、显微特征和理化性状等对人参品种进行鉴别。
[0003]在行业中，做到准确、快速鉴定野山参等级关键是快速、准确提取野山参五行六体的特征同时鉴定等级。目前，人工智能技术运用越来越广泛，将人工智能技术运用于野山参等级鉴定能显著提高鉴定效率和精确度。以人工智能的泛化能力和鲁棒性提取野山参形体特征，也是野山参等级鉴定由人工向数字化技术转变得以实现的关键所在。目前采用人工智能技术开展野山参等级鉴定的现有技术中，存在着定位速度慢、定位不准确、鉴定模型缺乏普适性等问题。例如，目前采用人工智能方法对形体差异化明显的野山参进行等级鉴定主要会面对以下几个难点：1)野山参等级鉴定是通过鉴定野山参五行六体特征实现的，如何快速定位，重点关注其五行六体特征，是实现准确鉴定的第一个难点。2)野山形体参良莠不齐，其五行六体特征尺寸大小不等，在野山参等级鉴定等级中，如何快速提取不同视觉尺度的五行六体特征，是第二个难点。3)野山...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法，其特征在于：该方法包括以下步骤：S1、图片预处理：对图片执行包括裁剪、旋转和转置在内的操作，将野山参方向进行归一化；S2、图片增广：对图片执行包括背景替换、翻转在内的操作，提升输入特征，增加模型鲁棒性；S3、搭建网络模型并训练：输入野山参图片，提取野山参特征矩阵；S4、网络输出后处理：对模型输出的野山参特征矩阵进行拼接、归一化，选取最大索引作为标签值，使用多尺度输出，对等级数量取模，最后得到真正的等级值；S5、模型评估：使用验证集评估模型的性能；S6、推理部署：将模型进行推理部署，提升推理性能。2.根据权利要求1所述的一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法，其特征在于：在步骤S1中，图像输入模型之前，对输入的图片进行预处理，具体包括：S11、从本地读取图片；S12、转为灰度图，采用通道法，并选择G通道作为灰度图；S13、进行二值化操作，对上一步骤中的灰度图，像素值大于等于90点，设置为255，小于90的点设置为0，此刻，将得到一张仅包含0、255两种像素的黑白图片；S14、目标区域识别，选取步骤S13中的图片，提取最大的白色区域，作为野山参的特征区域；S15、提取步骤S14中野山参特征区域的坐标点，选择左上角最小索引、右下角最大索引，得到一个矩形区域的对角坐标点；S16、裁剪山参目标，通过步骤S15的对角线坐标点，在第S11步读取的图片中截取矩形区域，此刻，得到的就是去除多余背景，包含山参的图片；S17、比较第S16步骤中结果图片的高、宽，如果高小于宽，则将图片做一次转置，反之，跳过这一步；S18、通过上一步的比较计算，保存一张高大于宽的图片，此刻，得到一张野山参竖直放置于的图片数据。3.根据权利要求2所述的一种基于注意力机制特征金字塔网络下的野山参等级鉴定方法，其特征在于：在步骤S2中，采用数据增广方式增加可使用的数据量，具体包括以下步骤：S21、读取裁剪后的图片；S22、转为灰度图，采用通道法，并选择G通道作为灰度图；S23、进行二值化操作，对上一步骤中的灰度图，像素值大于等于200的点，设置为1，小于200的点设置为0，此刻，将得到一张仅包含0、1两种像素，高宽与输入图像一致的单通道特征矩阵；S24、遍历第S23步所得的特征矩阵，获取像素值等于1的索引，改变第S21步所读取图片所有通道的像素值，...

【专利技术属性】
技术研发人员：刘太林，
申请(专利权)人：沪渝人工智能研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人