一种基于神经网络预测容器交互部件属性的方法技术

技术编号:42621595 阅读:26 留言:0更新日期:2024-09-06 01:25
本发明专利技术公开了一种基于神经网络预测容器交互部件属性的方法,包括步骤S1、将所述主干网和头部网的卷积层设置为可变形卷积层,为每个像素点的卷积核在每个位置学习一个偏移量,使得不同的特征图使用不同的卷积核,以自动调整感受野,使网络具备感受不同尺度的物品的能力;步骤S2、采用解耦检测头,将包围框的预测和类别预测分离,实现解耦;步骤S3、构建损失函数训练神经网络,其中使用动态聚焦于普通质量包围框的损失函数度量重叠度损失,降低高质量包围框和低质量包围框对网络优化的影响;步骤S4、制作可打开式容器交互属性感知数据集,用于神经网络训练,丰富数据集,提高模型泛化性,并将训练好的神经网络预测容器交互部件属性。

【技术实现步骤摘要】

本专利技术属于人工智能,具体涉及一种基于神经网络预测容器交互部件属性的方法


技术介绍

1、随着人工智能进入家政服务领域,需要机器人能够识别容器的交互部件,例如把手和开关,现有技术中可以采用yolov7进行交互部件的识别,但采用yolov7常规的常规卷积核、耦合的检测头、ciou损失函数构建神经网络进行智能识别的过程中,存在如下缺陷:

2、常规卷积核:常规的矩形卷积核在目标形状变化比较剧烈的场景中表现不佳,导致网络检测的效果差;

3、耦合的检测头:yolov7使用同一个模块完成边框回归任务和类别分类任务,两者耦合不仅减慢了收敛速度,还降低了检测精度;

4、ciou损失函数:yolov7中使用ciou度量重叠度损失,它对预测包围框和真实包围框的中心点差异和长宽比例差异进行限制,提高了预测的准确性。然而,数据集中常含有低质量的包围框,如果强行限制预测包围框接近低质量包围框,模型的检测效果可能会下降;

5、可打开式容器的数据集:现有的相关数据集未能提供机器人操作所需的完整信息,导致机器人操作时需要额外规划,同时,数本文档来自技高网...

【技术保护点】

1.一种基于神经网络预测容器交互部件属性的方法,神经网络包括主干网和头部网,主干网用于特征提取,头部网对各阶段提取的特征进行融合,并通过检测头进行包围框和类别的预测,其特征在于包括如下步骤:

2.根据权利要求1所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:所述步骤S1中,可变形卷积的计算公式为:

3.根据权利要求2所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:为可变形卷积为卷积核的每个位置学习一个权重系数Δm,Δm∈[0,1],可变形卷积的计算公式为:

4.根据权利要求1所述的一种基于神经网络预测容器交互部件属性的方法,...

【技术特征摘要】

1.一种基于神经网络预测容器交互部件属性的方法,神经网络包括主干网和头部网,主干网用于特征提取,头部网对各阶段提取的特征进行融合,并通过检测头进行包围框和类别的预测,其特征在于包括如下步骤:

2.根据权利要求1所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:所述步骤s1中,可变形卷积的计算公式为:

3.根据权利要求2所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:为可变形卷积为卷积核的每个位置学习一个权重系数δm,δm∈[0,1],可变形卷积的计算公式为:

4.根据权利要求1所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:所述步骤s2中,输入的特征首先经过cbs模块,然后传入两个分支中,传入分支一的特征首先经过卷积模块提取特征,然后使用一个cbm模块预测类别,传入分支二的特征首先经过卷积模块提取特征,然后分别使用cbm模块预测包围框和目标置信度。

5.根据权利要求1所述的一种基于神经网络预测容器交互部件属性的方法,其特征在于:所述步骤s3中,构建两层注意力机制的损失函数lwiouv1,公式如下:

6.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员:李基拓薛庭熙廖奎
申请(专利权)人:余姚市机器人研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1