一种基于X3D的农业行为识别方法技术

技术编号：37443766 阅读：8 留言：0更新日期：2023-05-06 09:15

本发明专利技术涉及一种基于X3D的农业行为识别方法，包括下列顺序的步骤：构建农业行为数据集；构建基于X3D的农业行为识别模型；采用农业行为数据集对农业行为识别模型进行训练；将待识别农业行为输入训练好的农业行为识别模型进行识别，输出识别结果。本发明专利技术实现了大规模、多地域、真实客观地记录农民的劳作行为，为农场管理和农产品追溯提供真实的客观数据成为当前的一大需求；对比采集的数据采用视频格式存储的方式记录数据，集采集和分析于一体大大减少了存储资源的消耗，有效地降低存储空间，大幅度提高效率，减少人工成本；检测准确率和检测速度综合性能较优，农业行为识别模型的参数量远小于现有模型，农业行为识别模型的运行速度优于现有模型。度优于现有模型。度优于现有模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于X3D的农业行为识别方法

[0001]本专利技术涉及深度学习和行为识别
，尤其是一种基于X3D的农业行为识别方法。

技术介绍

[0002]在智慧农业不断发展的今天，农业行为成为影响制品安全的重要因素。在农业生产过程中，对农业行为进行客观真实的记录，能够有效的保证食品安全的源头可溯性。在实际的生产过程中，大多数的农业行为都是有人参与的，而现有的记录方法是通过人工去记录，由于我国耕地分布较为零散，因此，这种人工记录的方式效率非常低，这远远不能满足当前的需求。真实客观地记录农民的劳作行为，为农场管理和农产品追溯提供真实的客观数据成为当前的一大需求；对于采集的数据大多数采用视频格式存储，这样的数据存储方式会占用大量的存贮空间，且后续工作中再对视频数据进行分析，这样既费时又费力。
[0003]现有解决方案较少，且基本的处理方式是从单帧图像或多帧图像入手，这样的解决方案受环境影响较大，模型的鲁棒性无法得到保证。为了保证模型的运行速度，大多数解决方法是使用小规模的模型。然而，这样的模型在较小规模的数据集上训练得到的模型，在实验条件下的效果很好，而实际应用场景中效果较差，识别准确率与运行速度较低。为了使模型的精度越来越高，模型的参数量会越来越大，这样必然会导致模型的运行速率变低，模型的使用场景和实用价值也就随之降低。在识别精度、鲁棒性与运行速度三者之间寻找到一个平衡点是解决该问题的关键。

技术实现思路

[0004]为解决农业行为记录工作量大且资源占用多、识别准确率与运行速度较低的缺陷，本专利技术...

【技术保护点】

【技术特征摘要】
1.一种基于X3D的农业行为识别方法，其特征在于：该方法包括下列顺序的步骤：(1)构建农业行为数据集；(2)构建基于X3D的农业行为识别模型；(3)采用农业行为数据集对农业行为识别模型进行训练；(4)将待识别农业行为输入训练好的农业行为识别模型进行识别，输出识别结果。2.根据权利要求1所述的基于X3D的农业行为识别方法，其特征在于：所述步骤(1)具体包括以下步骤：(1a)获取视频：在网站上查找相关视频，过滤掉广告视频和教学类视频，筛选出真实劳作场景下拍摄的视频，所挑选的视频包括单人、多人参与农业行为的视频，同时也包括近距离、远距离、不同角度拍摄的视频；(1b)进行视频预处理：对视频中农业劳作部分进行剪切，对无关片段进行删除，将每个视频按照5s至15s的长度进行剪切，得到1266个样本；对得到的视频片段进行预处理，首先固定帧率为30帧，同时对视频帧进行等比例缩放，使得短边长度即高或宽为256；(1c)进行农业行为数据集标注：对得到的视频进行类别标注，建立文件地址与类别的映射表；(1d)数据集划分：对于标注后的数据按照8：2的比例划分训练集和测试集，之后对训练集再按照8：2的比例划分为训练集和验证集。3.根据权利要求1所述的基于X3D的农业行为识别方法，其特征在于：所述步骤(2)具体是指：基于X3D的农业行为识别模型包括用于实现视频帧采样的数据层、用于实现多帧图像特征提取的特征提取层、残差模块和多层感知机，所述数据层包含一个卷积层，所述特征提取层包括一个卷积层，所述残差模块包含四个残差子模块，每个残差子模块各包含不同数量的卷积层；多层感知机部分包含一个卷积层、一个池化层和...

【专利技术属性】
技术研发人员：陈鹏，孟维庆，章军，夏懿，焦林，李高强，张明年，张波，庞春晖，王俊峰，杜健铭，王儒敬，
申请(专利权)人：中科合肥智慧农业协同创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人