【技术实现步骤摘要】
一种狗行为动作识别技术的方法、装置、系统及存储介质
[0001]本专利技术属于动物行为识别
,尤其涉及一种狗行为动作识别技术的方法、装置、系统及存储介质。
技术介绍
[0002]近年来,随着宠物狗数量增多,流浪狗的数量也迅速增长,若不对其进行合适的管理,会带来扰乱秩序、影响卫生甚至携带一些病毒等问题,对市民的正常生活秩序带来不必要的麻烦。宠物狗越来越受到人们的欢迎,宠物市场的数据化也是未来发展的趋势,将宠物狗识别技术引入市场管理中可以通过市区监控区分城市中出现的烈性犬和宠物狗,及时通知有关部门对烈性犬进行处理,也可以通过市区监控识别宠物狗是否有牵绳,对不牵狗绳的宠物狗进行相关处理。狗行为动作识别技术采用传统的目标检测算法进行特征提取需要任务提取特征信息,传统算法将输入图片分为不同大小网格,再判断网格中是否包含物体并对目标分类,由于该算法太过于繁琐,检测速度不高,导致实际可行性较差,特征提取和分类训练是分离开的,若人工提取的特征出现缺失,则丢失的这些特征信息就很难恢复,给检测结果带来不良影响。
技术实现思路
[0003]有鉴于此,本专利技术提供了一种加深网络模型的主干提取特征网络的深度、引入注意力机制和多尺度融合来提取不同特征、提升狗的检测与识别精确度和检测效率的狗行为动作识别技术的方法、装置、系统及存储介质,具体采用以下技术方案来识别。
[0004]第一方面,本专利技术提供了一种狗行为动作识别技术的方法,包括以下步骤:获取采集的狗的行为视频,将视频进行分割并从分割的每段中提取一帧作为输入 ...
【技术保护点】
【技术特征摘要】
1.一种基于狗行为动作识别技术的方法,其特征在于,包括以下步骤:获取采集的狗的行为视频,将视频进行分割并从分割的每段中提取一帧作为输入图像,对输入图像进行预处理得到包含有狗对应的目标图片,其中目标图片包括狗脸图片和行为图片;对目标图片进行特征提取得到特征数据,根据特征数据构建网络模型并训练网络模型,对该网络模型进行优化训练得到数据集,其中,网络模型优化训练包括权值剪枝和卷积核剪枝,根据卷积核权值的绝对值大小评估特征数据对应的特征图的重要性,卷积核剪枝过程为:对卷积层L的第i个卷积核计算其权重的绝对值之和的表达式为,根据的大小进行排序,将最小的卷积核及其对应的特征图剪掉,同时使得卷积层中与剪掉的特征图相关的卷积核也会剪掉;将数据集输入预先训练好的深度神经网络经过训练阶段得到预训练模型,在测试阶段对前端采集的视频帧图像进行预处理后输入预训练模型进行测试得到检测图像,其中,预训练模型包括轻量化狗检测模型和行为识别模型;获取检测图像中狗的具体位置并将狗所在区域从图像中抠出,对抠出的区域数据的分辨率进行标准化操作并计算数据的相似度,采用分类器进行行为数据特征的分类。2.根据权利要求1所述的基于狗行为动作识别技术的方法,其特征在于,根据的大小进行排序,将最小的卷积核及其对应的特征图剪掉,包括:采用YOLOv3网络模型输出不同尺度的特征图,输出的预测框包括边界框参数、置信度和类别概率,通过非极大值抑制去掉多余的边界框得到预测结果;网络模型的每个网格预测边界框的四个坐标分别为、、和,预设特征图的左上角为坐标原点,单元格坐标为,先验框宽度和高度为和,则预测框的计算表达式为,其中表示检测框中心坐标,表示将和归一化到,和表示检测框的宽和高。3.根据权利要求2所述的基于狗行为动作识别技术的方法,其特征在于,通过非极大值抑制去掉多余的边界框得到预测结果,包括:
通过特征提取网络先输出32、16、8倍降采样的特征图,再对先验框进行修正得到预测框,每个先验框对应的信息包括预测框的宽、高、中心点横坐标、中心点纵坐标、属于目标的分类信息和置信度;模型训练时,将多个先验框到的IOU值进行比较,IOU值最大的先验框用于预测目标而生成的预测框的置信度为1,预设一个的特征图,根据与该特征图对应的先验框的宽、高生成预测框的置信度表达式为,特征图中位置与宽、高的先验框对应的个特征值为式中的、、、和,、表示预测框的宽高,表示预测框的置信度,预测框属于某个类别的概率为;非极大值用于将最高分的检测框加入检测结果的集合中,每个目标物体附近存在多个置信度高的检测框,通过计算每次加入集合的检测框和剩余最高分检测框的IOU值,若IOU值大于设定的阈值,则丢掉该低分框,保存高分的检测框,IOU值的计算表达式为,其中表示两个检测框与之间交集部分面积,表示两个检测框与之间并集部分面积。4.根据权利要求1所述的基于狗行为动作识别技术的方法,其特征在于,采用分类器进行行为数据特征的分类,包括:将提取的每一帧分别输入至深度神经网络做特征提取,在深度神经网络中的每一个残差模块中引入时移模块作用在第一层卷积层后,在深度神经网络中加入注意力层,将提取到的特征进行融合分类;时移模块通过时间维度移动提取到的特征图来实现高效的时间建模,在时间任务建模中一个输入特征表示为,其中分别表示批大小、通道数、时间维度、宽度和高度,时移模块沿着时间维度将前一帧和后一帧的不同信息与当前信息融合到一起,以弥补时间信息缺失的功能;时移模块操作包括位移和权值叠加,预设在输入为一维向量X时,经过卷积核大小为的卷积层,其输出的表达式为
,其中是卷积的权重,位移操作的表达式为,权值叠加操作的表达式为;加入注意力模型将输入特征图进行批量归一化,并将输入特征图和权重因子相乘经过sigmoid激活函数与输入特征作融合以得到狗具体行为特征,预设输入特征图为G,注意力图为M,其输出表达式为,其中表示矩阵乘法,注意力图计算表达式为,其中表示...
【专利技术属性】
技术研发人员:宋程,刘保国,胡金有,吴浩,梁开岩,郭玮鹏,李海,巩京京,
申请(专利权)人:星宠王国北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。