一种基于头部姿态估计的儿童坐姿提醒方法和系统技术方案

技术编号:32913139 阅读:47 留言:0更新日期:2022-04-07 12:03
本发明专利技术公开一种基于头部姿态估计的儿童坐姿提醒方法,包括:S1:从摄像设备获取原始图像,进行有效帧检测并保留有效帧;S2:使用目标检测算法从原始图像提取头部图像;S3:将头部图像输入头部姿态估计网络,得到俯仰角、偏航角、滚转角的概率分布序列和最终的估计角度;S4:将概率分布序列输入一维卷积网络验证准确性,根据估计角度对头部姿态进行判断并对错误姿态进行语音提醒。本发明专利技术还包括一种基于头部姿态估计的儿童坐姿提醒系统。本发明专利技术能够通过摄像设备对儿童书写阅读场景下的头部欧拉角进行细粒度识别并针对错误姿态进行提醒,同时具有较低的误报率。具有较低的误报率。具有较低的误报率。

【技术实现步骤摘要】
一种基于头部姿态估计的儿童坐姿提醒方法和系统


[0001]本专利技术属于计算机视觉领域,主要涉及一种基于头部姿态估计的儿童坐姿 提醒方法和系统。

技术介绍

[0002]国内一些研究结果显示,读写姿势不良与近视的发生发展具有关联性,而 且学生的读写姿势不正确率高达70%甚至85%以上。因此,纠正儿童的读写姿 势是预防近视发生发展的一个重要途径。
[0003][0004]目前市面上较为常见的是物理矫正装置,通过约束身体、头部的活动范围来 达到规范坐姿的目的。如专利申请号为CN202130311380.1的设计方案,儿童坐 姿矫正器,设计了一款固定于桌面的坐姿矫正器,其作用是保持人体前胸与桌子 的距离;再比如专利申请号为CN202030635389.3的设计方案,儿童坐姿矫正架, 设计了一款类似的固定于桌面的矫正架,其作用是保持头部与桌面的距离,预防 头部过低。这些物理装置只做到了将人体隔离在某个区域外,并不能保证儿童写 字时的头部姿势是正确的,而且一定程度上占用了桌面的空间,影响了阅读写字 时的舒适性。
[0005]随着计算机视觉技术的成熟,目前已经有将视觉技术用于人类状态识别的 相关应用。比如申请号为201711070372.1的专利技术专利所公开的技术方案,一种 基于视线的驾驶员注意力检测方法,通过2D人脸关键点检测算法获取人脸关键 点坐标,构建3D头部模型,提取驾驶员的3D人脸特征,使用2D和3D人眼关 键点坐标并结合眼部空间关系计算3D坐标系下的视线方向,最后将视线方向作 为注意力方向。该技术方案中的核心步骤是从2D坐标系建立3D头部模型的映 射关系,这类基于几何变形模型的方法非常依赖于人脸关键点检测的准确性,而 且在现实应用场景中,容易受到驾驶员外貌特征、光线等因素的影响。
[0006]目前学术上主流的头部姿态估计方法主要可以分为回归和分类两类。回归 方法使用或拟合一个数学模型来直接预测基于标记训练数据的姿势。回归器可 以是主成分分析和神经网络等。相比之下,分类方法从离散的的姿态集预测姿态, 预测分辨率往往较低。分类器可以是决策树、随机森林、神经网络等。例如申请 号为202011019897.4的专利技术专利所公开的技术方案,一种基于多层级图像特征 精炼学习的头部姿态估计方法及其实现系统、存储介质,该方案在数据处理阶段 使用小波变换来扩充图片的信息;在头部姿态估计阶段使用先分类后回归的方 法,先使用粗粒度的分类网络估计头部姿态的大致区间,然后使用细粒度的回归 网络得到具体角度值。该技术方案不仅进行了数据增强,还进一步将模型细化为 两个阶段,但该方案中的粗粒度网络仅仅划分了5个子区间,对于回归阶段的 细粒度网络帮助不大而且增加了整个流程的复杂度。

技术实现思路

[0007]本专利技术要克服现有技术的上述缺点,提出了一种基于头部姿态估计的儿童 坐姿
提醒方法和系统,为解决青少年儿童阅读写字时的坐姿问题提供了有力的 支持,从而为防控青少年近视的发生和发展做出贡献。
[0008]为实现上述目的,本专利技术提供了如下方案:本专利技术提供了一种基于头部姿态 估计的儿童坐姿提醒方法,包括以下步骤:
[0009]S1:从摄像设备获取原始图像,并输入有效帧判别网络进行有效帧检测,若 有效帧概率小于无效帧概率则该原始图像为无效帧,反之即为有效帧,保留有效 帧;
[0010]S2:使用目标检测算法对原始图像进行头部检测,并根据检测结果提取头部 图像;
[0011]S3:将头部图像输入头部姿态估计网络,得到欧拉角三个维度的概率分布序 列和最终的估计角度俯仰角θ
p
,偏航角θ
y
,滚转角θ
r

[0012]S4:将概率分布序列输入一维卷积网络进行准确度评估,若一维卷积网络输 出的准确度小于0.5,则返回步骤S1,否则根据S3中的估计角度进行头部姿态 的判断,并针对错误姿态进行语音提醒。
[0013]优选地,步骤S1具体包括:
[0014]S1.1:将原始图像调整成正方形,并对每一个通道进行归一化,得到Image1;
[0015]S1.2:将Image1输入有效帧判别网络,输出该帧图像为有效帧和无效帧的概 率分别为P1(x),P2(x),若P1(x)<P2(x),则该帧图像为无效帧,反之则为有效 帧。
[0016]优选地,步骤S1.2所述有效帧判别网络是由多个基本网络块构成的轻量级 网络,其基本网络块由1
×
1的普通卷积和3
×
3的depth

wise卷积构成,并分别 在网络块头部和尾部进行通道分离和通道混合操作。
[0017]优选地,步骤S2具体包括:
[0018]S2.1:将原始图像大小调整成正方形,并对每一个通道进行归一化,得到 Image2,Image2的尺寸比Image1更大以保留更多图像信息;
[0019]S2.2:将Image2输入Yolov5目标检测网络进行头部识别,输出头部外接矩 形框在原始图像上的坐标:x
l
,y
l
,x
r
,y
r

[0020]其中x
l
,y
l
分别为外接矩形框左上角的x坐标和y坐标;x
r
,y
r
分别为 外接矩形框右上角的x坐标和y坐标;
[0021]S2.3:根据头部外接矩形框的坐标从原始图像提取得到头部图像。
[0022]优选地,步骤S3具体包括:
[0023]S3.1:将头部图像大小调整成正方形,并对每一个通道进行归一化,得到 Image3;
[0024]S3.2:将Image3输入姿态估计网络,得到俯仰角、偏航角、滚转角的概率分 布序列以及估计角度;
[0025]所述概率分布序列分别记为其中N∈{66,120,66},所述俯仰角范围为[

99
°
,99
°
],偏航角范围为[

180
°
,180
°
],滚转角范围为 [

99
°
,99
°
]。
[0026]优选地,步骤S3.2所述的姿态估计网络包括两个部分:用于特征提取的主 干网络和用于回归分类的全连接层网络;
[0027]所述主干网络的核心结构由16个移动翻转瓶颈卷积块构成,该移动翻转瓶 颈卷积块首先通过1
×
1卷积改变通道数,接着进行深度卷积,再连接一个压缩 与激发模块,压
缩与激发模块能够使模型更加关注重要的通道特征,最后再以1
ꢀ×
1卷积恢复通道维度并通过连接失活和跳跃连接操作增加模型的泛化性和学 习能力;
[0028]所述全连接层网络一共包括三个分支,分别用于计算俯仰角、偏航角、滚转 角,每个分支的输出是长度为66或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:包括以下步骤:S1:从摄像设备获取原始图像,并输入有效帧判别网络进行有效帧检测,若有效帧概率小于无效帧概率则该原始图像为无效帧,反之即为有效帧,保留有效帧;S2:使用目标检测算法对原始图像进行头部检测,并根据检测结果提取头部图像;S3:将头部图像输入头部姿态估计网络,得到欧拉角三个维度的概率分布序列p,y,和最终的估计角度俯仰角θ
p
,偏航角θ
y
,滚转角θ
r
;S4:将概率分布序列输入一维卷积网络进行准确度评估,若一维卷积网络输出的准确度小于0.5,则返回步骤S1,否则根据S3中的估计角度进行头部姿态的判断,并针对错误姿态进行语音提醒。2.如权利要求1所述的一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:所述步骤S1具体包括:S1.1:将原始图像调整成正方形,并对每一个通道进行归一化,得到Image1;S1.2:将Image1输入有效帧判别网络,输出该帧图像为有效帧和无效帧的概率分别为P1(x),P2(x),若P1(x)<P2(x),则该帧图像为无效帧,反之则为有效帧。3.如权利要求2所述的一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:步骤S1.2所述有效帧判别网络是由多个基本网络块构成的轻量级网络,其基本网络块由1
×
1的普通卷积和3
×
3的depth

wise卷积构成,并分别在网络块头部和尾部进行通道分离和通道混合操作。4.如权利要求1所述的一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:所述步骤S2具体包括:S2.1:将原始图像大小调整成正方形,并对每一个通道进行归一化,得到Image2,Image2的尺寸比Image1更大;S2.2:将Image2输入Yolov5目标检测网络进行头部识别,输出头部外接矩形框在原始图像上的坐标:x
l
,y
l
,x
r
,y
r
;其中x
l
,y
l
分别为外接矩形框左上角的x坐标和y坐标;x
r
,y
r
分别为外接矩形框右上角的x坐标和y坐标;S2.3:根据头部外接矩形框的坐标从原始图像提取头部图像。5.如权利要求1所述的一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:所述步骤S3具体包括:S3.1:将头部图像大小调整成正方形,并对每一个通道进行归一化,得到Image3;S3.2:将Image3输入姿态估计网络,得到俯仰角、偏航角、滚转角的概率分布序列以及估计角度;所述概率分布序列分别记为p,y,其中N∈{66,120,66},所述俯仰角范围为[

99
°
,99
°
],偏航角范围为[

180
°
,180
°
],滚转角范围为[

99
°
,99
°
]。6.如权利要求5所述的一种基于头部姿态估计的儿童坐姿提醒方法,其特征在于:步骤S3.2所述的姿态估计网络包括两个部分:用于特征提取的主干网络和用于回归分类的全连接层网络;所述主干网络的核心结构由16个移动翻转瓶颈卷积块构成,该移动翻转瓶颈卷积块首
先通过1
×
1卷积改变通道数,接着进行深度卷积,再连接一个压缩与激发模块,压缩与激发模块能够使模型更加关注重要的通道特征,最后再以1
×
1卷积恢复通道维度并通过连接失活和跳跃连接操作增加模型的泛化...

【专利技术属性】
技术研发人员:宣琦宋栩杰周洁韵翔云邱君瀚
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1