一种基于决策树的打电话手势视觉检测算法制造技术

技术编号:19512236 阅读:41 留言:0更新日期:2018-11-21 08:20
本发明专利技术公开了一种基于决策树的打电话手势视觉检测算法,本发明专利技术相对于领域内其余方案,采用像素比较特征,通过退出机制减少了大量的计算,在速度上有着明确优势,不需图像预处理和特征提取,对人脸检测模型的依赖较小,也不需要运动学判定或者嘴部姿态辅助,在画面有着噪声时也能保证检测效果,是一种良好的打电话手势检测算法。

【技术实现步骤摘要】
一种基于决策树的打电话手势视觉检测算法
本专利技术涉及视觉检测
,具体为一种基于决策树的打电话手势视觉检测算法。
技术介绍
目前常见的打电话手势视觉检测算法多数基于人脸检测得到ROI区域再进行特征提取和分类,多数提取的特征为像素统计或者轮廓特征,利用SVM等分类器来判定区域是否为打电话手势。此类方法首先对人脸检测的依赖度很高,如果未检测到人脸就无法进行后续检测;其次,基于像素点统计或轮廓特征的判定,对噪音和光照等干扰非常敏感,需要对输入图像做出预处理才能获得理想效果,这就增加了算法的复杂度;最后,即便是在理想情况下,基于分类器的检测效果漏检率和误检率也不算优秀,需要辅助逻辑处理,如运动特征提取、嘴唇动作等,来减小误判。因此在实际应用中的效果均不能让人满意。我们提出一种基于决策树的,无需预处理,在人脸未检测到时也可以正常完成检测流程的打电话手势视觉检测算法。
技术实现思路
本专利技术的目的在于提供一种基于决策树的打电话手势视觉检测算法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于决策树的打电话手势视觉检测算法,包括以下步骤:A、获取样本图像集,标注出需要的人脸数据和打电话手势数据,采集大量的合适的无关图像作为负样本集;B、以步骤A中的数据库为基础,训练得到基于决策树的人脸分类器和电话手势分类器;C、采集并转换视频流数据为灰度图像;D、由人脸分类器确定人脸区域,若可以检测到人脸则确定手势检测子区域,若无法检测到人脸则对全图进行手势检测;E、在手势检测区域中使用电话手势分类器进行检测,判断是否存在打电话手势;若存在则进行步骤F,不存在则转回步骤C;F、判断过去若干帧中测得手势的比例,大于阈值时判断为打电话,小于则判断为否;G、输出判断结果。优选的,所述步骤B中的分类器训练过程,通过以下步骤实现:a、选取人脸正样本和所有负样本为数据库,使用像素点强度对比特征将其处理为一系列向量,使用Adaboost策略训练得到一系列二叉决策树,作为人脸分类器;b、选取手势数据库作为正样本,原人脸正样本和其余的负样本一并作为新的负样本,提取其像素点强度对比特征,使用Adaboost策略训练得到一系列二叉决策树,作为打电话手势检测分类器。优选的,多层决策树级联策略的具体步骤为:(a)初始化所有训练数据的权值K0并归一化,正样本权重为1/n,负样本权重为1/m;(b)训练得到某棵二叉树Tri;(c)按照数据在本棵树上的表现,统计本棵树分类错误的数据的权重和ei;(d)由ei按照公式计算本棵树的强度Wi;(e)更新权重,分类正确的样本权重更新为分类错误的样本权重更新为然后对分别对正负样本的权重进行归一化;(f)重复b到e直到分类率达到预设的阈值;(g)提取所有正样本数据,和被本层决策树误判的负样本数据,开始新一层的决策树级联训练,直至到达预设的层数。优选的,二叉决策树的具体生成策略为:(a)确定树的根节点;(b)随机生成一系列检测点对,计算其在训练数据上的误差;(c)找到误差最小的检测点对,储存为决策树当前结点,将所有训练数据按此点对分为两类;(d)对于两类训练数据生成两棵对应的子树;(e)在子树中重复步骤a到c;(f)当数据无法再分时将点对设为0,不做其他操作并直接生成两棵子树;(g)当树深达到最大值D时,按照数据集到达每个叶节点时的总误差平均值,生成此树的叶节点值;(h)按照训练库的正负样本情况设置此树的阈值。优选的,所述步骤D中检测区域的确定,由以下步骤实现:a、将输入的图像像素信息输入训练得到的人脸决策树模型,获得检测到的人脸区域;b、若检测到人脸区域,则以人脸区域为基准,横向按照一定比例放大,得到手势检测的目标区域;c、若未检测到人脸区域,则将手势检测的目标区域设定为全部图像。优选的,所述步骤E中,对图片感兴趣区域的决策树检测算法,其实现方式为:a、采用图像滑窗不断移动和放大,对检测区域内的像素信息进行大量不同窗口的检测;b、对于每个窗口内的图像信息,使其通过所有的树,每通过一棵树,当其结果小于本棵树的节点阈值则直接判断为非电话手势;c、若某个窗口通过了所有的树,则认为此窗口中包含打电话手势,统计其总阈值作为其置信度;d、对所有窗口中的检测结果做聚类,按照交集比并集比例原则合并检测结果,累加其置信度。优选的,决策树模型检测步骤,具体方式为:a、提取第一棵树根节点的检测点对,判断输入滑窗内像素信息在此两个点上的值;b、根据值进入不同的子树,在子树中提取节点信息,检测并进入分支,直到到达叶节点;c、若叶节点值小于阈值,直接进入下一个滑窗进行检查;若叶节点值大于阈值,使用下一棵树进行检查;d、当某层的树全部完成检查后,比较像素信息在本层的得分与决策树的阈值;e、若小于阈值则拒绝进入下一层,开始检测下一个滑窗;若大于阈值则进入下一层;f、只有当完成了全部层的决策树级联检测的滑窗才认为是符合要求的目标区域,记录其总得分;g、对所有的目标进行聚类,按照交并比原则合并可能为同一目标的滑窗区域;h、输出检测结果。优选的,所述步骤F中使用检测到的比例来进行阈值判断是否为打电话行为,其实现方式为:a、统计过去一秒内的所有视频帧中,检测到打电话手势的帧数量T;b、根据帧率得到总帧数N;c、计算得到测得率T/N,当此值大于某个设定的阈值时触发后续模块。与现有技术相比,本专利技术的有益效果是:本专利技术相对于领域内其余方案,采用像素比较特征,通过退出机制减少了大量的计算,在速度上有着明确优势,不需图像预处理和特征提取,对人脸检测模型的依赖较小,也不需要运动学判定或者嘴部姿态辅助,在画面有着噪声时也能保证检测效果,是一种良好的打电话手势检测算法。附图说明图1为本专利技术流程图;图2为本专利技术分类器训练过程流程图;图3为本专利技术多层决策树级联策略流程图;图4为本专利技术二叉决策树的具体生成策略流程图;图5为本专利技术决策树模型检测步骤流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-5,本专利技术提供一种技术方案:一种基于决策树的打电话手势视觉检测算法,包括以下步骤:A、获取样本图像集,标注出需要的人脸数据和打电话手势数据,采集大量的合适的无关图像作为负样本集;B、以步骤A中的数据库为基础,训练得到基于决策树的人脸分类器和电话手势分类器;C、采集并转换视频流数据为灰度图像;D、由人脸分类器确定人脸区域,若可以检测到人脸则确定手势检测子区域,若无法检测到人脸则对全图进行手势检测;E、在手势检测区域中使用电话手势分类器进行检测,判断是否存在打电话手势;若存在则进行步骤F,不存在则转回步骤C;F、判断过去若干帧中测得手势的比例,大于阈值时判断为打电话,小于则判断为否;G、输出判断结果。本专利技术中,所述步骤B中的分类器训练过程,通过以下步骤实现:a、选取人脸正样本和所有负样本为数据库,使用像素点强度对比特征将其处理为一系列向量,使用Adaboost策略训练得到一系列二叉决策树,作为人脸分类器;b、选取手势数据本文档来自技高网...

【技术保护点】
1.一种基于决策树的打电话手势视觉检测算法,其特征在于:包括以下步骤:A、获取样本图像集,标注出需要的人脸数据和打电话手势数据,采集大量的合适的无关图像作为负样本集;B、以步骤A中的数据库为基础,训练得到基于决策树的人脸分类器和电话手势分类器;C、采集并转换视频流数据为灰度图像;D、由人脸分类器确定人脸区域,若可以检测到人脸则确定手势检测子区域,若无法检测到人脸则对全图进行手势检测;E、在手势检测区域中使用电话手势分类器进行检测,判断是否存在打电话手势;若存在则进行步骤F,不存在则转回步骤C;F、判断过去若干帧中测得手势的比例,大于阈值时判断为打电话,小于则判断为否;G、输出判断结果。

【技术特征摘要】
1.一种基于决策树的打电话手势视觉检测算法,其特征在于:包括以下步骤:A、获取样本图像集,标注出需要的人脸数据和打电话手势数据,采集大量的合适的无关图像作为负样本集;B、以步骤A中的数据库为基础,训练得到基于决策树的人脸分类器和电话手势分类器;C、采集并转换视频流数据为灰度图像;D、由人脸分类器确定人脸区域,若可以检测到人脸则确定手势检测子区域,若无法检测到人脸则对全图进行手势检测;E、在手势检测区域中使用电话手势分类器进行检测,判断是否存在打电话手势;若存在则进行步骤F,不存在则转回步骤C;F、判断过去若干帧中测得手势的比例,大于阈值时判断为打电话,小于则判断为否;G、输出判断结果。2.根据权利要求1所述的一种基于决策树的打电话手势视觉检测算法,其特征在于:所述步骤B中的分类器训练过程,通过以下步骤实现:a、选取人脸正样本和所有负样本为数据库,使用像素点强度对比特征将其处理为一系列向量,使用Adaboost策略训练得到一系列二叉决策树,作为人脸分类器;b、选取手势数据库作为正样本,原人脸正样本和其余的负样本一并作为新的负样本,提取其像素点强度对比特征,使用Adaboost策略训练得到一系列二叉决策树,作为打电话手势检测分类器。3.根据权利要求2所述的一种基于决策树的打电话手势视觉检测算法,其特征在于:多层决策树级联策略的具体步骤为:(a)初始化所有训练数据的权值K0并归一化,正样本权重为1/n,负样本权重为1/m;(b)训练得到某棵二叉树Tri;(c)按照数据在本棵树上的表现,统计本棵树分类错误的数据的权重和ei;(d)由ei按照公式计算本棵树的强度Wi;(e)更新权重,分类正确的样本权重更新为分类错误的样本权重更新为然后对分别对正负样本的权重进行归一化;(f)重复b到e直到分类率达到预设的阈值;(g)提取所有正样本数据,和被本层决策树误判的负样本数据,开始新一层的决策树级联训练,直至到达预设的层数。4.根据权利要求2所述的一种基于决策树的打电话手势视觉检测算法,其特征在于:二叉决策树的具体生成策略为:(a)确定树的根节点;(b)随机生成一系列检测点对,计算其在训练数据上的误差;(c)找到误差最小的检测点对,储存为决策树当前结点,将所有训练数据按此点对分为两类;(d)对于两类训练数据生成两棵对应的子树;(e)在子树中重复步骤a到c;(f)当数据无法再分时将点对设...

【专利技术属性】
技术研发人员:王赫雷冬华石林万长明徐烨徐文杰
申请(专利权)人:吉旗物联科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1