基于三支决策优化智能座舱人机交互界面的方法及系统技术方案

技术编号:19933337 阅读:50 留言:0更新日期:2018-12-29 04:14
本发明专利技术属于智能驾驶领域,为一种基于三支决策优化智能座舱人机交互界面的方法及系统,方法包括采集座舱内的手势视频,进行预处理,得到手势图像;对手势图像的手势和背景分割,得到手势区域图像;为其进行多粒度表达,利用卷积神经网络提取手势区域图像的多粒度特征;从粗粒度到细粒度计算每一粒度手势区域图像分类到各类别的条件概率,利用三支决策序贯的完成手势识别;将识别后的手势进行语义转换,人机交互界面根据语义转换后的结果进行操作;采用加权求和的方式获得最佳粒度,以该最佳粒度作为最细粒度。本发明专利技术不仅能够更精准的识别座舱内手势,执行手势命令,还能够减少座舱人机交互界面的交互时间,为用户提供更舒适的交互体验。

【技术实现步骤摘要】
基于三支决策优化智能座舱人机交互界面的方法及系统
本专利技术属于智能驾驶领域,尤其涉及一种基于三支决策优化智能座舱人机交互界面的方法及系统。
技术介绍
随着人工智能和深度学习技术的发展,智能驾驶已经吸引了很多人的关注。手势识别作为智能驾驶中典型的人机交互方式之一,对座舱内人机交互(HMI)界面的优化设计是非常重要的。精准快速的手势识别不仅能够提供更舒适的交互体验,也能提高驾驶者的安全性。当前手势识别方法主要有基于传感器设备和基于计算机视觉的两种方式。前者虽然有较好的识别率,但是其成本较大,交互体验不能满足当前的需求,后者虽然采集手势图像比较容易,但是已有的包括:基于模板匹配、基于几何特征提取、基于隐马尔可夫模型和基于神经网络的手势识别方法仍然存在模型识别精度低或者识别速度慢等问题,并不能很好的适应当前精准实时的手势识别需求。模型识别精度低的主要原因在于未能很好的提取手势的特征,而识别速度慢的主要是因为模型太过复杂导致的,现有方法往往不能同时解决这两个问题。
技术实现思路
基于以上问题,利用深度神经网络提取特征的能力,结合多粒度信息表达方式和三支决策思想,选择合适的粒度能够同时解决手势识别本文档来自技高网...

【技术保护点】
1.一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述方法包括:S1、采集座舱内的手势视频,对其进行预处理,得到一系列静态的手势图像;S2、对手势图像中的手势和背景进行分割处理,得到手势区域图像;S3、为手势区域图像由粗粒度到细粒度进行多粒度表达;利用卷积神经网络提取手势区域图像的多粒度特征;S4、从粗粒度到细粒度计算每一粒度手势区域图像分类到各类别的条件概率,利用三支决策序贯的完成手势识别;S5、将识别后的手势进行语义转换,对人机交互界面根据语义转换后的手势识别结果进行相应的操作;S6、采用加权求和的方式获得最佳粒度,以该最佳粒度作为最细粒度,重复执行步骤S3~S5。

【技术特征摘要】
1.一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述方法包括:S1、采集座舱内的手势视频,对其进行预处理,得到一系列静态的手势图像;S2、对手势图像中的手势和背景进行分割处理,得到手势区域图像;S3、为手势区域图像由粗粒度到细粒度进行多粒度表达;利用卷积神经网络提取手势区域图像的多粒度特征;S4、从粗粒度到细粒度计算每一粒度手势区域图像分类到各类别的条件概率,利用三支决策序贯的完成手势识别;S5、将识别后的手势进行语义转换,对人机交互界面根据语义转换后的手势识别结果进行相应的操作;S6、采用加权求和的方式获得最佳粒度,以该最佳粒度作为最细粒度,重复执行步骤S3~S5。2.根据权利要求1所述的一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述为手势区域图像由粗粒度到细粒度进行多粒度表达,对于同一手势区域图像,其多粒度信息表示方式具体如下:其中,Ai表示手势区域图像在不同粒度的信息,A1表示手势区域图像在粗粒度的信息,An表示手势区域图像在细粒度的信息,即细粒度包含粗粒度;i=1,2,...,n,n表示粒度数。3.根据权利要求2所述的一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述利用卷积神经网络提取手势区域图像的多粒度特征包括,利用卷积神经网络中不同的卷积核,提取出手势区域图像的多粒度图像特征。4.根据权利要求1所述的一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述步骤S4包括从对手势区域图像的粗粒度特征进行三支决策,若能确定手势的分类类别,则不继续细粒度的特征提取和进一步的三支决策,否则提取更细粒度的特征进行三支决策,直到确定手势区域图像的分类类别。5.根据权利要求1所述的一种基于三支决策优化智能座舱人机交互界面的方法,其特征在于,所述步骤S6包括采用加权求和的方式获得最终每一粒度的人机交互界面优化结果,从而确定手势区域图像的最佳粒度;Result=w×Acc+(1-w)×TimeTime=T1+T2其中,Result为手势区域图像的最佳粒度,Acc表示手势识别精度,Time表示手势识别过程中花费的时间,w表示权值,T1表示提取手势区域图像的多粒度特征的时间;...

【专利技术属性】
技术研发人员:刘群张刚强王如琪
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1