影像识别方法及其装置及人工智能模型训练方法及其装置制造方法及图纸

技术编号:30425535 阅读:30 留言:0更新日期:2021-10-24 16:58
本发明专利技术提出一种影像识别方法及其装置及人工智能模型训练方法及其装置。影像识别方法包括:通过影像感测器获取输入影像;检测所述输入影像中的物体及对应所述物体的多个特征点,并获得所述多个特征点的实时二维坐标信息;通过人工智能模型根据所述多个特征点的所述实时二维坐标信息判断所述物体与所述影像感测器之间的距离;以及当所述距离小于或等于门限值时对所述物体进行动作识别操作。门限值时对所述物体进行动作识别操作。门限值时对所述物体进行动作识别操作。

【技术实现步骤摘要】
影像识别方法及其装置及人工智能模型训练方法及其装置


[0001]本专利技术涉及一种影像识别方法及其装置及人工智能模型训练方法及其装置,且特别涉及一种以低成本降低动作识别错误率的影像识别方法及电子装置。

技术介绍

[0002]在动作识别领域中,若背景环境中有其他人的干扰可能会造成针对特定使用者的动作出现误判。以手势识别为例,当使用者在电脑前方通过手势来操作投影片,系统可能误判识别到背景其他人的手势而出现错误操作。在现有方法中可以先通过人脸识别来锁定特定使用者或通过深度影像感测器来锁定较近的使用者,但这些方法会增加识别时间及硬件成本,而无法实作于硬件资源有限的电子装置。因此,如何以低成本降低动作识别错误率是本领域技术人员应致力的目标。

技术实现思路

[0003]有鉴于此,本专利技术提供一种影像识别方法及其装置及人工智能模型训练方法及其装置,能采用低成本方式来降低动作识别的错误率。
[0004]本专利技术提出一种影像识别方法,包括:通过影像感测器获取输入影像;检测所述输入影像中的物体及对应所述物体的多个特征点,并获得所述多个特本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种影像识别方法,其特征在于,包括:通过影像感测器获取输入影像;检测所述输入影像中的物体及对应所述物体的多个特征点,并获得所述多个特征点的实时二维坐标信息;通过人工智能模型根据所述多个特征点的所述实时二维坐标信息判断所述物体与所述影像感测器之间的距离;以及当所述距离小于或等于门限值时对所述物体进行动作识别操作。2.如权利要求1所述的影像识别方法,其特征在于,还包括:以多个训练影像的训练物体的多个训练特征点的二维坐标信息及三维坐标信息作为输入信息来训练所述人工智能模型。3.如权利要求1所述的影像识别方法,其特征在于,还包括:当所述距离大于所述门限值时则不对所述物体进行所述动作识别操作。4.如权利要求1所述的影像识别方法,其特征在于,所述物体包括手且所述多个特征点为所述手的多个关节点,所述多个关节点对应所述手的指尖、掌心及手指根部的至少其中之一或其组合。5.如权利要求1所述的影像识别方法,其特征在于,所述影像感测器为彩色相机。6.一种人工智能模型训练方法,其特征在于,所述人工智能模型训练方法适用于训练所述人工智能模型使所述人工智能模型在推论阶段判断输入影像中物体与影像感测器的距离,所述人工智能模型训练方法包括:通过深度影像感测器获取训练影像;检测所述训练影像中的训练物体及对应所述训练物体的多个训练特征点,并获得所述训练物体的所述多个训练特征点的二维坐标信息及三维坐标信息;以及以所述训练物体的所述二维坐标信息及所述三维坐标信息作为输入信息来训练人工智能模型根据所述输入影像中物体的多个特征点的实时二维坐标信息判断所述输入影像中物体与所述影像感测器的距离。7.如权利要求6所述的人工智能模型训练方法,其特征在于,还包括:根据所述训练物体的所述多个训练特征点的所述三维坐标信息计算所述训练物体的所述多个训练特征点与所述深度影像感测器的平均距离以获得所述训练物体与所述深度影像感测器之间的距离。8.如权利要求6所述的人工智能模型训练方法,其特征在于,所述深度影像感测器的投影矩阵将所述物体的所述多个训练特征点的所述二维坐标信息转换为所述三维坐标信息。9.如权利要求6所述的人工智能模型训练方法,其特征在于,还包括:产生包括所述训练特征点的所述二维坐标信息及所述三维坐标信息的注解,并根据所述注解及所述训练影像来训练所述人工智能模型。10.如权利要求6所述的人工智能模型训练方法,其特征在于,还包括:产生包括所述训练特征点的所述二维坐标信息及所述物体到所述深度影像感测器的距离的注解,并根据所述注解及所述训练影像来训练所述人工智能模型。11.一种影像识别装置,其特征在于,包括:影像感测器,用以获取输入影...

【专利技术属性】
技术研发人员:陈柏森
申请(专利权)人:和硕联合科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1