【技术实现步骤摘要】
本专利技术涉及图像处理的,特别涉及一种ai眼镜的多模态交互和图像处理方法、电子设备和存储介质。
技术介绍
1、ai眼镜融入日常生活与诸多专业领域。日常生活里,用户希望用它便捷识别感兴趣物体、追踪行进标识、社交时优化捕捉的图像。
2、但传统图像追踪技术有缺陷,常侧重单模态或仅依赖图像静态特征,没顾及实际场景动态变化与多模态融合优势。目前的图像追踪,在目标突然加速、转向、被遮挡,就容易丢目标,无法预测目标的后续出现位置,因此无法稳定追踪目标。
技术实现思路
1、本专利技术的主要目的为提供一种ai眼镜的多模态交互和图像处理方法、电子设备和存储介质,旨在克服当前无法预测目标的后续出现位置,以及无法稳定追踪目标的缺陷。
2、为实现上述目的,本专利技术提供了一种ai眼镜的多模态交互和图像处理方法,包括以下步骤:
3、基于时空注意力机制对ai眼镜实时采集的原始图像进行预处理,得到预处理图像;对用户通过ai眼镜输入的语音指令进行语音识别与语义解析,得到文本指令;
...【技术保护点】
1.一种AI眼镜的多模态交互和图像处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的AI眼镜的多模态交互和图像处理方法,其特征在于,其中,所述卡尔曼滤波算法根据目标运动的历史加速度、角速度动态调整卡尔曼滤波算法中预测模型的噪声协方差矩阵,以提升预测精度。
3.根据权利要求1所述的AI眼镜的多模态交互和图像处理方法,其特征在于,实现对目标的稳定追踪并输出追踪目标图像序列之后,还包括:
4.根据权利要求1所述的AI眼镜的多模态交互和图像处理方法,其特征在于,基于时空注意力机制对AI眼镜实时采集的原始图像进行预处理,得到预处理
...【技术特征摘要】
1.一种ai眼镜的多模态交互和图像处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的ai眼镜的多模态交互和图像处理方法,其特征在于,其中,所述卡尔曼滤波算法根据目标运动的历史加速度、角速度动态调整卡尔曼滤波算法中预测模型的噪声协方差矩阵,以提升预测精度。
3.根据权利要求1所述的ai眼镜的多模态交互和图像处理方法,其特征在于,实现对目标的稳定追踪并输出追踪目标图像序列之后,还包括:
4.根据权利要求1所述的ai眼镜的多模态交互和图像处理方法,其特征在于,基于时空注意力机制对ai眼镜实时采集的原始图像进行预处理,得到预处理图像,包括:
5.根据权利要求1所述的ai眼镜的多模态交互和图像处理方法,其特征在于,基于所述孪生网络实时学习...
【专利技术属性】
技术研发人员:车建波,
申请(专利权)人:深圳市贝铂智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。