一种用于AR眼镜的远程语音交互方法及系统技术方案

技术编号:41465741 阅读:25 留言:0更新日期:2024-05-30 14:21
本申请涉及增强现实的技术领域,公开了一种用于AR眼镜的远程语音交互方法及系统,所述方法包括获取影像录制数据和音频录制数据并输入至影音分析模型中,分析所述音频录制数据,生成若干音源文本信息并标记对应的音源标识信息和时间轴信息;分析所述影像录制数据,识别若干音频来源图像,基于各音频来源图像的动作特征和各音源文本信息的时间轴信息,将音源标识信息与音频来源图像关联;基于各音频来源图像分析对应的音源位置信息,基于各音源位置信息和对应的音源文本信息,生成字幕投影数据并发送至显示组件;本申请具有提高听力辅助产品的语音信息获取效率的效果。

【技术实现步骤摘要】

本申请涉及增强现实的,尤其是涉及一种用于ar眼镜的远程语音交互方法及系统。


技术介绍

1、为提高听障人员的生活体验,目前市场上已有许多听力辅助产品,例如助听器,具有实时语音文本转换功能的录音笔等,然而,助听器对完全失去听力的人员来说无法起到作用,而使用语音文本转换功能的录音笔则通常只能使听障人员进行一对一的交流,在一对多的交流场景中则难以判断发言人;针对上述相关技术可知,现有的听力辅助产品对于听障人员仍存在信息获取不便的问题。


技术实现思路

1、为了提高听力辅助产品的语音信息获取效率,本申请提供一种用于ar眼镜的远程语音交互方法及系统。

2、本申请的专利技术目的一采用如下技术方案实现:

3、一种用于ar眼镜的远程语音交互方法,包括:

4、获取影像录制数据和音频录制数据并输入至影音分析模型中,分析所述音频录制数据,生成若干音源文本信息并标记对应的音源标识信息和时间轴信息;

5、分析所述影像录制数据,识别若干音频来源图像,基于各音频来源图像的动作特征和各音源文本信息本文档来自技高网...

【技术保护点】

1.一种用于AR眼镜的远程语音交互方法,其特征在于,包括:

2.根据权利要求1所述的一种用于AR眼镜的远程语音交互方法,其特征在于:所述AR眼镜还包括通信组件;

3.根据权利要求1所述的一种用于AR眼镜的远程语音交互方法,其特征在于:所述影像录制数据的影像中设置有目标选择框;所述显示组件的显示区域设置有与目标选择框对应的选择框图像;

4.根据权利要求1所述的一种用于AR眼镜的远程语音交互方法,其特征在于:所述影音分析模型还包括图像测距算法;

5.根据权利要求1所述的一种用于AR眼镜的远程语音交互方法,其特征在于:所述基于各音频来源图像分析对...

【技术特征摘要】

1.一种用于ar眼镜的远程语音交互方法,其特征在于,包括:

2.根据权利要求1所述的一种用于ar眼镜的远程语音交互方法,其特征在于:所述ar眼镜还包括通信组件;

3.根据权利要求1所述的一种用于ar眼镜的远程语音交互方法,其特征在于:所述影像录制数据的影像中设置有目标选择框;所述显示组件的显示区域设置有与目标选择框对应的选择框图像;

4.根据权利要求1所述的一种用于ar眼镜的远程语音交互方法,其特征在于:所述影音分析模型还包括图像测距算法;

5.根据权利要求1所述的一种用于ar眼镜的远程语音交互方法,其特征在于:所述基于各音频来源图像分析对应的音源位置信息,基于各音源位置信息和对应的音源文本信息,生成字幕投影数据并发送至显示组件之后,包括:

6.根据权利要求1所述的一种用于ar眼镜的远程语音交互方法,其特征在于:所述基...

【专利技术属性】
技术研发人员:汪谦益徐力何松青柒树培
申请(专利权)人:东莞市三奕电子科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1