一种可区分声源的AR眼镜制造技术

技术编号:35292439 阅读:25 留言:0更新日期:2022-10-22 12:38
本发明专利技术公开了一种可区分声源的AR眼镜,包括镜框、镜腿和眼镜显示屏、主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器,第一麦克风组件包括并排穿设于同一镜腿的第一麦克风和第二麦克风;第二麦克风组件包括对称穿设于镜框底部的第三麦克风和第四麦克风;主板、各音频处理器和无线通讯模块内置于镜框,第一麦克风组件与第一音频处理器电连接,第二麦克风组件与第二音频处理器电连接,眼镜显示屏、各音频处理器和无线通讯模块均与主板电连接;工作时通过计算声源角度区分声源主体并进行响应。该装置可区分声源主体,减少环境音干扰,便于语音识别交互,且避免占用大量算力和内存,受环境影响小,运用灵活。运用灵活。运用灵活。

【技术实现步骤摘要】
一种可区分声源的AR眼镜


[0001]本专利技术属于AR眼镜
,具体涉及一种可区分声源的AR眼镜。

技术介绍

[0002]AR眼镜为现代科技的新型产物,现有语音识别技术通过简单的采用单麦克风或者双麦克风统一拾取声音信号进行识别、以及统一拾取声音信号配合摄像头图像采集加以定向识别。
[0003]其中,采用单麦克风或者双麦克风统一拾取声音信号进行识别:通过TTS语音技术将得到的语音转化为文本内容,再经过算法处理执行后续操作,例如将转化后的文本内容显示到AR眼镜显示屏,或者提取文本内关键词判断下一步操作,如播放视频、面对面翻译等。但缺点是拾取的声音有较大噪声,容易受到外界环境干扰,需要软件算法纠错,占用算力和内存的同时,也会存在很多无用语音信息,无法准确定位到佩戴者输出的语音信息,不能灵活快速运用。而采用统一拾取声音配合摄像头图像采集加以定向识别:如授权公告号CN110188179 B的中国专利公开了一种语音定向识别交互方法,包括如下步骤:拾取正前方的声音信号进行识别,得到语音文本内容,获取该语音文本内容;基于图像采集角度和采集距离,获取同时满足所述图像采集角度和所述采集距离的人脸图像;根据所述语音文本内容和所述人脸图像,判断是否作出回复;其中,所述图像采集角度为60

70度,所述采集距离小于等于1m。缺点是使用的摄像头图像采集角度较小,一般会在70度以内,采集的距离往往在1米内有效,这两个条件对定向语音识别对象要求过于严格,实际应用场景局限性较大,也无法准确定位扑捉到佩戴者的语音信息作为后续的语音指令。

技术实现思路

[0004]本专利技术的目的在于针对上述问题,提出一种可区分声源的AR眼镜,该AR眼镜可区分声源主体,减少周围环境声音的干扰,便于实现语音识别交互,且避免占用大量算力和内存,受环境影响小,运用灵活。
[0005]为实现上述目的,本专利技术所采取的技术方案为:
[0006]本专利技术提出的一种可区分声源的AR眼镜,包括镜框、镜腿和眼镜显示屏,还包括主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器,其中:
[0007]第一麦克风组件包括第一麦克风和第二麦克风,第一麦克风和第二麦克风沿水平方向并排穿设于同一镜腿的外侧,且第二麦克风靠近眼镜显示屏设置;
[0008]第二麦克风组件包括第三麦克风和第四麦克风,第三麦克风和第四麦克风对称穿设于镜框的底部;
[0009]主板、第一音频处理器、第二音频处理器和无线通讯模块内置于镜框,第一麦克风和第二麦克风均与第一音频处理器电连接,第三麦克风和第四麦克风均与第二音频处理器电连接,眼镜显示屏、第一音频处理器、第二音频处理器和无线通讯模块均与主板电连接;
[0010]工作状态下,第一麦克风和第二麦克风采集声源信息并将声源信息传输至第一音频处理器,第一音频处理器根据接收的声源信息计算第一声源角度,第一声源角度为声源发出点分别与第一麦克风和第二麦克风连线的夹角,第三麦克风和第四麦克风采集声源信息并将声源信息传输至第二音频处理器,第二音频处理器根据接收的声源信息计算第二声源角度,第二声源角度为声源发出点和第三麦克风之间的连线与镜框的对称面的夹角,主板执行如下操作:
[0011]当第一声源角度大于等于第一预设角度时,认为声源信息来自眼镜佩戴主体并作为命令词或唤醒词进行响应,判断第二声源角度是否大于第二预设角度,若是,认为声源信息来自交流对象,主板接收对应的声源信息并通过无线通讯模块发送至外部设备进行解析,解析后的声源信息回传至主板并投影至眼镜显示屏,否则,认为声源信息来自眼镜佩戴主体,不进行响应。
[0012]优选地,第一麦克风组件和第二麦克风组件均为MIC线性阵列数字硅麦。
[0013]优选地,第一麦克风和第二麦克风的间距为80mm~100mm,第二麦克风与眼镜显示屏的前壁间距为20mm~24mm。
[0014]优选地,第三麦克风和第四麦克风的间距小于等于10mm。
[0015]优选地,第一预设角度为30
°
~90
°
,第二预设角度为0
°
~20
°

[0016]优选地,第一预设角度为54
°
~58
°
,第二预设角度为2
°
~8
°

[0017]优选地,音频处理器的型号为ZL38063。
[0018]优选地,解析后的声源信息为文本信息或图形信息。
[0019]与现有技术相比,本专利技术的有益效果为:
[0020]1)该AR眼镜通过优化麦克风的位置并配合音频处理器计算声源角度区分声源主体,大大减少周围环境声音的干扰,可精准识别佩戴主体语音信息进行语音识别交互,减少失误,提高了佩戴者的体验感,并避免占用大量算力和内存,且相对于现有技术,受环境(如采集角度、采集距离、光线等)影响小,运用灵活;
[0021]2)通过区分佩戴主体和交流对象的语音,定向实现佩戴主体的语音唤醒和交流对象的语音图文交互,可选择性接收交流对象的语音并结合外部设备(如服务器、手机等)实现云端识别解析,转化为文本或图形在眼镜显示屏上显示,应用场景广泛。
附图说明
[0022]图1为本专利技术可区分声源的AR眼镜的结构示意图;
[0023]图2为本专利技术人体佩戴AR眼镜的侧视图;
[0024]图3为本专利技术人体佩戴AR眼镜的正视图;
[0025]图4为本专利技术可区分声源的AR眼镜的电路原理图。
[0026]附图标记说明:1、镜框;2、镜腿;3、眼镜显示屏;11、第三麦克风;12、第四麦克风;21、第一麦克风;22、第二麦克风。
具体实施方式
[0027]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本
申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]需要说明的是,当组件被称为与另一个组件“连接”时,它可以直接与另一个组件连接或者也可以存在居中的组件。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本申请。
[0029]如图1

4所示,一种可区分声源的AR眼镜,包括镜框1、镜腿2和眼镜显示屏3,还包括主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器,其中:
[0030]第一麦克风组件包括第一麦克风21和第二麦克风22,第一麦克风21和第二麦克风22沿水平方向并排穿设于同一镜腿2的外侧,且第二麦克风22靠近眼镜显示屏3设置;
[0031]第二麦克风组件包括第三麦克风11和第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可区分声源的AR眼镜,包括镜框、镜腿和眼镜显示屏,其特征在于:所述可区分声源的AR眼镜还包括主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器,其中:所述第一麦克风组件包括第一麦克风和第二麦克风,所述第一麦克风和第二麦克风沿水平方向并排穿设于同一所述镜腿的外侧,且所述第二麦克风靠近所述眼镜显示屏设置;所述第二麦克风组件包括第三麦克风和第四麦克风,所述第三麦克风和第四麦克风对称穿设于所述镜框的底部;所述主板、第一音频处理器、第二音频处理器和无线通讯模块内置于所述镜框,所述第一麦克风和第二麦克风均与所述第一音频处理器电连接,所述第三麦克风和第四麦克风均与所述第二音频处理器电连接,所述眼镜显示屏、第一音频处理器、第二音频处理器和无线通讯模块均与所述主板电连接;工作状态下,所述第一麦克风和第二麦克风采集声源信息并将声源信息传输至所述第一音频处理器,所述第一音频处理器根据接收的声源信息计算第一声源角度,所述第一声源角度为声源发出点分别与所述第一麦克风和第二麦克风连线的夹角,所述第三麦克风和第四麦克风采集声源信息并将声源信息传输至所述第二音频处理器,所述第二音频处理器根据接收的声源信息计算第二声源角度,所述第二声源角度为声源发出点和所述第三麦克风之间的连线与所述镜框的对称面的夹角,所述主板执行如下操作:当所述第一声源角度大于等于第一预设角度时,认为声源信息来自眼镜佩戴主体并作为命令词或唤醒词进行响应,判断所述第二声源角度是否大于第二预...

【专利技术属性】
技术研发人员:华建飞王格陈鹏辉
申请(专利权)人:江西凤凰光学科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1