一种可区分声源的AR眼镜制造技术

技术编号：35292439 阅读：25 留言：0更新日期：2022-10-22 12:38

本发明专利技术公开了一种可区分声源的AR眼镜，包括镜框、镜腿和眼镜显示屏、主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器，第一麦克风组件包括并排穿设于同一镜腿的第一麦克风和第二麦克风；第二麦克风组件包括对称穿设于镜框底部的第三麦克风和第四麦克风；主板、各音频处理器和无线通讯模块内置于镜框，第一麦克风组件与第一音频处理器电连接，第二麦克风组件与第二音频处理器电连接，眼镜显示屏、各音频处理器和无线通讯模块均与主板电连接；工作时通过计算声源角度区分声源主体并进行响应。该装置可区分声源主体，减少环境音干扰，便于语音识别交互，且避免占用大量算力和内存，受环境影响小，运用灵活。运用灵活。运用灵活。

全部详细技术资料下载

【技术实现步骤摘要】
一种可区分声源的AR眼镜

[0001]本专利技术属于AR眼镜
，具体涉及一种可区分声源的AR眼镜。

技术介绍

[0002]AR眼镜为现代科技的新型产物，现有语音识别技术通过简单的采用单麦克风或者双麦克风统一拾取声音信号进行识别、以及统一拾取声音信号配合摄像头图像采集加以定向识别。
[0003]其中，采用单麦克风或者双麦克风统一拾取声音信号进行识别：通过TTS语音技术将得到的语音转化为文本内容，再经过算法处理执行后续操作，例如将转化后的文本内容显示到AR眼镜显示屏，或者提取文本内关键词判断下一步操作，如播放视频、面对面翻译等。但缺点是拾取的声音有较大噪声，容易受到外界环境干扰，需要软件算法纠错，占用算力和内存的同时，也会存在很多无用语音信息，无法准确定位到佩戴者输出的语音信息，不能灵活快速运用。而采用统一拾取声音配合摄像头图像采集加以定向识别：如授权公告号CN110188179 B的中国专利公开了一种语音定向识别交互方法，包括如下步骤：拾取正前方的声音信号进行识别，得到语音文本内容，获取该语音文本内容；基于图像采集角度和采集距离，获取同时满足所述图像采集角度和所述采集距离的人脸图像；根据所述语音文本内容和所述人脸图像，判断是否作出回复；其中，所述图像采集角度为60
‑
70度，所述采集距离小于等于1m。缺点是使用的摄像头图像采集角度较小，一般会在70度以内，采集的距离往往在1米内有效，这两个条件对定向语音识别对象要求过于严格，实际应用场景局限性较大，也无法准确定位扑捉到佩戴者的语音信息作为...

【技术保护点】

【技术特征摘要】
1.一种可区分声源的AR眼镜，包括镜框、镜腿和眼镜显示屏，其特征在于：所述可区分声源的AR眼镜还包括主板、第一麦克风组件、第二麦克风组件、无线通讯模块、第一音频处理器和第二音频处理器，其中：所述第一麦克风组件包括第一麦克风和第二麦克风，所述第一麦克风和第二麦克风沿水平方向并排穿设于同一所述镜腿的外侧，且所述第二麦克风靠近所述眼镜显示屏设置；所述第二麦克风组件包括第三麦克风和第四麦克风，所述第三麦克风和第四麦克风对称穿设于所述镜框的底部；所述主板、第一音频处理器、第二音频处理器和无线通讯模块内置于所述镜框，所述第一麦克风和第二麦克风均与所述第一音频处理器电连接，所述第三麦克风和第四麦克风均与所述第二音频处理器电连接，所述眼镜显示屏、第一音频处理器、第二音频处理器和无线通讯模块均与所述主板电连接；工作状态下，所述第一麦克风和第二麦克风采集声源信息并将声源信息传输至所述第一音频处理器，所述第一音频处理器根据接收的声源信息计算第一声源角度，所述第一声源角度为声源发出点分别与所述第一麦克风和第二麦克风连线的夹角，所述第三麦克风和第四麦克风采集声源信息并将声源信息传输至所述第二音频处理器，所述第二音频处理器根据接收的声源信息计算第二声源角度，所述第二声源角度为声源发出点和所述第三麦克风之间的连线与所述镜框的对称面的夹角，所述主板执行如下操作：当所述第一声源角度大于等于第一预设角度时，认为声源信息来自眼镜佩戴主体并作为命令词或唤醒词进行响应，判断所述第二声源角度是否大于第二预...

【专利技术属性】
技术研发人员：华建飞，王格，陈鹏辉，
申请(专利权)人：江西凤凰光学科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人