基于智能眼镜的语音识别方法、智能眼镜和存储介质技术

技术编号：37390422 阅读：36 留言：0更新日期：2023-04-27 07:28

本申请公开了一种基于智能眼镜的语音识别方法、智能眼镜和存储介质，所述基于智能眼镜的语音识别方法包括：获取用户声音信号，将用户声音信号进行语义识别得到音频语义信息；检测用户的口型变化特征，将口型变化特征输入至收敛的唇语识别模型中，识别得到用户的唇语语义信息；根据音频语义信息和唇语语义信息，确定目标语义信息。本申请能提高智能眼镜在复杂环境中语音识别的准确率。杂环境中语音识别的准确率。杂环境中语音识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于智能眼镜的语音识别方法、智能眼镜和存储介质

[0001]本申请涉及增强现实
，尤其涉及一种基于智能眼镜的语音识别方法、智能眼镜和存储介质。

技术介绍

[0002]目前，用户与所佩戴的智能眼镜进行人机交互的场景，通常通过触屏、键盘/鼠标、遥控器、手势控制来实现。但是，对于智能眼镜的场景，特别是日常佩戴，上述方案需要用户用手操作特定的设备，或者触摸特定的部件(例如智能眼镜腿上的触摸屏等)，因此，交互上存在着种种限制，人机交互效率低。而通过对用户的声音信息进行识别的人机交互方式，往往会不可避免的遇到使用者语音与周围环境噪声、其他人员语音等噪音的混叠，造成语音识别率大大降低。

技术实现思路

[0003]本申请的主要目的在于提供一种基于智能眼镜的语音识别方法、智能眼镜和存储介质，旨在解决智能眼镜在复杂环境中语音识别的准确率低的技术问题。
[0004]为实现上述目的，本申请提供一种基于智能眼镜的语音识别方法，所述方法包括：
[0005]获取用户声音信号，将所述用户声音信号进行语义识别得到音频语义信息；
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于智能眼镜的语音识别方法，其特征在于，所述方法包括：获取用户声音信号，将所述用户声音信号进行语义识别得到音频语义信息；检测用户的口型变化特征，将所述口型变化特征输入至收敛的唇语识别模型中，识别得到用户的唇语语义信息；根据所述音频语义信息和所述唇语语义信息，确定目标语义信息。2.如权利要求1所述的基于智能眼镜的语音识别方法，其特征在于，所述根据所述音频语义信息和所述唇语语义信息，确定目标语义信息的步骤包括：检测所述音频语义信息的时域中是否存在音频识别失败时域段；若不存在音频识别失败时域段，则将所述音频语义信息作为所述目标语义信息；若存在音频识别失败时域段，则根据所述唇语语义信息对所述音频识别失败时域段进行修补处理，得到修补处理后的音频语义信息，并将修补处理后的音频语义信息作为目标语义信息。3.如权利要求2所述的基于智能眼镜的语音识别方法，其特征在于，在所述根据所述唇语语义信息对所述音频识别失败时域段进行修补处理的步骤之前，所述方法还包括：检测所述唇语语义信息的时域中是否存在唇语识别失败时域段；若不存在唇语识别失败时域段，则执行：所述根据所述唇语语义信息对所述音频识别失败时域段进行修补处理的步骤；若存在唇语识别失败时域段，则检测所述音频识别失败时域段和所述唇语识别失败时域段中是否存在重合的时域；若不存在重合的时域，则执行：所述根据所述唇语语义信息对所述音频识别失败时域段进行修补处理的步骤；若存在重合的时域，则根据所述唇语语义信息和所述音频语义信息，对重合的时域的唇语识别失败时域段进行语义预测，得到预测语义信息；并根据所述预测语义信息、所述唇语语义信息和音频语义信息，确定目标语义信息。4.如权利要求3所述的基于智能眼镜的语音识别方法，其特征在于，所述根据所述预测语义信息、所述唇语语义信息和音频语义信息，确定目标语义信息的步骤包括：将所述预测语义信息填补至重合的时域的唇语识别失败时域段中，完成预测语义填补过程；在所述预测语义填补过程完成后，根据所述唇语语义信息对所述音频识别失败时域段进行修补处理，得到修补处理后的音频语义信息，并将修补处理后的音频语义信息作为目标语义信息。5.如权利要求1所述的基于智能眼镜的语音识别方法，其特征在于，所述方法还包括：获取多个口型变化特征对应的用户口型样本，以及所述用户口型样本对应的用户实际发声...

【专利技术属性】
技术研发人员：张明慧，张宝峰，温增琦，
申请(专利权)人：歌尔科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人