一种用于智能眼镜的语音交互处理方法技术

技术编号：39752657 阅读：10 留言：0更新日期：2023-12-17 23:51

本发明专利技术涉及音频信号数据处理技术领域，具体涉及一种用于智能眼镜的语音交互处理方法，包括：采集智能眼镜的语音信号以及震动数据；根据语音信号以及震动数据获取语音段以及模拟噪声信号；根据语音段以及模拟噪声信号获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度；根据所有模拟噪声信号段以及语音段获取所有模拟噪声信号段对语音段进行去噪后的可读性；根据差异程度以及可读性，获取所有模拟噪声信号段与语音段的匹配程度参数；根据匹配程度参数获取最匹配语音段的模拟噪声信号段

全部详细技术资料下载

【技术实现步骤摘要】
一种用于智能眼镜的语音交互处理方法

[0001]本专利技术涉及音频信号数据处理
，具体涉及一种用于智能眼镜的语音交互处理方法
。

技术介绍

[0002]智能眼镜的概念已经存在了很长时间，但直到近年来，智能眼镜才开始进入大众市场
。
作为一种新型的可穿戴设备，智能眼镜可以将计算机
、
传感器和显示器集成到眼镜中，为用户提供更加便捷的信息获取和交互方式
。
其中，语音交互作为智能眼镜的重要组成部分，需要与用户进行实时的双向通信，这对于提高用户体验至关重要
。
现阶段大众市场对智能眼镜的应用主要在运动领域，用户可以在运动时通过语音交互功能更便捷
、
安全地获取信息
。
[0003]但当前智能眼镜在运动领域的使用过程中，由于运动时眼镜本身上下颠簸或风噪声等其他外界干扰问题，导致用户说话时接收的语音信号存在一定噪声，因此其语音识别的过程中总是存在一定误识别或漏识别等问题
。
而当前的信号降噪增强技术对于智能眼镜的语音交互场景而言，其计算量过大，且对于语音识别模块而言，降噪结果不够理想，因此智能眼镜当前使用场景下仍需要一种更优化的智能语音交互处理方法
。

技术实现思路

[0004]本专利技术提供一种用于智能眼镜的语音交互处理方法，以解决现有的问题
。
[0005]本专利技术的一种用于智能眼镜的语音交互处理方法采用如下技术方案：本专利技术一个实施例提供了一种用于智能眼...

【技术保护点】

【技术特征摘要】
1.
一种用于智能眼镜的语音交互处理方法，其特征在于，该方法包括以下步骤：采集智能眼镜的语音信号以及智能眼镜自身的震动数据；根据语音信号获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段，并将语音信号中的用户与智能眼镜语音交互的语音信号段记为语音段，将语音信号中的用户不与智能眼镜语音交互的语音信号段记为参考段；根据智能眼镜自身的震动数据获取震幅曲线；根据参考段以及震幅曲线获取模拟噪声信号；根据语音段以及模拟噪声信号获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度；根据所有模拟噪声信号段对语音段进行去噪，获取所有模拟噪声信号段对语音段进行去噪后的可读性；根据所有模拟噪声信号段与语音段内小波动的差异程度以及所有模拟噪声信号段对语音段进行去噪后的可读性，获取所有模拟噪声信号段与语音段的匹配程度参数；根据所有模拟噪声信号段与语音段的匹配程度参数获取最匹配语音段的模拟噪声信号段；根据最匹配语音段的模拟噪声信号段对语音段进行降噪；利用降噪后的语音段进行智能眼镜交互
。2.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法，其特征在于，所述获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段，包括的具体步骤如下：通过最小二乘法对智能眼镜采集的语音信号的幅值进行拟合，得到语音信号拟合曲线；然后获取语音信号拟合曲线中的所有拐点；接着计算语音信号中的语音信号幅值均值，将语音信号拟合曲线中语音信号幅值小于语音信号幅值均值的拐点作为目标拐点；利用语音信号拟合曲线中的所有目标拐点对语音信号拟合曲线进行分割，得到若干拟合曲线段；若拟合曲线段中除两个端点外存在其他极大值点，则拟合曲线段为语音信号中的用户与智能眼镜语音交互的语音信号段；若拟合曲线段中除两个端点外不存在其他极大值点，则拟合曲线段为语音信号中的用户不与智能眼镜语音交互的语音信号段
。3.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法，其特征在于，所述获取震幅曲线，包括的具体步骤如下：根据采集智能眼镜自身的震动数据绘制震幅曲线，所述震幅曲线的横轴为时间，纵轴为智能眼镜的震动幅度
。4.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法，其特征在于，所述根据参考段以及震幅曲线获取模拟噪声信号，包括的具体步骤如下：通过将震幅曲线的最大幅值与最小幅值，结合所有参考段中最大的幅值与最小幅值，对震幅曲线进行等比缩放，使缩放后的震幅曲线的最大幅值等于所有参考段中最大的幅值，且缩放后的震幅曲线的最小幅值等于所有参考段中最小的幅值，将缩放后的震幅曲线记为模拟噪声信号
。5.
根据权利要求4所述一种用于智能眼镜的语音交互处理方法，其特征在于，所述对震幅曲线进行等比缩放，包括的具体计算公式如下：
式中，表示模拟噪声信号；表示震...

【专利技术属性】
技术研发人员：陈旭，
申请(专利权)人：深圳市魔样科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人