一种用于智能眼镜的语音交互处理方法技术

技术编号:39752657 阅读:10 留言:0更新日期:2023-12-17 23:51
本发明专利技术涉及音频信号数据处理技术领域,具体涉及一种用于智能眼镜的语音交互处理方法,包括:采集智能眼镜的语音信号以及震动数据;根据语音信号以及震动数据获取语音段以及模拟噪声信号;根据语音段以及模拟噪声信号获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度;根据所有模拟噪声信号段以及语音段获取所有模拟噪声信号段对语音段进行去噪后的可读性;根据差异程度以及可读性,获取所有模拟噪声信号段与语音段的匹配程度参数;根据匹配程度参数获取最匹配语音段的模拟噪声信号段

【技术实现步骤摘要】
一种用于智能眼镜的语音交互处理方法


[0001]本专利技术涉及音频信号数据处理
,具体涉及一种用于智能眼镜的语音交互处理方法


技术介绍

[0002]智能眼镜的概念已经存在了很长时间,但直到近年来,智能眼镜才开始进入大众市场

作为一种新型的可穿戴设备,智能眼镜可以将计算机

传感器和显示器集成到眼镜中,为用户提供更加便捷的信息获取和交互方式

其中,语音交互作为智能眼镜的重要组成部分,需要与用户进行实时的双向通信,这对于提高用户体验至关重要

现阶段大众市场对智能眼镜的应用主要在运动领域,用户可以在运动时通过语音交互功能更便捷

安全地获取信息

[0003]但当前智能眼镜在运动领域的使用过程中,由于运动时眼镜本身上下颠簸或风噪声等其他外界干扰问题,导致用户说话时接收的语音信号存在一定噪声,因此其语音识别的过程中总是存在一定误识别或漏识别等问题

而当前的信号降噪增强技术对于智能眼镜的语音交互场景而言,其计算量过大,且对于语音识别模块而言,降噪结果不够理想,因此智能眼镜当前使用场景下仍需要一种更优化的智能语音交互处理方法


技术实现思路

[0004]本专利技术提供一种用于智能眼镜的语音交互处理方法,以解决现有的问题

[0005]本专利技术的一种用于智能眼镜的语音交互处理方法采用如下技术方案:本专利技术一个实施例提供了一种用于智能眼镜的语音交互处理方法,该方法包括以下步骤:采集智能眼镜的语音信号以及智能眼镜自身的震动数据;根据语音信号获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段,并将语音信号中的用户与智能眼镜语音交互的语音信号段记为语音段,将语音信号中的用户不与智能眼镜语音交互的语音信号段记为参考段;根据智能眼镜自身的震动数据获取震幅曲线;根据参考段以及震幅曲线获取模拟噪声信号;根据语音段以及模拟噪声信号获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度;根据所有模拟噪声信号段对语音段进行去噪,获取所有模拟噪声信号段对语音段进行去噪后的可读性;根据所有模拟噪声信号段与语音段内小波动的差异程度以及所有模拟噪声信号段对语音段进行去噪后的可读性,获取所有模拟噪声信号段与语音段的匹配程度参数;根据所有模拟噪声信号段与语音段的匹配程度参数获取最匹配语音段的模拟噪声信号段;根据最匹配语音段的模拟噪声信号段对语音段进行降噪;利用降噪后的语音段进行智能眼镜交互

[0006]优选的,所述获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段,包括的具体步骤如下:通过最小二乘法对智能眼镜采集的语音信号的幅值进行拟合,得到语音信号拟合曲线;然后获取语音信号拟合曲线中的所有拐点;接着计算语音信号中的语音信号幅值均值,将语音信号拟合曲线中语音信号幅值小于语音信号幅值均值的拐点作为目标拐点;利用语音信号拟合曲线中的所有目标拐点对语音信号拟合曲线进行分割,得到若干拟合曲线段;若拟合曲线段中除两个端点外存在其他极大值点,则拟合曲线段为语音信号中的用户与智能眼镜语音交互的语音信号段;若拟合曲线段中除两个端点外不存在其他极大值点,则拟合曲线段为语音信号中的用户不与智能眼镜语音交互的语音信号段

[0007]优选的,所述获取震幅曲线,包括的具体步骤如下:根据采集智能眼镜自身的震动数据绘制震幅曲线,所述震幅曲线的横轴为时间,纵轴为智能眼镜的震动幅度

[0008]优选的,所述根据参考段以及震幅曲线获取模拟噪声信号,包括的具体步骤如下:通过将震幅曲线的最大幅值与最小幅值,结合所有参考段中最大的幅值与最小幅值,对震幅曲线进行等比缩放,使缩放后的震幅曲线的最大幅值等于所有参考段中最大的幅值,且缩放后的震幅曲线的最小幅值等于所有参考段中最小的幅值,将缩放后的震幅曲线记为模拟噪声信号

[0009]优选的,所述对震幅曲线进行等比缩放,包括的具体计算公式如下:
[0010]式中,表示模拟噪声信号;表示震幅曲线;表示震幅曲线中最大的幅值;表示震幅曲线中最小的幅值;表示所有参考段中最大的幅值;表示所有参考段中最小的幅值

[0011]优选的,所述获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度,包括的具体步骤如下:统计语音段内小波动的数量记为,所述语音段内小波动为语音段内相邻的极大值点与极小值点之间的曲线,语音段内第一个数据点对应的时刻记为起始时刻;然后从模拟信号中起始时刻开始选取个小波动的作为第一模拟噪声信号段;计算第一模拟噪声信号段与语音段内小波动的差异程度;接着从模拟信号中起始时刻的下1个时刻开始选取个小波动的作为第二模拟噪声信号段;计算第二模拟噪声信号段与语音段内小波动的差异程度;然后从模拟信号中起始时刻的下2个时刻开始选取个小波动的作为第三模拟噪声信号段;计算第三模拟噪声信号段与语音段内小波动的差异程度;以此类推,直至从模拟信号中起始时刻的下个时刻开始选取个小波动的作为第模拟噪声信号段;计算第模拟噪声信号段与语音段内小波动的差异程度为止,所述为预设的延迟范围,至此得到所有模拟噪声信号段与语音段内小波动的差异程度

[0012]优选的,所述模拟噪声信号段与语音段内小波动的差异程度的具体计算公式如下:
[0013]式中,表示模拟噪声信号段与语音段内小波动的差异程度;表示语音段上第个小波动两端幅值差的绝对值;表示模拟噪声信号段上第个小波动两端幅值的差;表示语音段上小波动的数量同时也表示模拟噪声信号段上小波动的数量;表示模拟噪声信号段上第个小波动的时间跨度;表示语音段信号上第个小波动的时间跨度

[0014]优选的,所述获取所有模拟噪声信号段对语音段进行去噪后的可读性,包括的具体计算公式如下:
[0015]式中,表示根据模拟噪声信号段对语音段进行去噪后的可读性;表示语音段内第个小波动上的数据点数量;表示语音段内第个小波动上的第个数据点的幅值;表示语音段内小波动的数量;表示语音段内第个小波动上的数据点幅值的均值;表示语音段内第个小波动上的数据点幅值的标准差

[0016]优选的,所述获取所有模拟噪声信号段与语音段的匹配程度参数,包括的具体计算公式如下:
[0017]式中,表示模拟噪声信号段与语音段的匹配程度参数;表示模拟噪声信号段与语音段内小波动的差异程度;表示根据模拟噪声信号段对语音段进行去噪后的可读性

[0018]优选的,所述获取最匹配语音段的模拟噪声信号段,包括的具体步骤如下:将所有模拟噪声信号段与语音段的匹配程度参数中最小的匹配参数所对应的模拟噪声信号段,作为最匹配语音段的模拟噪声信号段

[0019]本专利技术的技术方案的有益效果是:由于用户在运动时眼镜本身上下颠簸或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于智能眼镜的语音交互处理方法,其特征在于,该方法包括以下步骤:采集智能眼镜的语音信号以及智能眼镜自身的震动数据;根据语音信号获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段,并将语音信号中的用户与智能眼镜语音交互的语音信号段记为语音段,将语音信号中的用户不与智能眼镜语音交互的语音信号段记为参考段;根据智能眼镜自身的震动数据获取震幅曲线;根据参考段以及震幅曲线获取模拟噪声信号;根据语音段以及模拟噪声信号获取所有模拟噪声信号段并计算所有模拟噪声信号段与语音段内小波动的差异程度;根据所有模拟噪声信号段对语音段进行去噪,获取所有模拟噪声信号段对语音段进行去噪后的可读性;根据所有模拟噪声信号段与语音段内小波动的差异程度以及所有模拟噪声信号段对语音段进行去噪后的可读性,获取所有模拟噪声信号段与语音段的匹配程度参数;根据所有模拟噪声信号段与语音段的匹配程度参数获取最匹配语音段的模拟噪声信号段;根据最匹配语音段的模拟噪声信号段对语音段进行降噪;利用降噪后的语音段进行智能眼镜交互
。2.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法,其特征在于,所述获取语音信号中的用户与智能眼镜语音交互的语音信号段以及语音信号中的用户不与智能眼镜语音交互的语音信号段,包括的具体步骤如下:通过最小二乘法对智能眼镜采集的语音信号的幅值进行拟合,得到语音信号拟合曲线;然后获取语音信号拟合曲线中的所有拐点;接着计算语音信号中的语音信号幅值均值,将语音信号拟合曲线中语音信号幅值小于语音信号幅值均值的拐点作为目标拐点;利用语音信号拟合曲线中的所有目标拐点对语音信号拟合曲线进行分割,得到若干拟合曲线段;若拟合曲线段中除两个端点外存在其他极大值点,则拟合曲线段为语音信号中的用户与智能眼镜语音交互的语音信号段;若拟合曲线段中除两个端点外不存在其他极大值点,则拟合曲线段为语音信号中的用户不与智能眼镜语音交互的语音信号段
。3.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法,其特征在于,所述获取震幅曲线,包括的具体步骤如下:根据采集智能眼镜自身的震动数据绘制震幅曲线,所述震幅曲线的横轴为时间,纵轴为智能眼镜的震动幅度
。4.
根据权利要求1所述一种用于智能眼镜的语音交互处理方法,其特征在于,所述根据参考段以及震幅曲线获取模拟噪声信号,包括的具体步骤如下:通过将震幅曲线的最大幅值与最小幅值,结合所有参考段中最大的幅值与最小幅值,对震幅曲线进行等比缩放,使缩放后的震幅曲线的最大幅值等于所有参考段中最大的幅值,且缩放后的震幅曲线的最小幅值等于所有参考段中最小的幅值,将缩放后的震幅曲线记为模拟噪声信号
。5.
根据权利要求4所述一种用于智能眼镜的语音交互处理方法,其特征在于,所述对震幅曲线进行等比缩放,包括的具体计算公式如下:
式中,表示模拟噪声信号;表示震...

【专利技术属性】
技术研发人员:陈旭
申请(专利权)人:深圳市魔样科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1