交互式脑控耳机控制方法及装置、脑控耳机、存储介质制造方法及图纸

技术编号:39319760 阅读:9 留言:0更新日期:2023-11-12 16:01
本发明专利技术属于脑机接口技术领域,公开了一种交互式脑控耳机控制方法,通过实时采集当前环境的语音信号和用户的脑电信号,对脑电信号提取获得用户的注意力特征输入预先训练的第一分类模型,获得注意力方向和集中度,以确定用户的注意力状态;以及,对语音信号提取获得目标语音特征向量输入构建的第二分类模型,获得语音活动的预测概率,判断预测概率是否大于第一阈值且小于第二阈值;若否,根据注意力状态对语音信号进行降噪处理,从而可以实时关注用户的注意力状态,同时能够实时预测语音活动,作为个性化降噪处理的先决条件,实现个性化自适应的智能降噪。而且通过注意力状态实时调控,可适应各种未知噪声环境,扩大适用范围。扩大适用范围。扩大适用范围。

【技术实现步骤摘要】
交互式脑控耳机控制方法及装置、脑控耳机、存储介质


[0001]本专利技术属于脑机接口
,具体涉及一种交互式脑控耳机控制方法及装置、脑控耳机、存储介质。

技术介绍

[0002]随着语音交互式耳机的广泛应用,环境噪声对语音通话质量的影响日益突出。现有的主动降噪耳机技术,如采用过滤或模糊化处理来抑制环境噪声。这类固定模式处理存在一个普遍问题,那就是很难区分噪声中的语音成分,往往会造成语音细节的损失。
[0003]基于自适应算法的降噪方式通过分析环境噪声特征动态调整参数,效果较传统方法有所提升,但是这类方法依赖于准确提取噪声特征信息,在复杂环境下也会出现误判的可能。
[0004]另外,过度抑制背景噪声同样会削弱语音质量。近年来深度学习用于训练降噪模型,但这需要大量标注数据,且难以适应新的未知噪声环境。现有降噪技术普遍缺乏对个体差异的考虑,无法实现个性化自适应的降噪。

技术实现思路

[0005]本专利技术的目的在于提供一种交互式脑控耳机控制方法及装置、脑控耳机、存储介质,可以实现个性化自适应的降噪。
[0006]本专利技术第一方面公开一种交互式脑控耳机控制方法,包括:实时采集当前环境的语音信号和用户的脑电信号;对所述脑电信号进行特征提取,获得用户的注意力特征;将所述注意力特征输入预先训练的第一分类模型,获得注意力方向和集中度;根据注意力方向和集中度,确定用户的注意力状态;对所述语音信号进行特征提取,获得目标语音特征向量;将所述目标语音特征向量输入构建的第二分类模型,获得语音活动的预测概率;判断所述预测概率是否大于第一阈值且小于第二阈值;若否,根据所述注意力状态对语音信号进行降噪处理。
[0007]在一些实施例中,根据所述注意力状态对语音信号进行降噪处理,包括:若所述预测概率小于或等于第一阈值,判定所述语音信号为非语音段,根据所述注意力状态对语音信号进行第一降噪处理;若所述预测概率大于或等于第二阈值,判定所述语音信号为语音段,以及判断所述语音信号是否来自用户自身语音;若非来自用户自身语音,根据所述注意力状态对所述语音信号进行第二降噪处理。
[0008]在一些实施例中,根据所述注意力状态对语音信号进行第一降噪处理,包括:确定与所述注意力状态对应的滤波器目标参数,根据滤波器目标参数设计低通滤波器;
对所述语音信号进行快速傅里叶变换,得到频谱;将所述频谱与设计好的低通滤波器的频响进行频域乘法,得到滤波后的目标频谱;对滤波后的目标频谱进行傅里叶逆变换,得到滤波后的时域信号,将所述时域信号作为降噪处理结果输出。
[0009]在一些实施例中,所述目标语音特征向量包括所述语音信号的各个频带的语音特征向量;根据所述注意力状态对所述语音信号进行第二降噪处理,包括:将所述注意力特征及各个频带的语音特征向量输入训练好的回归模型,预测各个频带的目标控制量;根据各个频带的目标控制量,对所述语音信号的各个频带进行相应的降噪处理,综合所有频带生成降噪后的增强语音信号。
[0010]在一些实施例中,所述回归模型表示为:;其中,β(f) 为每个频带f通过学习设定的注意力状态权重参数;A表示注意力状态,F(A)为对注意力状态进行映射的函数值;X(f)表示频带f在当前时刻的语音特征向量;Xi(f)表示频带f在历史时刻i的历史特征向量;αi(f)是与历史特征向量Xi(f)对应的权重系数;K()是核函数,K(X(f),Xi(f)) 表示计算当前时刻的语音特征向量X(f)与每个历史特征向量Xi(f)的核匹配度;b(f) 是目标控制量 R(f) 的偏置项。
[0011]在一些实施例中,根据注意力方向和集中度,确定用户的注意力状态,包括:将注意力集中度映射成第一指标值;将注意力方向映射成第二指标值;根据所述第一指标值和所述第二指标值,确定用户的注意力状态。
[0012]在一些实施例中,将注意力方向映射成第二指标值,包括:获取所述语音信号的声源方位;计算所述注意力方向与所述声源方位之间的偏差角度;将所述偏差角度映射成对应的第二指标值。
[0013]本专利技术第二方面公开一种交互式脑控耳机控制装置,包括:采集单元,用于实时采集当前环境的语音信号和用户的脑电信号;第一提取单元,用于对所述脑电信号进行特征提取,获得用户的注意力特征;第一分类单元,用于将所述注意力特征输入预先训练的第一分类模型,获得注意力方向和集中度;确定单元,用于根据注意力方向和集中度,确定用户的注意力状态;第二提取单元,用于对所述语音信号进行特征提取,获得目标语音特征向量;第二分类单元,用于将所述目标语音特征向量输入构建的第二分类模型,获得语音活动的预测概率;判断单元,用于判断所述预测概率是否大于第一阈值且小于第二阈值;处理单元,用于在所述判断单元的判断结果为否时,根据所述注意力状态对语音信号进行降噪处理。
[0014]在一些实施例中,所述处理单元,包括以下子单元:
第一降噪子单元,用于在所述判断单元的判断结果为否且所述预测概率小于或等于第一阈值时,判定所述语音信号为非语音段,根据所述注意力状态对语音信号进行第一降噪处理;第二降噪子单元,用于在所述判断单元的判断结果为否且所述预测概率大于或等于第二阈值时,判定所述语音信号为语音段,以及判断所述语音信号是否来自用户自身语音;若非来自用户自身语音,根据所述注意力状态对所述语音信号进行第二降噪处理。
[0015]在一些实施例中,所述第一降噪子单元用于根据所述注意力状态对语音信号进行第一降噪处理的方式具体为:所述第一降噪子单元,用于确定与所述注意力状态对应的滤波器目标参数,根据滤波器目标参数设计低通滤波器;对所述语音信号进行快速傅里叶变换,得到频谱;将所述频谱与设计好的低通滤波器的频响进行频域乘法,得到滤波后的目标频谱;对滤波后的目标频谱进行傅里叶逆变换,得到滤波后的时域信号,将所述时域信号作为降噪处理结果输出。
[0016]在一些实施例中,所述目标语音特征向量包括所述语音信号的各个频带的语音特征向量;所述第二降噪子单元用于根据所述注意力状态对所述语音信号进行第二降噪处理的方式具体为:所述第二降噪子单元,用于将所述注意力特征及各个频带的语音特征向量输入训练好的回归模型,预测各个频带的目标控制量;以及,根据各个频带的目标控制量,对所述语音信号的各个频带进行相应的降噪处理,综合所有频带生成降噪后的增强语音信号。
[0017]在一些实施例中,所述确定单元包括以下子单元:第一映射子单元,用于将注意力集中度映射成第一指标值;第二映射子单元,用于将注意力方向映射成第二指标值;确定子单元,用于根据所述第一指标值和所述第二指标值,确定用户的注意力状态。
[0018]在一些实施例中,所述第二映射子单元包括以下模块:获取模块,用于获取所述语音信号的声源方位;计算模块,用于计算所述注意力方向与所述声源方位之间的偏差角度;映射模块,用于将所述偏差角度映射成对应的第二指标值。
[0019]本专利技术第三方面公开一种脑控耳机,包括存储有可执行程序代码的存储器以及与所述存储器耦合的处理器;所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.交互式脑控耳机控制方法,其特征在于,包括:实时采集当前环境的语音信号和用户的脑电信号;对所述脑电信号进行特征提取,获得用户的注意力特征;将所述注意力特征输入预先训练的第一分类模型,获得注意力方向和集中度;根据注意力方向和集中度,确定用户的注意力状态;对所述语音信号进行特征提取,获得目标语音特征向量;将所述目标语音特征向量输入构建的第二分类模型,获得语音活动的预测概率;判断所述预测概率是否大于第一阈值且小于第二阈值;若否,根据所述注意力状态对语音信号进行降噪处理。2.如权利要求1所述的交互式脑控耳机控制方法,其特征在于,根据所述注意力状态对语音信号进行降噪处理,包括:若所述预测概率小于或等于第一阈值,判定所述语音信号为非语音段,根据所述注意力状态对语音信号进行第一降噪处理;若所述预测概率大于或等于第二阈值,判定所述语音信号为语音段,以及判断所述语音信号是否来自用户自身语音;若非来自用户自身语音,根据所述注意力状态对所述语音信号进行第二降噪处理。3.如权利要求2所述的交互式脑控耳机控制方法,其特征在于,根据所述注意力状态对语音信号进行第一降噪处理,包括:确定与所述注意力状态对应的滤波器目标参数,根据滤波器目标参数设计低通滤波器;对所述语音信号进行快速傅里叶变换,得到频谱;将所述频谱与设计好的低通滤波器的频响进行频域乘法,得到滤波后的目标频谱;对滤波后的目标频谱进行傅里叶逆变换,得到滤波后的时域信号,将所述时域信号作为降噪处理结果输出。4.如权利要求2所述的交互式脑控耳机控制方法,其特征在于,所述目标语音特征向量包括所述语音信号的各个频带的语音特征向量;根据所述注意力状态对所述语音信号进行第二降噪处理,包括:将所述注意力特征及各个频带的语音特征向量输入训练好的回归模型,预测各个频带的目标控制量;根据各个频带的目标控制量,对所述语音信号的各个频带进行相应的降噪处理,综合所有频带生成降噪后的增强语音信号。5.如权利要求4所述的交互式脑控耳机控制方法,其特征在于,所述回归模型表示为: ;其中,β(f) 为每个频带f通过学习设定的注意力状态权重参数;A表示注意力状态,F(A)为...

【专利技术属性】
技术研发人员:胡方扬魏彦兆唐海波李宝宝
申请(专利权)人:小舟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1