姿态检测方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:29761562 阅读:39 留言:0更新日期:2021-08-20 21:15
本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质,其中方法包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,其中,在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。

【技术实现步骤摘要】
姿态检测方法、装置、电子设备及计算机可读存储介质
本申请涉及计算机
,具体而言,本申请涉及一种姿态检测方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着终端设备行业的发展,用户对终端设备通话质量的要求越来越高。现有终端设备普遍有两个或两个以上的麦克风(Microphone,mic),得益于多麦克风降噪法,多麦克风终端设备可以获得比单麦克风终端设备更好的通话语音质量。多麦克风降噪法是否有效很大程度上取决于用户使用终端设备进行语音通话时手持终端设备的姿态。但是,不同的人或同一人在不同时刻,手持终端设备的姿态不尽相同,因此检测用户使用终端设备进行语音通话时手持终端设备的姿态,对噪声抑制功能起着至关重要的作用。目前一些基于传感器(如摄像头,陀螺仪,重力感应器等)的姿态检测方法,并不能获得终端设备相对于人脸的姿态,因此有必要对现有的姿态检测方法进行改进。
技术实现思路
本申请的目的旨在至少能解决上述的技术缺陷之一,本申请实施例所提供的技术方案如下:第一方面,本申请实施例提供了姿态检测方法,包括:通过至少两个语音采集设备采集语音通话过程中的语音信号;获取语音信号对应的姿态能量信息;根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。在本申请的一种可选实施例中,获取语音信号对应的姿态能量信息,包括:获取语音信号对应各预定姿态的投影能量。在本申请的一种可选实施例中,获取语音信号对应各预定姿态的投影能量,包括:获取语音信号的各频点对应各预定姿态的投影能量;获取各频点分别对应的权重值;根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量,确定语音信号对应各预定姿态的投影能量。在本申请的一种可选实施例中,获取语音信号的各频点对应各预定姿态的投影能量,包括:获取语音信号对应的特征向量,特征向量包含各频点对应的特征值;将特征向量进行归一化处理,得到语音信号对应的归一化特征向量;根据归一化特征向量和各预定姿态分别对应的特征矩阵,确定各频点分别对应各预定姿态的投影能量。在本申请的一种可选实施例中,获取语音信号对应的特征向量,包括:获取与语音信号对应的至少两个频域信号;对于每一频点,合并各频域信号在该频点处的特征值,得到语音信号的特征向量。在本申请的一种可选实施例中,将特征向量进行归一化处理之前,还包括:根据预定的补偿参数,对特征向量进行频率响应补偿处理,得到幅度校正后的特征向量。在本申请的一种可选实施例中,对于至少一个预定姿态,对应的特征矩阵是通过以下方式得到的:分别确定样本声源与各个语音采集设备之间的距离;根据样本声源与各个语音采集设备之间的距离,确定预定姿态对应的特征向量;基于预定姿态对应的特征向量,确定预定姿态对应的特征矩阵。在本申请的一种可选实施例中,获取各频点分别对应的权重值,包括:获取各频点对应的预定权重。在本申请的一种可选实施例中,获取各频点分别对应的权重值,包括:根据各频点对应各预定姿态的投影能量和/或语音信号的能量信息,通过权重确定神经网络,确定各频点对应的权重。在本申请的一种可选实施例中,权重确定神经网络包括控制子网络和计算子网络;根据各频点对应各预定姿态的投影能量和/或语音信号的能量信息,通过权重确定神经网络,确定各频点对应的权重,包括:通过控制子网络,根据语音信号的能量信息,确定语音信号的信噪比表征值,根据信噪比表征值确定各频点的权重值是否为预定权重;若不是,通过计算子网络,根据各频点对应各预定姿态的投影能量,确定各频点的权重值。在本申请的一种可选实施例中,控制子网络,经由级联的若干第一特征提取层对语音信号的能量信息进行特征提取,以及经由分类层根据提取的特征获取信噪比表征值;计算子网络,经由级联的若干第二特征提取层对各频点对应各预定姿态的投影能量进行特征提取,以及经由线性回归层根据提取的特征获得各频点的权重。在本申请的一种可选实施例中,第二特征提取层将提取出的特征与控制子网络中相应的第一特征提取层输出的特征进行合并,输出合并后的特征。在本申请的一种可选实施例中,根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量,确定语音信号对应各预定姿态的投影能量,包括:针对每种预定姿态,分别根据各频点对应的权重值,对各频点对应该预定姿态的投影能量进行加权处理;针对每种预定姿态,分别将各频点对应于该预定姿态的加权处理后的投影能量进行累加,得到语音信号对应该预定姿态的投影能量。在本申请的一种可选实施例中,根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态,包括:选择最大的姿态能量信息所对应的预定姿态,得到用户在语音通话过程中的姿态信息。在本申请的一种可选实施例中,还包括:基于用户在语音通话过程中的姿态信息,对语音信号进行降噪处理,得到降噪后的语音信号。第二方面,本申请实施例提供了一种姿态检测装置,包括:语音采集模块,用于通过至少两个语音采集设备采集语音通话过程中的语音信号;能量获取模块,用于获取语音信号对应的姿态能量信息;姿态确定模块,用于根据姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器;存储器中存储有计算机程序;处理器,用于执行计算机程序以实现第一方面实施例或第一方面任一可选实施例中所提供的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现第一方面实施例或第一方面任一可选实施例中所提供的方法。本申请提供的技术方案带来的有益效果是:通过预先设定多种预定姿态,再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息,从预先设定的多种预定姿态中确定出用户在通话过程中的姿态,即得到了用户姿态检测结果,可以为通话语音质量增强提供参考,优化噪声抑制处理的效果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。图1为本申请实施例的一个示例中包含两个麦克风的终端设备的示意图;图2a为本申请实施例中一种正常手持模式下用户的姿态的示意图;图2b为本申请实施例中一种正常手持模式下麦克风采集到的语音信号的波形图;图3a为本申请实施例中一种非正常手持模式下用户的姿态的示意图;图3b为本申请实施例中一种非正常手持模式下麦克风采集到的语音信号的波形图;图4为本申请实施例提供的一种姿态检测方法的流程示意图;图5a为本申请实施例的一个示例中预定姿态1的示意图;图5b为本申请实施例的一个示例中预定姿态2的示本文档来自技高网...

【技术保护点】
1.一种姿态检测方法,其特征在于,包括:/n通过至少两个语音采集设备采集语音通话过程中的语音信号;/n获取所述语音信号对应的姿态能量信息;/n根据所述姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。/n

【技术特征摘要】
20200220 CN 20201010549111.一种姿态检测方法,其特征在于,包括:
通过至少两个语音采集设备采集语音通话过程中的语音信号;
获取所述语音信号对应的姿态能量信息;
根据所述姿态能量信息,从各预定姿态中确定出用户在语音通话过程中的姿态。


2.根据权利要求1所述的方法,其特征在于,获取所述语音信号对应的姿态能量信息,包括:
获取所述语音信号对应各预定姿态的投影能量。


3.根据权利要求2所述的方法,其特征在于,获取所述语音信号对应各预定姿态的投影能量,包括:
获取所述语音信号的各频点对应各预定姿态的投影能量;
获取各频点分别对应的权重值;
根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量,确定所述语音信号对应各预定姿态的投影能量。


4.根据权利要求3所述的方法,其特征在于,获取所述语音信号的各频点对应各预定姿态的投影能量,包括:
获取所述语音信号对应的特征向量,所述特征向量包含各频点对应的特征值;
将所述特征向量进行归一化处理,得到所述语音信号对应的归一化特征向量;
根据所述归一化特征向量和各预定姿态分别对应的特征矩阵,确定各频点分别对应各预定姿态的投影能量。


5.根据权利要求4所述的方法,其特征在于,获取所述语音信号对应的特征向量,包括:
获取与语音信号对应的至少两个频域信号;
对于每一频点,合并各频域信号在该频点处的特征值,得到所述语音信号的特征向量。


6.根据权利要求4所述的方法,其特征在于,将所述特征向量进行归一化处理之前,还包括:
根据预定的补偿参数,对所述特征向量进行频率响应补偿处理,得到幅度校正后的特征向量。


7.根据权利要求4所述的方法,其特征在于,对于至少一个预定姿态,对应的特征矩阵是通过以下方式得到的:
分别确定样本声源与各个语音采集设备之间的距离;
根据样本声源与各个语音采集设备之间的距离,确定预定姿态对应的特征向量;
基于预定姿态对应的特征向量,确定预定姿态对应的特征矩阵。


8.根据权利要求3所述的方法,其特征在于,获取各频点分别对应的权重值,包括:
获取各频点对应的预定权重。


9.根据权利要求3所述的方法,其特征在于,获取各频点分别对应的权重值,包括:
根据各频点对应各预定姿态的投影能量和/或所述语音信号的能量信息,通过权重确定神经网络,确定各频点对应的权重。


10.根据权利要求9所述的方法,其特征在于,所述权重确定神经网络包括控制子网络和计算子网络;
根据各频点对应各预定姿态的投影能量和所述语音信号的能量信息,通过...

【专利技术属性】
技术研发人员:杨磊王维钦谭璐芬王立众
申请(专利权)人:北京三星通信技术研究有限公司三星电子株式会社
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1