姿态检测方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：29761562 阅读：39 留言：0更新日期：2021-08-20 21:15

本申请提供了一种姿态检测方法、装置、电子设备及计算机可读存储介质，其中方法包括：通过至少两个语音采集设备采集语音通话过程中的语音信号；获取语音信号对应的姿态能量信息；根据姿态能量信息，从各预定姿态中确定出用户在语音通话过程中的姿态，其中，在获取姿态能量信息的步骤中可以采用人工智能模块进行相关处理。通过预先设定多种预定姿态，再根据语音通话过程中多个语音采集设备采集到的语音信号的姿态能量信息，从预先设定的多种预定姿态中确定出用户在通话过程中的姿态，即得到了用户姿态检测结果，可以为通话语音质量增强提供参考，优化噪声抑制处理的效果。

全部详细技术资料下载

【技术实现步骤摘要】
姿态检测方法、装置、电子设备及计算机可读存储介质
本申请涉及计算机
，具体而言，本申请涉及一种姿态检测方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着终端设备行业的发展，用户对终端设备通话质量的要求越来越高。现有终端设备普遍有两个或两个以上的麦克风(Microphone，mic)，得益于多麦克风降噪法，多麦克风终端设备可以获得比单麦克风终端设备更好的通话语音质量。多麦克风降噪法是否有效很大程度上取决于用户使用终端设备进行语音通话时手持终端设备的姿态。但是，不同的人或同一人在不同时刻，手持终端设备的姿态不尽相同，因此检测用户使用终端设备进行语音通话时手持终端设备的姿态，对噪声抑制功能起着至关重要的作用。目前一些基于传感器(如摄像头，陀螺仪，重力感应器等)的姿态检测方法，并不能获得终端设备相对于人脸的姿态，因此有必要对现有的姿态检测方法进行改进。
技术实现思路
本申请的目的旨在至少能解决上述的技术缺陷之一，本申请实施例所提供的技术方案如下：第一方面，本申请实施例提供了姿态检测方法，包括：通过至少两个语音采集设备采集语音通话过程中的语音信号；获取语音信号对应的姿态能量信息；根据姿态能量信息，从各预定姿态中确定出用户在语音通话过程中的姿态。在本申请的一种可选实施例中，获取语音信号对应的姿态能量信息，包括：获取语音信号对应各预定姿态的投影能量。在本申请的一种可选实施例中，获取语音信号对应各预定姿态的投影能量，包括：获取语...

【技术保护点】
1.一种姿态检测方法，其特征在于，包括：/n通过至少两个语音采集设备采集语音通话过程中的语音信号；/n获取所述语音信号对应的姿态能量信息；/n根据所述姿态能量信息，从各预定姿态中确定出用户在语音通话过程中的姿态。/n

【技术特征摘要】
20200220 CN 20201010549111.一种姿态检测方法，其特征在于，包括：
通过至少两个语音采集设备采集语音通话过程中的语音信号；
获取所述语音信号对应的姿态能量信息；
根据所述姿态能量信息，从各预定姿态中确定出用户在语音通话过程中的姿态。

2.根据权利要求1所述的方法，其特征在于，获取所述语音信号对应的姿态能量信息，包括：
获取所述语音信号对应各预定姿态的投影能量。

3.根据权利要求2所述的方法，其特征在于，获取所述语音信号对应各预定姿态的投影能量，包括：
获取所述语音信号的各频点对应各预定姿态的投影能量；
获取各频点分别对应的权重值；
根据各频点分别对应的权重值以及各频点对应各预定姿态的投影能量，确定所述语音信号对应各预定姿态的投影能量。

4.根据权利要求3所述的方法，其特征在于，获取所述语音信号的各频点对应各预定姿态的投影能量，包括：
获取所述语音信号对应的特征向量，所述特征向量包含各频点对应的特征值；
将所述特征向量进行归一化处理，得到所述语音信号对应的归一化特征向量；
根据所述归一化特征向量和各预定姿态分别对应的特征矩阵，确定各频点分别对应各预定姿态的投影能量。

5.根据权利要求4所述的方法，其特征在于，获取所述语音信号对应的特征向量，包括：
获取与语音信号对应的至少两个频域信号；
对于每一频点，合并各频域信号在该频点处的特征值，得到所述语音信号的特征向量。

6.根据权利要求4所述的方法，其特征在于，将所述特征向量进行归一化处理之前，还包括：
根据预定的补偿参数，对所述特征向量进行频率响应补偿处理，得到幅度校正后的特征向量。

7.根据权利要求4所述的方法，其特征在于，对于至少一个预定姿态，对应的特征矩阵是通过以下方式得到的：
分别确定样本声源与各个语音采集设备之间的距离；
根据样本声源与各个语音采集设备之间的距离，确定预定姿态对应的特征向量；
基于预定姿态对应的特征向量，确定预定姿态对应的特征矩阵。

8.根据权利要求3所述的方法，其特征在于，获取各频点分别对应的权重值，包括：
获取各频点对应的预定权重。

9.根据权利要求3所述的方法，其特征在于，获取各频点分别对应的权重值，包括：
根据各频点对应各预定姿态的投影能量和/或所述语音信号的能量信息，通过权重确定神经网络，确定各频点对应的权重。

10.根据权利要求9所述的方法，其特征在于，所述权重确定神经网络包括控制子网络和计算子网络；
根据各频点对应各预定姿态的投影能量和所述语音信号的能量信息，通过...

【专利技术属性】
技术研发人员：杨磊，王维钦，谭璐芬，王立众，
申请(专利权)人：北京三星通信技术研究有限公司，三星电子株式会社，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人