音频数据处理方法、装置、终端及系统制造方法及图纸

技术编号：17996784 阅读：73 留言：0更新日期：2018-05-19 13:44

本发明专利技术实施例公开了一种音频数据处理方法、装置、终端及系统，该方法包括：获得空间滤波后的音频数据；对音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，第一维纳滤波对噪声的抑制程度大于第二维纳滤波；利用第一滤波数据判停第二滤波数据，根据判停结果对第二滤波数据进行数据处理。本发明专利技术实施例根据语音活动检测和自动语音识别的不同需求，分别进行不同程度的维纳滤波，不仅可以保证自动语音识别的准确率，还可以避免干扰对语音活动检测的影响，更加准确的检测到语音活动状态，缩短语音交互的反馈延时，提高对语音指令的响应速度，给用户带来更好的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据处理方法、装置、终端及系统
本专利技术涉及数据处理
，尤其涉及一种音频数据处理方法、装置、终端及系统。
技术介绍
智能语音交互是人工智能领域的重要分支，实现自由准确的智能语音交互，将极大解放人的双手，获得与物理世界更加自由的信息流通与操控。智能语音交互主要近场语音交互和远场语音交互。过去二十年近场语音得到极大发展，目前近场的语音识别率接近于人的语音识别率，但是更自由的交互应该是远场语音交互。所谓远场语音交互，意味着说话人和交互设备之间有一定的距离，扩大了说话人的自由空间，但是这又会引入过多的背景噪声干扰，导致语音活动检测和自动语音识别的处理难度极大增加。语音活动检测，即从一段连续的音频数据中检测出说话人实际录入的语音。准确的语音活动检测一方面可以提高后续自动语音识别的准确率，另一方面也可以降低语音交互的反馈延时，用户语音指令一结束就可以迅速给出执行结果，给用户带来更好的使用体验。目前，一般采用阵列信号对原始音频数据进行处理后，利用处理后的音频数据进行语音活动检测和自动语音识别，但该处理后的音频数据仍然存在一定的干扰，会严重影响语音活动检测的准确度，导...
音频数据处理方法、装置、终端及系统

【技术保护点】
一种音频数据处理方法，其特征在于，所述方法，包括：获得空间滤波后的音频数据；对所述音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，所述第一维纳滤波对噪声的抑制程度大于所述第二维纳滤波；利用所述第一滤波数据判停所述第二滤波数据，根据判停结果对所述第二滤波数据进行数据处理。

【技术特征摘要】
1.一种音频数据处理方法，其特征在于，所述方法，包括：获得空间滤波后的音频数据；对所述音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，所述第一维纳滤波对噪声的抑制程度大于所述第二维纳滤波；利用所述第一滤波数据判停所述第二滤波数据，根据判停结果对所述第二滤波数据进行数据处理。2.根据权利要求1所述的方法，其特征在于，所述对所述音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，具体包括：利用强度系数的M次方，对所述音频数据进行所述第一维纳滤波，得到所述第一滤波数据；利用所述强度系数的N次方，对所述音频数据进行所述第二维纳滤波，得到所述第二滤波数据；M大于N。3.根据权利要求2所述的方法，其特征在于，所述利用强度系数的M次方，对所述音频数据进行所述第一维纳滤波，得到所述第一滤波数据，具体包括：按照公式对所述音频数据Y(jω)进行所述第一维纳滤波，得到所述第二滤波数据YVAD(jω)；所述利用所述强度系数的N次方，对所述音频数据进行所述第二维纳滤波，得到所述第二滤波数据，具体包括：按照公式对所述音频数据Y(jω)进行所述第二维纳滤波，得到所述第二滤波数据YASR(jω)；其中，M＝1，N＝1/2，所述强度系数为所述Pyy(jω)为所述音频数据的功率谱，Pxx(jω)为所述音频数据空间滤波前的原始音频数据的平均功率谱，EPS为极小值。4.根据权利要求1所述的方法，其特征在于，所述利用所述第一滤波数据判停所述第二滤波数据，之前还包括：对所述第一滤波数据进行去干扰处理；所述去干扰处理，包括瞬态噪声消除处理、降噪处理和噪声平滑处理中的一个或多个。5.根据权利要求4所述的方法，其特征在于，所述瞬态噪声消除处理，具体包括：获得所述音频数据在预设频域范围内每个频域点对应的所述第一维纳滤波的增益；统计所述音频数据在所述预设频域范围内频域点的数量，得到第一值；统计增益幅度在预设增益阈值以内的频域点的数量，得到第二值；根据所述第一值和所述第二值，获得瞬态消除增益；依据所述瞬态消除增益，消除所述第一滤波数据中的瞬态噪声。6.一种音频数据处理方法，其特征在于，应用于第一终端设备，所述方法，包括：获得空间滤波后的音频数据；对所述音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，所述第一维纳滤波对噪声的抑制程度大于所述第二维纳滤波；将所述第一滤波数据和所述第二滤波数据发送至第二终端设备，以使所述第二终端设备利用所述第一滤波数据判停所述第二滤波数据，并根据判停结果对所述第二滤波数据进行数据处理。7.根据权利要求6所述的方法，其特征在于，所述对所述音频数据分别进行第一维纳滤波和第二维纳滤波，分别得到第一滤波数据和第二滤波数据，具体包括：利用强度系数...

【专利技术属性】
技术研发人员：陈日林，陈孝良，冯大航，苏少炜，常乐，
申请(专利权)人：北京声智科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人