背景声消除方法、装置及终端设备制造方法及图纸

技术编号：16820666 阅读：41 留言：0更新日期：2017-12-16 14:42

本发明专利技术提出一种背景声消除方法、装置及终端设备，其中，该方法包括：获取初始音频数据集；对所述初始音频数据集进行背景声融合处理，以获取训练样本数据；利用所述训练样本数据及所述初始音频数据集，对神经网络进行训练，生成用于消除背景声的初始神经网络模型；利用所述用于消除背景声的初始神经网络模型，对待处理音频数据进行背景声消除处理。由此，实现了利用神经网络模型对待处理音频数据进行背景声消除，提高了通话质量，且当用户处于不同的场景时，无需单独训练生成神经网络模型，实现方式简便，成本低，改善了用户体验。

Background sound elimination method, device and terminal equipment

The invention provides a method for eliminating background noise, device and terminal equipment, wherein, the method comprises: acquiring the initial audio data set; background sound fusion processing to the original audio data set, in order to obtain the training data; using the training data and the original audio data set to train the nerve network, to generate the initial neural network model to eliminate background noise; using the neural network model for the initial elimination of background sound, to eliminate background sound processing audio data. Thus, the neural network model to eliminate the background sound processing of audio data, the communication quality is improved, and when the user is in a different scene, without a separate trained neural network model, the method is simple, low cost, improve the user experience.

全部详细技术资料下载

【技术实现步骤摘要】
背景声消除方法、装置及终端设备
本专利技术涉及计算机
，尤其涉及一种背景声消除方法、装置及终端设备。
技术介绍
通常，在人与人之间通过手机、对讲机等电子通信装置通信或人机交互时，交互双方常常处于一些嘈杂的背景环境下。这时，接收方用户获取的声音不仅包括发送方用户的说话声音，还包括发送方用户周围的其它声音，比如他人说话音、脚步声、物品碰撞声、音乐以及交通工具发出的声音等。这些除了交互双方的说话声音之外的背景声，会影响交互双方的通话质量，消除背景声是改善通话质量的方法之一。现有技术，可以通过回声消除器(AcousticEchoChancellor，简称AEC)消除背景声，但是每当发送方处于不同的场景时，AEC都需要单独学习一次，这种背景声消除方式复杂，成本高，用户体验差。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术提出一种背景声消除方法，实现了利用神经网络模型对待处理音频数据进行背景声消除，提高了通话质量，且当用户处于不同的场景时，无需单独训练生成神经网络模型，实现方式简便，成本低，改善了用户体验。本专利技术还提出一种背...
背景声消除方法、装置及终端设备

【技术保护点】
一种背景声消除方法，其特征在于，包括：获取初始音频数据集；对所述初始音频数据集进行背景声融合处理，以获取训练样本数据；利用所述训练样本数据及所述初始音频数据集，对神经网络进行训练，生成用于消除背景声的初始神经网络模型；利用所述用于消除背景声的初始神经网络模型，对待处理音频数据进行背景声消除处理。

【技术特征摘要】
1.一种背景声消除方法，其特征在于，包括：获取初始音频数据集；对所述初始音频数据集进行背景声融合处理，以获取训练样本数据；利用所述训练样本数据及所述初始音频数据集，对神经网络进行训练，生成用于消除背景声的初始神经网络模型；利用所述用于消除背景声的初始神经网络模型，对待处理音频数据进行背景声消除处理。2.如权利要求1所述的方法，其特征在于，所述待处理音频数据包括背景音频数据和待识别音频数据，所述对待处理音频数据进行背景声消除处理，包括：对所述待处理音频数据进行背景声消除处理，以获取与所述待识别音频数据对应的特征向量。3.如权利要求2所述的方法，其特征在于，所述获取与所述待识别音频数据对应的特征向量之后，还包括：将所述待识别音频数据对应的特征向量输入到预设的声学模型中，生成每一帧数据的最大后验概率；对所述待识别音频数据全部帧对应的后验概率序列，进行解码处理，确定所述待识别音频数据对应的识别文本。4.如权利要求2或3任一所述的方法，其特征在于，所述生成用于消除背景声的初始神经网络模型之后，还包括：对所述初始神经网络模型进行更新训练，生成更新的初始神经网络模型。5.一种背景声消除装置，其特征在于，包括：获取模块，用于获取初始音频数据集；第一处理模块，用于对所述初始音频数据集进行背景声融合处理，以获取训练样本数据；第一...

【专利技术属性】
技术研发人员：张雪薇，李先刚，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人