语音训练数据适配方法和装置、语音数据转换方法以及电子设备制造方法及图纸

技术编号：24332704 阅读：44 留言：0更新日期：2020-05-29 20:29

本发明专利技术实施例提供了一种语音训练数据适配方法和装置、语音数据转换方法以及电子设备。该语音训练数据适配方法包括：获取用于进行数据转换的原始语音数据，所述原始语音数据具有在各个方向上的音频数据信息；通过信道转换算法对所述原始语音数据进行转换处理，以获得适用于不同信道的训练数据。本发明专利技术实施例通过信道转换算法对已有的原始语音数据进行转换处理，以得到适配不同信道的训练数据，避免了每次对新的语音识别产品进行大量的语音数据采集来进行训练，而仅需更新维护信道转换算法，便可得到适配该语音识别产品的训练数据，从而提高了新的语音匹配模型的建模效率，同时节约了人力成本。

Speech training data adaptation method and device, speech data conversion method and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音训练数据适配方法和装置、语音数据转换方法以及电子设备
本专利技术涉及智能家居
，尤其涉及一种语音训练数据适配方法和装置、语音数据转换方法以及电子设备。
技术介绍
智能音箱是音箱的升级产物，是家庭消费者通过语音输入从云端获取歌曲、天气预报、新闻等的工具，也可以对其它的智能家居设备进行控制，比如通过语音输入打开窗帘、设置冰箱温度、提前让热水器升温等。不同的智能音箱产品，其在麦克风设置及语音信号处理技术方面均存在差异。服务提供方(用于提供歌曲、天气、新闻等服务)需要为不同型号的智能音箱设置与之相匹配的语音数据库，以语音数据库中的语音数据作为训练数据，训练出适用于各型号智能音箱的匹配模型，在用户使用某个型号的智能音箱输入语音后，通过相应的匹配模型进行声纹、语音等方面的匹配操作，从而实现声纹识别或语音识别。专利技术人在实现本专利技术的过程中，发现现有技术至少存在如下问题：随着技术的升级与发展，市场上不断推出新型的语音识别产品。在新产品推出后，由于已有的语音数据库中的存量语音数据与新产品不匹配，因此，服...

【技术保护点】
1.一种语音训练数据适配方法，其特征在于，包括：/n获取用于进行数据转换的原始语音数据，所述原始语音数据具有在各个方向上的音频数据信息；/n通过信道转换算法对所述原始语音数据进行转换处理，以获得适用于不同信道的训练数据。/n

【技术特征摘要】
1.一种语音训练数据适配方法，其特征在于，包括：
获取用于进行数据转换的原始语音数据，所述原始语音数据具有在各个方向上的音频数据信息；
通过信道转换算法对所述原始语音数据进行转换处理，以获得适用于不同信道的训练数据。

2.根据权利要求1所述的语音训练数据适配方法，其特征在于，在所述通过信道转换算法对所述原始语音数据进行转换处理之前，还包括：
获取不同信道下针对固定文本的录音数据；
根据不同的所述录音数据的差异参数分布函数，获取所述信道转换算法。

3.根据权利要求2所述的语音训练数据适配方法，其特征在于，还包括：
获取不同距离下针对所述固定文本的录音数据。

4.根据权利要求2所述的语音训练数据适配方法，其特征在于，不同信道下的所述录音数据的差异参数分布函数为高斯分布函数。

5.根据权利要求3所述的语音训练数据适配方法，其特征在于，不同距离下的所述录音数据的差异参数分布函数为能量分布函数。

6.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法，其特征在于，所述获取用于进行数据转换的原始语音数据，包括：
在第一数据库中获取已有的原始语音数据。

7.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法，其特征在于，所述获取用于进行数据转换的原始语音数据，包括：
在第二数据库中获取通过高保真录音设备对已有的存量数据进行录音而得到的原始语音数据。

8.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法，其特征在于，所述获取用于进...

【专利技术属性】
技术研发人员：张平，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人