语音训练数据适配方法和装置、语音数据转换方法以及电子设备制造方法及图纸

技术编号:24332704 阅读:24 留言:0更新日期:2020-05-29 20:29
本发明专利技术实施例提供了一种语音训练数据适配方法和装置、语音数据转换方法以及电子设备。该语音训练数据适配方法包括:获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。本发明专利技术实施例通过信道转换算法对已有的原始语音数据进行转换处理,以得到适配不同信道的训练数据,避免了每次对新的语音识别产品进行大量的语音数据采集来进行训练,而仅需更新维护信道转换算法,便可得到适配该语音识别产品的训练数据,从而提高了新的语音匹配模型的建模效率,同时节约了人力成本。

Speech training data adaptation method and device, speech data conversion method and electronic equipment

【技术实现步骤摘要】
语音训练数据适配方法和装置、语音数据转换方法以及电子设备
本专利技术涉及智能家居
,尤其涉及一种语音训练数据适配方法和装置、语音数据转换方法以及电子设备。
技术介绍
智能音箱是音箱的升级产物,是家庭消费者通过语音输入从云端获取歌曲、天气预报、新闻等的工具,也可以对其它的智能家居设备进行控制,比如通过语音输入打开窗帘、设置冰箱温度、提前让热水器升温等。不同的智能音箱产品,其在麦克风设置及语音信号处理技术方面均存在差异。服务提供方(用于提供歌曲、天气、新闻等服务)需要为不同型号的智能音箱设置与之相匹配的语音数据库,以语音数据库中的语音数据作为训练数据,训练出适用于各型号智能音箱的匹配模型,在用户使用某个型号的智能音箱输入语音后,通过相应的匹配模型进行声纹、语音等方面的匹配操作,从而实现声纹识别或语音识别。专利技术人在实现本专利技术的过程中,发现现有技术至少存在如下问题:随着技术的升级与发展,市场上不断推出新型的语音识别产品。在新产品推出后,由于已有的语音数据库中的存量语音数据与新产品不匹配,因此,服务提供方需要针对新产品进行大量的语音数据采集,获取适用于该型号语音识别产品的语音训练数据以进行建模,而这样的获取效率非常低。
技术实现思路
本专利技术实施例提供一种语音训练数据适配方法和装置、语音数据转换方法以及电子设备,以解决现有技术中训练数据的获取效率低的缺陷。为达到上述目的,本专利技术实施例提供了一种语音训练数据适配方法,包括:获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。本专利技术实施例还提供了一种语音数据转换方法,包括:通过与播放设备相匹配的信道转换算法,对原始语音数据进行转换处理,以获得适用于所述播放设备的训练数据,所述原始语音数据具有在各个方向上的音频数据信息;根据所述训练数据进行模型训练,得到数据转换模型;根据所述数据转换模型,对播放设备的待输出数据进行转换,以获得适用于所述播放设备的播放数据。本专利技术实施例还提供了一种语音训练数据适配装置,包括:原始语音数据获取模块,用于获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;数据转换模块,用于通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。本专利技术实施例还提供了一种电子设备,包括:存储器,用于存储程序;处理器,用于运行所述存储器中存储的所述程序,以用于:获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。本专利技术实施例提供的语音训练数据适配方法和装置、语音数据转换方法以及电子设备,通过信道转换算法对已有的原始语音数据进行转换处理,以得到适配不同信道的训练数据,避免了每次对新的语音识别产品进行大量的语音数据采集来进行训练,而仅需更新维护信道转换算法,便可得到适配该语音识别产品训练数据,从而提高了新的语音匹配模型的建模效率,同时节约了人力成本。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本专利技术实施例提供的业务系统的系统框图;图2为本专利技术提供的语音训练数据适配方法一个实施例的流程图;图3为本专利技术提供的语音训练数据适配方法另一个实施例的流程图;图4为本专利技术提供的语音训练数据适配装置一个实施例的结构示意图;图5为本专利技术提供的语音训练数据适配装置另一个实施例的结构示意图;图6为本专利技术提供的语音数据转换方法实施例的流程图;图7为本专利技术提供的电子设备实施例的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。在现有技术中,不同的语音识别产品(如,智能音箱产品),其在麦克风设置及语音信号处理技术方面均存在差异。服务提供方需要为不同型号的智能音箱提供与之相匹配的语音数据库,以语音数据库中的语音数据作为训练数据,训练出适用于各型号语音识别产品的匹配模型。在用户使用某个型号的语音识别产品输入语音后,才能够通过相应的匹配模型进行声纹、语音等方面的匹配操作,从而实现声纹识别或语音识别。当新的语音识别产品推出时,由于已有的语音数据库中的存量语音数据与新产品不匹配,服务提供方需要针对新产品进行大量的语音数据采集,获取适用于该型号语音识别产品的训练数据以进行建模,而这样的获取效率非常低。因此,本申请提出了一种语音训练数据适配方案,其主要原理是:通过信道转换算法对已有的或预先获取的原始语音数据(即,具有在各个方向上的音频数据信息的语音数据,例如,频道信息较为完整、高频信息较为丰富、去除带噪的语音数据等)进行转换处理,来获得适用于不同信道(如,两麦、四麦、六麦等)的训练数据,从而避免每次对新的语音识别产品进行大量的语音数据采集来进行训练,而仅需更新维护信道转换算法,便可得到适配该语音识别产品的训练数据,因此,能够提高新的语音识别产品的匹配模型的建模效率,同时节约人力成本。本专利技术实施例提供的方法可应用于任何具有语音数据处理能力的业务系统。图1为本专利技术实施例提供的业务系统的系统框图,图1所示的结构仅仅是本专利技术的技术方案可以应用的业务系统的示例之一。如图1所示,该业务系统中包括训练数据适配装置。该装置包括:原始语音数据获取模块和数据转换模块,可以用来执行下述图2和图3所示的处理流程。在该业务系统中,首先,获取用于进行数据转换的原始语音数据,该原始语音数据具有在各个方向上的音频数据信息;然后,通过信道转换算法对获取到的原始语音数据进行转换处理,以获得适用于不同信道的训练数据。具体地,可以直接获取已有的原始语音数据(即,频道信息较为完整、高频信息较为丰富、去除带噪的高质量语音数据);也可以对已有的存量数据进行高保真录音,从而获取原始语音数据;此外,针对已有的数据中不包含的数据,还可以通过高保真录音设备对录音人员的语音进行录音,以作为补充。通过信道转换算法进行转换处理后,获取适用于不同信道的训练数据(如,两麦数据、四麦数据、六麦数据等),以分别用于训练不同的匹配模型(如,两麦模型、本文档来自技高网...

【技术保护点】
1.一种语音训练数据适配方法,其特征在于,包括:/n获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;/n通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。/n

【技术特征摘要】
1.一种语音训练数据适配方法,其特征在于,包括:
获取用于进行数据转换的原始语音数据,所述原始语音数据具有在各个方向上的音频数据信息;
通过信道转换算法对所述原始语音数据进行转换处理,以获得适用于不同信道的训练数据。


2.根据权利要求1所述的语音训练数据适配方法,其特征在于,在所述通过信道转换算法对所述原始语音数据进行转换处理之前,还包括:
获取不同信道下针对固定文本的录音数据;
根据不同的所述录音数据的差异参数分布函数,获取所述信道转换算法。


3.根据权利要求2所述的语音训练数据适配方法,其特征在于,还包括:
获取不同距离下针对所述固定文本的录音数据。


4.根据权利要求2所述的语音训练数据适配方法,其特征在于,不同信道下的所述录音数据的差异参数分布函数为高斯分布函数。


5.根据权利要求3所述的语音训练数据适配方法,其特征在于,不同距离下的所述录音数据的差异参数分布函数为能量分布函数。


6.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法,其特征在于,所述获取用于进行数据转换的原始语音数据,包括:
在第一数据库中获取已有的原始语音数据。


7.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法,其特征在于,所述获取用于进行数据转换的原始语音数据,包括:
在第二数据库中获取通过高保真录音设备对已有的存量数据进行录音而得到的原始语音数据。


8.根据权利要求1至5中任一权利要求所述的语音训练数据适配方法,其特征在于,所述获取用于进...

【专利技术属性】
技术研发人员:张平
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1