用于生成信息的方法和装置制造方法及图纸

技术编号:20747960 阅读:38 留言:0更新日期:2019-04-03 10:51
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取语音数据;基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合。该实施方式提高了训练数据准备效率。

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
相关技术中,对声学模型进行训练之前,在训练样本准备阶段,往往需要从可能使用该声学模型的真实场景中人工采集大量真实语音数据。从而利用所采集到的真实语音数据对声学模型进行训练。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取语音数据;基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合在一些实施例中,冲激响应数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第一车载语音影响因素的至少一个冲激响应数据,将所获取的冲激响应数据存入冲激响应数据集合,其中,第一车载语音影响因素包括以下至少一项:车辆型号,声源位置,录音设备位置。在一些实施例中,噪声数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第二车载语音影响因素的至少一个噪声数据,将所获取的噪声数据存入噪声数据集合,其中,第二车载语音影响因素包括以下至少一项:车辆速度,车窗开关程度。在一些实施例中,基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合,包括:对于冲激响应数据集合中的冲激响应数据,执行如下选取步骤:从噪声数据集合中选取噪声数据,执行如下存储步骤:将该冲激响应数据、语音数据和所选取的噪声数据代入预先确定的仿真数据确定函数,生成仿真语音数据,存入仿真语音数据集合;确定噪声数据集合中是否存在未被选取的噪声数据;响应于确定存在,从噪声数据集合中选择未被选取的噪声数据继续执行存储步骤。在一些实施例中,该方法还包括:根据仿真语音数据集合和预先确定的声学模型,得到车载声学模型,其中,车载声学模型用于表征语音数据与语音识别结果的对应关系。在一些实施例中,该方法还包括:接收车载语音数据,将车载语音数据输入车载声学模型,得到对应于车载语音数据的语音识别结果。第二方面,本申请实施例提供了一种用于生成信息的装置,该装置包括:数据获取单元,被配置成获取语音数据;数据生成单元,被配置成基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合。在一些实施例中,冲激响应数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第一车载语音影响因素的至少一个冲激响应数据,将所获取的冲激响应数据存入冲激响应数据集合,其中,第一车载语音影响因素包括以下至少一项:车辆型号,声源位置,录音设备位置。在一些实施例中,噪声数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第二车载语音影响因素的至少一个噪声数据,将所获取的噪声数据存入噪声数据集合,其中,第二车载语音影响因素包括以下至少一项:车辆速度,车窗开关程度。在一些实施例中,数据生成单元,被进一步配置成:对于冲激响应数据集合中的冲激响应数据,执行如下选取步骤:从噪声数据集合中选取噪声数据,执行如下存储步骤:将该冲激响应数据、语音数据和所选取的噪声数据代入预先确定的仿真数据确定函数,生成仿真语音数据,存入仿真语音数据集合;确定噪声数据集合中是否存在未被选取的噪声数据;响应于确定存在,从噪声数据集合中选择未被选取的噪声数据继续执行存储步骤。在一些实施例中,该装置还包括:模型确定单元,被配置成根据仿真语音数据集合和预先确定的声学模型,得到车载声学模型,其中,车载声学模型用于表征语音数据与语音识别结果的对应关系。在一些实施例中,该装置还包括:语音识别单元,被配置成接收车载语音数据,将车载语音数据输入车载声学模型,得到对应于车载语音数据的语音识别结果。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如用于生成信息的方法中任一实施例的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如用于生成信息的方法中任一实施例的方法。本申请实施例提供的用于生成信息的方法和装置,可以获取语音数据。然后,基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合。本实施例的方法和装置,可以对一个语音数据,生成对应于该语音数据的多个仿真语音数据,有助于提高训练数据准备效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于生成信息的方法的一个实施例的流程图;图3是根据本申请实施例的用于生成信息的方法的一个应用场景的示意图;图4是根据本申请的用于生成信息的方法的又一个实施例的流程图;图5是根据本申请的用于生成信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请实施例的用于生成信息的方法或用于生成信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如仿真数据生成类应用、语音识别类应用、语音分析类应用等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是支持语音数据输入的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和车载终端等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上所安装的应用提供支持的后台服务器。后台服务器可以获取终端设备101、102、103输入的语音数据,以及,基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成语音数据对应的仿真语音数据集合。需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:获取语音数据;基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成所述语音数据对应的仿真语音数据集合。

【技术特征摘要】
1.一种用于生成信息的方法,包括:获取语音数据;基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成所述语音数据对应的仿真语音数据集合。2.根据权利要求1所述的方法,其中,所述冲激响应数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第一车载语音影响因素的至少一个冲激响应数据,将所获取的冲激响应数据存入冲激响应数据集合,其中,所述第一车载语音影响因素包括以下至少一项:车辆型号,声源位置,录音设备位置。3.根据权利要求1所述的方法,其中,所述噪声数据集合通过如下步骤确定:对于预先设定的车辆组中的车辆,获取该车辆对应的、关联于第二车载语音影响因素的至少一个噪声数据,将所获取的噪声数据存入噪声数据集合,其中,所述第二车载语音影响因素包括以下至少一项:车辆速度,车窗开关程度。4.根据权利要求1-3之一所述的方法,其中,所述基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成所述语音数据对应的仿真语音数据集合,包括:对于所述冲激响应数据集合中的冲激响应数据,执行如下选取步骤:从所述噪声数据集合中选取噪声数据,执行如下存储步骤:将该冲激响应数据、所述语音数据和所选取的噪声数据代入预先确定的仿真数据确定函数,生成仿真语音数据,存入仿真语音数据集合;确定所述噪声数据集合中是否存在未被选取的噪声数据;响应于确定存在,从所述噪声数据集合中选择未被选取的噪声数据继续执行存储步骤。5.根据权利要求1所述的方法,其中,所述方法还包括:根据所述仿真语音数据集合和预先确定的声学模型,得到车载声学模型,其中,所述车载声学模型用于表征语音数据与语音识别结果的对应关系。6.根据权利要求5所述的方法,其中,所述方法还包括:接收车载语音数据,将所述车载语音数据输入所述车载声学模型,得到对应于所述车载语音数据的语音识别结果。7.一种用于生成信息的装置,包括:数据获取单元,被配置成获取语音数据;数据生成单元,被配置成基于预先确定的冲激响应数据集合和预先确定的噪声数据集合,生成所述语音数...

【专利技术属性】
技术研发人员:李鑫李超
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1