用于生成信息的方法和装置制造方法及图纸

技术编号：20747960 阅读：38 留言：0更新日期：2019-04-03 10:51

本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括：获取语音数据；基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成语音数据对应的仿真语音数据集合。该实施方式提高了训练数据准备效率。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
，具体涉及用于生成信息的方法和装置。
技术介绍
相关技术中，对声学模型进行训练之前，在训练样本准备阶段，往往需要从可能使用该声学模型的真实场景中人工采集大量真实语音数据。从而利用所采集到的真实语音数据对声学模型进行训练。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面，本申请实施例提供了一种用于生成信息的方法，该方法包括：获取语音数据；基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成语音数据对应的仿真语音数据集合在一些实施例中，冲激响应数据集合通过如下步骤确定：对于预先设定的车辆组中的车辆，获取该车辆对应的、关联于第一车载语音影响因素的至少一个冲激响应数据，将所获取的冲激响应数据存入冲激响应数据集合，其中，第一车载语音影响因素包括以下至少一项：车辆型号，声源位置，录音设备位置。在一些实施例中，噪声数据集合通过如下步骤确定：对于预先设定的车辆组中的车辆，获取该车辆对应的、关联于第二车载语音影响因素的至少一个噪声数据，将所获取的噪声数据存入噪声数据集合，其中，第二车载语音影响因素包括以下至少一项：车辆速度，车窗开关程度。在一些实施例中，基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成语音数据对应的仿真语音数据集合，包括：对于冲激响应数据集合中的冲激响应数据，执行如下选取步骤：从噪声数据集合中选取噪声数据，执行如下存储步骤：将该冲激响应数据、语音数据和所选取的噪声数据代入预先确定的仿真数据确定函数，生成仿真语音数据，存入仿真语音数据集合；确定噪声数据集合中是否存在未被...

【技术保护点】
1.一种用于生成信息的方法，包括：获取语音数据；基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成所述语音数据对应的仿真语音数据集合。

【技术特征摘要】
1.一种用于生成信息的方法，包括：获取语音数据；基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成所述语音数据对应的仿真语音数据集合。2.根据权利要求1所述的方法，其中，所述冲激响应数据集合通过如下步骤确定：对于预先设定的车辆组中的车辆，获取该车辆对应的、关联于第一车载语音影响因素的至少一个冲激响应数据，将所获取的冲激响应数据存入冲激响应数据集合，其中，所述第一车载语音影响因素包括以下至少一项：车辆型号，声源位置，录音设备位置。3.根据权利要求1所述的方法，其中，所述噪声数据集合通过如下步骤确定：对于预先设定的车辆组中的车辆，获取该车辆对应的、关联于第二车载语音影响因素的至少一个噪声数据，将所获取的噪声数据存入噪声数据集合，其中，所述第二车载语音影响因素包括以下至少一项：车辆速度，车窗开关程度。4.根据权利要求1-3之一所述的方法，其中，所述基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成所述语音数据对应的仿真语音数据集合，包括：对于所述冲激响应数据集合中的冲激响应数据，执行如下选取步骤：从所述噪声数据集合中选取噪声数据，执行如下存储步骤：将该冲激响应数据、所述语音数据和所选取的噪声数据代入预先确定的仿真数据确定函数，生成仿真语音数据，存入仿真语音数据集合；确定所述噪声数据集合中是否存在未被选取的噪声数据；响应于确定存在，从所述噪声数据集合中选择未被选取的噪声数据继续执行存储步骤。5.根据权利要求1所述的方法，其中，所述方法还包括：根据所述仿真语音数据集合和预先确定的声学模型，得到车载声学模型，其中，所述车载声学模型用于表征语音数据与语音识别结果的对应关系。6.根据权利要求5所述的方法，其中，所述方法还包括：接收车载语音数据，将所述车载语音数据输入所述车载声学模型，得到对应于所述车载语音数据的语音识别结果。7.一种用于生成信息的装置，包括：数据获取单元，被配置成获取语音数据；数据生成单元，被配置成基于预先确定的冲激响应数据集合和预先确定的噪声数据集合，生成所述语音数...

【专利技术属性】
技术研发人员：李鑫，李超，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人