一种训练语料的生成方法、装置、设备及存储介质制造方法及图纸

技术编号：21481300 阅读：33 留言：0更新日期：2019-06-29 05:40

本发明专利技术公开了一种训练语料的生成方法、装置、设备及存储介质。其中，该方法包括：在与目标应用程序关联的用户行为日志中，挖掘多条待标注的语料数据，语料数据中包括：包含用户语音以及对应语音识别结果的第一行为日志，以及与第一行为日志时间关联，且属于同一用户的第二行为日志；根据各待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料。本发明专利技术实施例可以基于用户行为，自动地、有针对性地挖掘语音识别的正反馈语料和负反馈语料提供给后续的语音识别模型训练，有效提升语音识别的效果，可以大大缩短语音识别模型的迭代周期，节省大量的资源。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练语料的生成方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术，尤其涉及一种训练语料的生成方法、装置、设备及存储介质。
技术介绍
目前地图类应用程序的语音识别模型的优化主要需要以下三步：随机抽取几万小时的音频及其对应场景信息；花费巨额金钱和时间进行人工标注，产出训练语料；基于新的训练语料重新训练语音识别模型，并且调优。专利技术人在实现本专利技术的过程中，发现由于现有技术中，语音识别的训练语料主要来源于人工标注的随机音频，导致两个主要问题：由于是人工标注，导致语音识别模型迭代周期过长，并且资源耗费比较严重；由于是随机抽取的音频，导致有大量的无效标注(增加识别错误的语料比增加识别正确的语料更加有价值)。
技术实现思路
本专利技术实施例提供一种训练语料的生成方法、装置、设备及存储介质，以实现基于用户行为，自动地、有针对性地挖掘语音识别的训练语料。第一方面，本专利技术实施例提供了一种训练语料的生成方法，包括：在与目标应用程序关联的用户行为日志中，挖掘多条待标注的语料数据，语料数据中包括：包含用户语音以及对应语音识别结果的第一行为日志，以及与第一行为日志时间关联，且属于同一用户的第二行为日志；根据各待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料。第二方面，本专利技术实施例还提供了一种训练语料的生成装置，包括：语料数据挖掘模块，用于在与目标应用程序关联的用户行为日志中，挖掘多条待标注的语料数据，所述语料数据中包括：包含用户语音以及对应语音识别结果的第一行为日志，以及...

【技术保护点】
1.一种训练语料的生成方法，其特征在于，包括：在与目标应用程序关联的用户行为日志中，挖掘多条待标注的语料数据，所述语料数据中包括：包含用户语音以及对应语音识别结果的第一行为日志，以及与所述第一行为日志时间关联，且属于同一用户的第二行为日志；根据各所述待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各所述语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料。

【技术特征摘要】
1.一种训练语料的生成方法，其特征在于，包括：在与目标应用程序关联的用户行为日志中，挖掘多条待标注的语料数据，所述语料数据中包括：包含用户语音以及对应语音识别结果的第一行为日志，以及与所述第一行为日志时间关联，且属于同一用户的第二行为日志；根据各所述待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各所述语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料。2.根据权利要求1所述的方法，其特征在于，根据各所述待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各所述语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料，包括：根据第一行为日志的日志类型，获取与所述第一行为日志对应的用户预期行为；在确定所述用户预期行为与所述第二行为日志相匹配时，将所述语料数据中的所述用户语音以及对应的语音识别结果判定为正反馈语料。3.根据权利要求1所述的方法，其特征在于，根据各所述待标注的语料数据中，第一行为日志与第二行为日志之间的关联关系，将各所述语料数据中的用户语音以及对应的语音识别结果判定为正反馈语料或者负反馈语料，包括：如果确定第二行为日志对应的用户行为为设定时间段内对所述第一行为日志的修正行为，则将所述语料数据中的所述用户语音以及对应的语音识别结果判定为负反馈语料。4.根据权利要求1所述的方法，其特征在于，所述目标应用程序包括：地图类应用程序。5.根据权利要求2所述的方法，其特征在于，根据第一行为日志的日志类型，获取与所述第一行为日志对应的用户预期行为，包括：如果确定所述第一行为日志的日志类型为使用与所述用户语音对应的语音识别结果作为目的地发起位置检索服务，则确定所述用户预期行为为用户在与所述位置检索服务匹配的检索结果页面中选择发起与所述目的地匹配的路线检索服务的选项。6.根据权利要求2所述的方法，其特征在于，根据第一行为日志的日志类型，获取与所述第一行为日志对应的用户预期行为，包括：如果确定所述第一行为日志的日志类型为将与所述用户语音对应的语音识别结果作为目的地发起路线检索服务，则确定所述用户预期行为为用户在与所述路线检索服务匹配的路线检索页面中选择导航至所述目的地的选项。7.根据权利要求2所述的方法，其特征在于，根据第一行为日志的日志类型，获取与所述第一行为日志对应的用户预期行为，包括：如果确定所述第一行为日志的日志类型为将与所述用户语音对应的语音识别结果作为目的地发起路线导航服务，则确定所述用户预期行为为用户成功抵达所述目的地。8.根据权利要求3所述的方法，其特征在于，确定第二行为日志对应的用户行为为设定时间段内对所述第一行为日志的修正行为，包括：如果确定所述第二行为日志对应的用户行为为重新输入修正语音，且与所述修...

【专利技术属性】
技术研发人员：丁世强，黄际洲，蒋忠伟，马文韬，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人