语音标注数据的获取方法、装置及电子设备制造方法及图纸

技术编号：36752972 阅读：33 留言：0更新日期：2023-03-04 10:41

本公开提供了一种语音标注数据的获取方法、装置及电子设备，涉及人工智能技术领域，尤其涉及自然语言处理、深度学习、语音、自动驾驶技术领域。具体实现方案为：获取待处理的车辆环境下的语音样本；确定语音样本中语句与原始语音中相应语句之间的时间偏移信息；根据时间偏移信息，对原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理，得到语音样本对应的第二语音标注信息；根据语音样本以及语音样本对应的第二语音标注信息，生成车辆环境下的语音标注数据。由此，根据时间偏移信息，对原始语音对应的语音标注信息进行调整，结合语音样本及调整后的语音标注信息生成语音标注数据，从而提高语音标注效率及语音标注数据的准确度。数据的准确度。数据的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
语音标注数据的获取方法、装置及电子设备

[0001]本公开涉及人工智能
，尤其涉及自然语言处理、深度学习、语音、自动驾驶
，尤其涉及一种语音标注数据的获取方法、装置及电子设备。

技术介绍

[0002]目前，车载语音助手受制于不同车型实车环境(比如麦克风设备参数、间距、系统、功放等不一致)，往往在同一个项目要针对不同车型进行重复录音，且针对不同车型录制的语音都要进行语音标注。
[0003]相关技术中主要通过人工方式对不同的车型重复进行语音采集，并对采集的语音进行标注，人力耗费大，标注效率低，无法保证标注效果。

技术实现思路

[0004]本公开提供了一种语音标注数据的获取方法、装置及电子设备。
[0005]根据本公开的一方面，提供了一种语音标注数据的获取方法，包括：获取待处理的车辆环境下的语音样本，其中，所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本；确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息；根据所述时间偏移信息，对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理，得到所述语音样本对应的第二语音标注信息；根据所述语音样本以及所述语音样本对应的第二语音标注信息，生成所述车辆环境下的语音标注数据。
[0006]根据本公开的另一方面，提供了一种语音标注数据的获取装置，包括：第一获取模块，用于获取待处理的车辆环境下的语音样本，其中，所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本；确定模块，用于确定所述语音...

【技术保护点】

【技术特征摘要】
1.一种语音标注数据的获取方法，包括：获取待处理的车辆环境下的语音样本，其中，所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本；确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息；根据所述时间偏移信息，对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理，得到所述语音样本对应的第二语音标注信息；根据所述语音样本以及所述语音样本对应的第二语音标注信息，生成所述车辆环境下的语音标注数据。2.根据权利要求1所述的方法，其中，所述确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息，包括：确定所述语音样本中首个语句与所述原始语音中首个语句之间的第一时间偏移信息；确定所述语音样本中语句总时长与所述原始语音中语句总时长之间的第二时间偏移信息；所述语句总时长为首个语句的起始时间点至尾个语句的终止时间点的总时长；根据所述第一时间偏移信息、所述第二时间偏移信息以及所述语音样本中各语句的序列号，确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息。3.根据权利要求2所述的方法，其中，所述根据所述第一偏移信息、所述第二偏移信息以及所述语音样本中各语句的序列号，确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息，包括：根据所述第二偏移信息以及所述语音样本中各语句的序列号，确定所述语音样本中各语句相对于所述语音样本中首个语句的第三时间偏移信息；根据所述第三时间偏移信息以及所述第一时间偏移信息，确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息。4.根据权利要求3所述的方法，其中，所述根据所述第二偏移信息以及所述语音样本中各语句的序列号，确定所述语音样本中各语句相对于所述语音样本中首个语句的第三时间偏移信息，包括：根据所述第二偏移信息以及所述语音样本中语句数量，确定所述语音样本中相邻语句之间的时间偏移信息；针对所述语音样本中的每个语句，根据所述语音样本中相邻语句之间的时间偏移信息以及所述语句的序列号，确定所述语句相对于所述语音样本中首个语句的第三时间偏移信息。5.根据权利要求1所述的方法，其中，所述根据所述时间偏移信息，对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理，得到所述语音样本对应的第二语音标注信息，包括：针对所述语音样本中的每个语句，获取所述第一语音标注信息中所述语句的相应语句的标注信息，所述相应语句的标注信息包括：所述相应语句的文本内容、语句起始时间点以及语句终止时间点；根据所述语句与所述原始语音中所述相应语句之间的时间偏移信息，对所述相应语句的标注信息中的所述语句起始时间点以及所述语句终止时间点进行调整处理，得到所述语句的标注信息；
根据所述语音样本中各个语句的标注信息，生成所述语音样本对应的第二语音标注信息。6.根据权利要求1所述的方法，其中，所述方法还包括：对所述原始语音进行语音活动检测，获取所述原始语音中各个语句的语句起始时间点以及语句终止时间点；根据所述语句起始时间点以及所述语句终止时间点，对所述原始语句进行语句切分，得到各个语句语音片段；对各个所述语句语音片段进行语音识别处理，获取各个所述语句的文本内容；根据各个所述语句的语句起始时间点、语句终止时间点以及文本内容，生成所述原始语音对应的第一语音标注信息。7.一种语音标注数据的获取装置，包括：第一获取模块，用于获取待处理的车辆环境下的语音样本，其中，所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本；确定模块，用于确定所述语音样本中语句与所述原...

【专利技术属性】
技术研发人员：朱尊龙，王磊，
申请(专利权)人：阿波罗智行科技广州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人