语音标注数据的获取方法、装置及电子设备制造方法及图纸

技术编号:36752972 阅读:33 留言:0更新日期:2023-03-04 10:41
本公开提供了一种语音标注数据的获取方法、装置及电子设备,涉及人工智能技术领域,尤其涉及自然语言处理、深度学习、语音、自动驾驶技术领域。具体实现方案为:获取待处理的车辆环境下的语音样本;确定语音样本中语句与原始语音中相应语句之间的时间偏移信息;根据时间偏移信息,对原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理,得到语音样本对应的第二语音标注信息;根据语音样本以及语音样本对应的第二语音标注信息,生成车辆环境下的语音标注数据。由此,根据时间偏移信息,对原始语音对应的语音标注信息进行调整,结合语音样本及调整后的语音标注信息生成语音标注数据,从而提高语音标注效率及语音标注数据的准确度。数据的准确度。数据的准确度。

【技术实现步骤摘要】
语音标注数据的获取方法、装置及电子设备


[0001]本公开涉及人工智能
,尤其涉及自然语言处理、深度学习、语音、自动驾驶
,尤其涉及一种语音标注数据的获取方法、装置及电子设备。

技术介绍

[0002]目前,车载语音助手受制于不同车型实车环境(比如麦克风设备参数、间距、系统、功放等不一致),往往在同一个项目要针对不同车型进行重复录音,且针对不同车型录制的语音都要进行语音标注。
[0003]相关技术中主要通过人工方式对不同的车型重复进行语音采集,并对采集的语音进行标注,人力耗费大,标注效率低,无法保证标注效果。

技术实现思路

[0004]本公开提供了一种语音标注数据的获取方法、装置及电子设备。
[0005]根据本公开的一方面,提供了一种语音标注数据的获取方法,包括:获取待处理的车辆环境下的语音样本,其中,所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本;确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息;根据所述时间偏移信息,对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理,得到所述语音样本对应的第二语音标注信息;根据所述语音样本以及所述语音样本对应的第二语音标注信息,生成所述车辆环境下的语音标注数据。
[0006]根据本公开的另一方面,提供了一种语音标注数据的获取装置,包括:第一获取模块,用于获取待处理的车辆环境下的语音样本,其中,所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本;确定模块,用于确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息;调整处理模块,用于根据所述时间偏移信息,对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理,得到所述语音样本对应的第二语音标注信息;第一生成模块,用于根据所述语音样本以及所述语音样本对应的第二语音标注信息,生成所述车辆环境下的语音标注数据。
[0007]根据本公开的再一方面,提供了一种电子设备,包括:
[0008]至少一个处理器;以及
[0009]与所述至少一个处理器通信连接的存储器;其中,
[0010]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开上述提出的语音标注数据的获取方法。
[0011]根据本公开的再一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开上述提出的语音标注数据的获取方法。
[0012]根据本公开的再一方面,提供了一种计算机程序产品,包括计算机程序,所述计算
机程序在被处理器执行时实现本公开上述提出的语音标注数据的获取方法的步骤。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开第一实施例的示意图;
[0016]图2是根据本公开第二实施例的示意图;
[0017]图3是根据本公开第三实施例的示意图;
[0018]图4是根据本公开第四实施例的示意图;
[0019]图5是根据本公开第五实施例的示意图;
[0020]图6是用来实现本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]目前,车载语音助手需要针对不同的车辆环境进行重复录音,且针对不同车型录制的语音都要进行语音标注,用于唤醒或识别模型的训练。
[0023]相关技术中主要通过人工方式对不同的车型重复进行语音采集,并对采集的语音进行标注,人力耗费大,标注效率低,无法保证标注效果。
[0024]针对上述问题,本公开提出一种语音标注数据的获取方法、装置及电子设备。
[0025]图1是根据本公开第一实施例的示意图,需要说明的是,本公开实施例的语音标注数据的获取方法可应用于语音标注数据的获取装置,该装置可被配置于电子设备中,以使该电子设备可以执行语音标注数据的获取功能。
[0026]其中,电子设备可以为任一具有计算能力的设备,例如可以为个人电脑(Personal Computer,简称PC)、移动终端、服务器等,移动终端例如可以为车载设备、手机、平板电脑、个人数字助理、穿戴式设备等具有各种操作系统、触摸屏和/或显示屏、语音交互功能的硬件设备。
[0027]如图1所示,该语音标注数据的获取方法可以包括如下步骤:
[0028]步骤101,获取待处理的车辆环境下的语音样本,其中,语音样本为在车辆环境下对原始语音进行采集得到的语音样本。
[0029]其中,待处理的车辆环境可以为不同车型的车辆环境,不同车型的硬件设备存在不同,例如麦克风的规格不同、麦克风间距不同、车辆中功率放大器不同、挡风玻璃不同,此处不作具体限定。
[0030]其中,待处理的车辆环境可以为多个,对应的获取的语音样本可以为多个。针对一个车辆环境,可以获取一个语音样本,也可以获取多个语音样本,此处不作具体限定。
[0031]其中,原始语音可以为录音棚中录制的文本内容的语音,文本内容可以为用户使
用频率较高的指令,例如打开车窗、打开空调、听音乐等。
[0032]在本公开实施例中,语音样本的获取方式可以为,在待处理的车辆环境下,使用播放工具播放原始录音,利用录音工具进行采集,得到语音样本。其中,播放工具,例如可以为人工嘴、音箱等。
[0033]其中,原始语音的文本内容和语音样本的文本内容相同,原始语音的语句总时长和语音样本的语句总时长不相同,因为语音样本的语句总时长包括操作设备的时长。
[0034]步骤102,确定语音样本中语句与原始语音中相应语句之间的时间偏移信息。
[0035]其中,时间偏移信息的数量可以为多个,时间偏移信息可以包括:语音样本中首个语句与原始语音中首个语句之间时间偏移信息、语音样本中语句总时长与原始语音中语句总时长之间时间偏移信息、语音样本中除首个语句之外的其他语句相对于原始语音中除首个语句之外的其他语句的时间偏移信息。
[0036]在本公开实施例中,语音样本中语句与原始语音中相应语句之间的时间偏移信息可以根据语音样本中首个语句与原始语音中首个语句之间时间偏移信息、语音样本中语句总时长与原始语音中语句总时长之间时间偏移信息确定。
[0037]步骤103,根据时间偏移信息,对原始语音对应的第一语音标注信息中的语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音标注数据的获取方法,包括:获取待处理的车辆环境下的语音样本,其中,所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本;确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息;根据所述时间偏移信息,对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理,得到所述语音样本对应的第二语音标注信息;根据所述语音样本以及所述语音样本对应的第二语音标注信息,生成所述车辆环境下的语音标注数据。2.根据权利要求1所述的方法,其中,所述确定所述语音样本中语句与所述原始语音中相应语句之间的时间偏移信息,包括:确定所述语音样本中首个语句与所述原始语音中首个语句之间的第一时间偏移信息;确定所述语音样本中语句总时长与所述原始语音中语句总时长之间的第二时间偏移信息;所述语句总时长为首个语句的起始时间点至尾个语句的终止时间点的总时长;根据所述第一时间偏移信息、所述第二时间偏移信息以及所述语音样本中各语句的序列号,确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息。3.根据权利要求2所述的方法,其中,所述根据所述第一偏移信息、所述第二偏移信息以及所述语音样本中各语句的序列号,确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息,包括:根据所述第二偏移信息以及所述语音样本中各语句的序列号,确定所述语音样本中各语句相对于所述语音样本中首个语句的第三时间偏移信息;根据所述第三时间偏移信息以及所述第一时间偏移信息,确定所述语音样本中各语句与所述原始语音中相应语句之间的时间偏移信息。4.根据权利要求3所述的方法,其中,所述根据所述第二偏移信息以及所述语音样本中各语句的序列号,确定所述语音样本中各语句相对于所述语音样本中首个语句的第三时间偏移信息,包括:根据所述第二偏移信息以及所述语音样本中语句数量,确定所述语音样本中相邻语句之间的时间偏移信息;针对所述语音样本中的每个语句,根据所述语音样本中相邻语句之间的时间偏移信息以及所述语句的序列号,确定所述语句相对于所述语音样本中首个语句的第三时间偏移信息。5.根据权利要求1所述的方法,其中,所述根据所述时间偏移信息,对所述原始语音对应的第一语音标注信息中的语句时间标注信息进行调整处理,得到所述语音样本对应的第二语音标注信息,包括:针对所述语音样本中的每个语句,获取所述第一语音标注信息中所述语句的相应语句的标注信息,所述相应语句的标注信息包括:所述相应语句的文本内容、语句起始时间点以及语句终止时间点;根据所述语句与所述原始语音中所述相应语句之间的时间偏移信息,对所述相应语句的标注信息中的所述语句起始时间点以及所述语句终止时间点进行调整处理,得到所述语句的标注信息;
根据所述语音样本中各个语句的标注信息,生成所述语音样本对应的第二语音标注信息。6.根据权利要求1所述的方法,其中,所述方法还包括:对所述原始语音进行语音活动检测,获取所述原始语音中各个语句的语句起始时间点以及语句终止时间点;根据所述语句起始时间点以及所述语句终止时间点,对所述原始语句进行语句切分,得到各个语句语音片段;对各个所述语句语音片段进行语音识别处理,获取各个所述语句的文本内容;根据各个所述语句的语句起始时间点、语句终止时间点以及文本内容,生成所述原始语音对应的第一语音标注信息。7.一种语音标注数据的获取装置,包括:第一获取模块,用于获取待处理的车辆环境下的语音样本,其中,所述语音样本为在所述车辆环境下对原始语音进行采集得到的语音样本;确定模块,用于确定所述语音样本中语句与所述原...

【专利技术属性】
技术研发人员:朱尊龙王磊
申请(专利权)人:阿波罗智行科技广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1