车辆语音交互方法、服务器和存储介质技术

技术编号:34967123 阅读:12 留言:0更新日期:2022-09-17 12:48
本发明专利技术公开了一种车辆语音交互方法、服务器和存储介质。该车辆语音交互方法包括:接收车辆转发的用户语音请求,对语音请求进行槽位识别;对语音请求进行应用程序接口预测;根据槽位识别的结果和预测到的应用程序接口,选择预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。本发明专利技术的车辆语音交互方法及车辆采用端到端架构可以降低车载系统的延时,提升对于用户指令的响应速度,同时,融入了用户语音请求的槽位识别结果和预测到的应用程序接口的额外特征,可以有效地提升应用程序接口参数填充任务的精度,满足车辆控制需求。满足车辆控制需求。满足车辆控制需求。

【技术实现步骤摘要】
车辆语音交互方法、服务器和存储介质


[0001]本专利技术涉及语音交互
,特别涉及一种车辆语音交互方法、服务器和存储介质。

技术介绍

[0002]目前的对话系统利用自然语言生成模块将用户的语句解析成为机器可理解的语义标签,并通过对话状态跟踪模块维护一个内部的对话状态作为整个对话历史的紧凑表示,根据此状态使用对话策略模块选择合适的对话动作,最后通过自然语言生成模块将对话动作转成自然语言回复。由于车载场景下车辆控制的需求具有很强的时效性,同时,车辆所用硬件自身的算力与开发人员离线训练模型所使用的硬件算力存在差异,导致车载环境下的语音交互对于时延有很高的要求,采用对话系统难以满足车载场景下的车辆控制需求。

技术实现思路

[0003]本专利技术实施方式提供一种车辆语音交互方法、服务器和存储介质。
[0004]本专利技术实施方式提供一种车辆语音交互方法。所述车辆语音交互方法包括:接收车辆转发的用户语音请求,对所述语音请求进行槽位识别;对所述语音请求进行应用程序接口预测;根据所述槽位识别的结果和预测到的应用程序接口,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。
[0005]如此,本专利技术的车辆语音交互方法及车辆采用端到端架构可以降低车载系统的延时,提升对于用户指令的响应速度,同时,融入了用户语音请求的槽位识别结果和预测到的应用程序接口的额外特征,可以有效地提升应用程序接口参数填充任务的精度,满足车辆控制需求。
[0006]所述根据所述槽位识别的结果和预测到的应用程序接口,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互,包括:根据所述用户语音请求、所述槽位识别的结果、所述预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数;根据所述槽位识别的结果和所述目标参数,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。
[0007]如此,本专利技术可以根据槽位识别的结果和目标参数,选择预测到的应用程序接口执行应用程序接口参数填充,直接输出执行结果下发至车辆完成语音交互,可以降低车载系统的延时,提升对于用户指令的响应速度。
[0008]所述根据所述用户语音请求、所述槽位识别的结果、预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数,包括:将所述用户语音请求和所述槽位识别的结果的槽位取值拼接作为文本序列进行编码得到第一特征向量;将所述槽位识别的结果的槽位类型映射为第一身份标识,并将所述第一身份标识转换为第二特征向量;将
所述预测到的应用程序接口类型映射为第二身份标识,并将所述第二身份标识转换为第三特征向量;将所述预测到的应用程序接口的参数映射为第三身份标识,并将所述第三身份标识转换为第四特征向量;利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数。
[0009]如此,本专利技术聚焦于端到端架构的槽位填充模型,提出了一种融入了额外特征的槽位填充方案,相比较目前的只运用槽位和API参数进行判断的方法,本专利技术融入了用户槽位识别结果的槽位类型、应用程序接口类型和应用程序接口的参数等额外特征,可以显著提升槽位填充任务的准确度,进而提升应用程序接口参数填充任务的精度。
[0010]所述利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数,包括:在所述槽位识别的结果包括多个所述槽位取值的情况下,利用所述槽位填充模型依次对每个所述槽位取值对应的所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数。
[0011]如此,本专利技术的车辆语音交互方法可以在槽位识别的结果中的槽位取值为多个的情况下,能够利用槽位填充模型依次对不同的槽位取值对应的第一特征向量与第二特征向量、第三特征向量和第四特征向量进行处理得到目标参数,保证应用程序接口参数填充任务的精度。
[0012]所述利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数,包括:在所述预测到的应用程序接口包括多个参数的情况下,利用所述槽位填充模型依次对所述预测到的应用程序接口每个参数对应的第四特征向量、所述第一特征向量、所述第二特征向量和所述第三特征向量进行处理以确定所述目标参数。
[0013]如此,本专利技术的车辆语音交互方法可以在预测到的应用程序接口包括多个参数的情况下,能够利用槽位填充模型根据不同的参数对应的第四特征向量与该参数对应的第一特征向量、第二特征向量和第三特征向量处理得到应用程序接口的目标参数,保证应用程序接口参数填充任务的精度。
[0014]所述在所述预测到的应用程序接口包括多个参数的情况下,利用所述槽位填充模型依次对所述预测到的应用程序接口每个参数对应的第四特征向量、所述第一特征向量、所述第二特征向量和所述第三特征向量进行处理以确定所述目标参数,包括:在所述槽位填充模型的处理结果为预设值的情况下,确定当次处理对应的所述预测到的应用程序接口的参数为所述目标参数。
[0015]如此,在槽位填充模型的处理结果为预设值的情况下,确定当次处理对应的预测到的应用程序接口的参数为目标参数,保证应用程序接口参数填充任务的精度。
[0016]所述将所述槽位识别的结果的槽位类型映射为第一身份标识,并将所述第一身份标识转换为第二特征向量包括:根据编码身份信息将所述槽位类型映射为所述第一身份标识;通过嵌入矩阵将所述第一身份标识转换为所述第二特征向量;所述将所述预测到的应用程序接口类型映射为第二身份标识,并将所述第二身份标识转换为第三特征向量包括:根据所述编码身份信息将所述预测到的应用程序接口类型映射为所述第二身份标识;通过所述嵌入矩阵将所述第二身份标识转换为所述第三特征向量。
[0017]如此,本专利技术的车辆语音交互方法可以根据编码身份信息将槽位类型映射为第一身份标识,将预测到的应用程序接口类型映射为第二身份标识,并分别通过额外嵌入矩阵得到第二特征向量和第三特征向量。
[0018]所述根据所述槽位识别的结果和所述目标参数,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互,包括:执行将所述槽位识别的结果的槽位取值填充到所述预测到的应用程序接口对应的所述目标参数的操作,输出执行结果下发至车辆完成语音交互。
[0019]如此,本专利技术通过执行将槽位识别的结果的槽位取值准确地填充到预测到的应用程序接口对应的目标参数的操作,输出执行结果下发至车辆完成语音交互。
[0020]本专利技术还提供一种服务器。所述服务器包括处理器和存储器,所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现上述实施方式任一项所述的车辆语音交互方法。
[0021]如此,本专利技术的服务器应用上述车辆语音交互方法采用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车辆语音交互方法,其特征在于,包括:接收车辆转发的用户语音请求,对所述语音请求进行槽位识别;对所述语音请求进行应用程序接口预测;根据所述槽位识别的结果和预测到的应用程序接口,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。2.根据权利要求1所述的车辆语音交互方法,其特征在于,所述根据所述槽位识别的结果和预测到的应用程序接口,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互,包括:根据所述用户语音请求、所述槽位识别的结果、所述预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数;根据所述槽位识别的结果和所述目标参数,选择所述预测到的应用程序接口执行应用程序接口参数填充,输出执行结果下发至车辆完成语音交互。3.根据权利要求2所述的车辆语音交互方法,其特征在于,所述根据所述用户语音请求、所述槽位识别的结果、预测到的应用程序接口和预测到的应用程序接口类型确定槽位填充的目标参数,包括:将所述用户语音请求和所述槽位识别的结果的槽位取值拼接作为文本序列进行编码得到第一特征向量;将所述槽位识别的结果的槽位类型映射为第一身份标识,并将所述第一身份标识转换为第二特征向量;将所述预测到的应用程序接口类型映射为第二身份标识,并将所述第二身份标识转换为第三特征向量;将所述预测到的应用程序接口的参数映射为第三身份标识,并将所述第三身份标识转换为第四特征向量;利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数。4.根据权利要求3所述的车辆语音交互方法,其特征在于,所述利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数,包括:在所述槽位识别的结果包括多个所述槽位取值的情况下,利用所述槽位填充模型依次对每个所述槽位取值对应的所述第一特征向量、所述第二特征向量、所述第三特征向量和所述第四特征向量进行处理以确定所述目标参数。5.根据权利要求3所述的车辆语音交互方法,其特征在于,所述利用槽位填充模型对所述第一特征向量、所述第二特征向量、所述第三...

【专利技术属性】
技术研发人员:丁鹏傑赵群宁洪珂樊骏锋
申请(专利权)人:广州小鹏汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1