一种驾驶交互方法及相关装置制造方法及图纸

技术编号:39243896 阅读:8 留言:0更新日期:2023-10-30 11:56
本申请公开一种驾驶交互方法及相关装置,应用于驾驶领域。先通过符合驾驶对象语言的第二驾驶训练数据微调训练自动驾驶模型得到预设驾驶模型,再基于驾驶对象反馈机制通过第一驾驶训练数据强化训练预设驾驶模型得到驾驶交互模型。当获取驾驶设备的目标驾驶输入数据时,将目标驾驶输入数据输入驾驶交互模型进行输出预测,得到符合驾驶对象语言的目标驾驶输出数据;按照驾驶设备与目标驾驶对象的交互方式,向驾驶设备的目标驾驶对象交互目标驾驶输出数据。该方法针对驾驶设备的驾驶输入数据准确地预测符合驾驶对象偏好的驾驶输出数据,且驾驶输出数据符合驾驶对象语言能够直接与驾驶对象交互,以向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况。驶场景的驾驶情况。驶场景的驾驶情况。

【技术实现步骤摘要】
一种驾驶交互方法及相关装置


[0001]本申请涉及计算机
,特别是涉及一种驾驶交互方法及相关装置。

技术介绍

[0002]随着驾驶技术的快速发展,越来越多的驾驶设备可以在没有驾驶对象主动驾驶情况下,通过自动驾驶方法进行自动驾驶。
[0003]相关技术中,驾驶设备通过自动驾驶方法进行自动驾驶通常是指:先通过自动驾驶模型对驾驶设备的驾驶输入数据进行预测输出自动驾驶策略,再通过自动驾驶策略控制驾驶设备进行自动驾驶。
[0004]然而,上述方法中自动驾驶策略仅用于控制驾驶设备进行自动驾驶,无法向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况,导致驾驶对象的驾驶体验较差。

技术实现思路

[0005]为了解决上述技术问题,本申请提供了一种驾驶交互方法及相关装置,不仅能够针对驾驶设备的驾驶输入数据准确地预测符合驾驶对象偏好的驾驶输出数据,而且使得驾驶输出数据符合驾驶对象语言,能够直接向驾驶对象交互驾驶输出数据,以便向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况,从而提升驾驶对象的驾驶体验。
[0006]本申请实施例公开了如下技术方案:
[0007]一方面,本申请实施例提供一种驾驶交互方法,所述方法包括:
[0008]获取驾驶设备的目标驾驶输入数据;
[0009]通过驾驶交互模型对所述目标驾驶输入数据进行输出预测,获得符合驾驶对象语言的目标驾驶输出数据;所述驾驶交互模型是基于驾驶对象反馈机制根据第一驾驶训练数据对预设驾驶模型进行强化训练获得的,所述预设驾驶模型是根据符合所述驾驶对象语言的第二驾驶训练数据对自动驾驶模型进行微调训练获得的;
[0010]向所述驾驶设备的目标驾驶对象交互所述目标驾驶输出数据;所述目标驾驶输出数据的交互方式符合所述驾驶设备与所述目标驾驶对象的交互方式。
[0011]另一方面,本申请实施例提供一种驾驶交互装置,所述装置包括:获取单元、预测单元和交互单元;
[0012]所述获取单元,用于获取驾驶设备的目标驾驶输入数据;
[0013]所述预测单元,用于通过驾驶交互模型对所述目标驾驶输入数据进行输出预测,获得符合驾驶对象语言的目标驾驶输出数据;所述驾驶交互模型是基于驾驶对象反馈机制根据第一驾驶训练数据对预设驾驶模型进行强化训练获得的,所述预设驾驶模型是根据符合所述驾驶对象语言的第二驾驶训练数据对自动驾驶模型进行微调训练获得的;
[0014]所述交互单元,用于向所述驾驶设备的目标驾驶对象交互所述目标驾驶输出数据;所述目标驾驶输出数据的交互方式符合所述驾驶设备与所述目标驾驶对象的交互方式。
[0015]另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:
[0016]所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
[0017]所述处理器用于根据所述计算机程序中的指令执行前述任一方面所述的方法。
[0018]另一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行前述任一方面所述的方法。
[0019]另一方面,本申请实施例提供一种计算机程序产品,包括计算机程序,当其在计算机设备上运行时,使得所述计算机设备执行时实现前述任一方面所述的方法。
[0020]由上述技术方案可以看出,先通过符合驾驶对象语言的第二驾驶训练数据微调训练自动驾驶模型得到预设驾驶模型,再基于驾驶对象反馈机制通过第一驾驶训练数据强化训练预设驾驶模型得到驾驶交互模型。当获取驾驶设备的目标驾驶输入数据时,首先,将目标驾驶输入数据输入驾驶交互模型进行输出预测,得到符合驾驶对象语言的目标驾驶输出数据;驾驶交互模型在训练过程中通过微调训练方式学习驾驶对象语言、通过强化训练方式学习驾驶对象偏好,不仅能够针对目标驾驶输入数据准确地预测符合驾驶对象偏好的目标驾驶输出数据,而且符合驾驶对象语言的目标驾驶输出数据能够直接用于与目标驾驶对象进行交互。然后,按照驾驶设备与目标驾驶对象的交互方式,向驾驶设备的目标驾驶对象交互目标驾驶输出数据;数据交互方式能够向目标驾驶对象指导目标驾驶输入数据的目标驾驶输出数据,以便目标驾驶对象明确驾驶设备所处驾驶场景的驾驶情况。基于此,该方法不仅能够针对驾驶设备的驾驶输入数据准确地预测符合驾驶对象偏好的驾驶输出数据,而且使得驾驶输出数据符合驾驶对象语言能够直接与驾驶对象进行交互,以便向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况,从而提升驾驶对象的驾驶体验。
附图说明
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术成员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本申请实施例提供的一种驾驶交互方法的系统架构示意图;
[0023]图2为本申请实施例提供的一种驾驶交互方法的流程图;
[0024]图3为本申请实施例提供的一种执行驾驶交互方法的驾驶交互系统的结构示意图;
[0025]图4为本申请实施例提供的一种获得驾驶交互模型方法的流程图;
[0026]图5为本申请实施例提供的一种基于预设驾驶模型获得目标驾驶模型的具体流程图;
[0027]图6为本申请实施例提供的一种获得奖励模型的具体流程图;
[0028]图7为本申请实施例提供的一种基于目标驾驶模型获得驾驶交互模型的具体流程图;
[0029]图8为本申请实施例提供的一种驾驶交互装置的结构图;
[0030]图9为本申请实施例提供的一种终端的结构图;
[0031]图10为本申请实施例提供的一种服务器的结构图。
具体实施方式
[0032]下面结合附图,对本申请的实施例进行描述。
[0033]现阶段,驾驶设备可以在没有驾驶对象主动驾驶情况下,通过自动驾驶方法进行自动驾驶。即,先通过自动驾驶模型对驾驶设备的驾驶输入数据进行预测输出自动驾驶策略,再通过自动驾驶策略控制驾驶设备进行自动驾驶。
[0034]但是,经过研究发现,上述方法中自动驾驶策略仅用于控制驾驶设备进行自动驾驶,无法向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况,导致驾驶对象的驾驶体验较差。
[0035]本申请实施例提供一种驾驶交互方法,不仅能够针对驾驶设备的驾驶输入数据准确地预测符合驾驶对象偏好的驾驶输出数据,而且使得驾驶输出数据符合驾驶对象语言能够直接与驾驶对象进行交互,以便向驾驶对象指导驾驶设备所处驾驶场景的驾驶情况,从而提升驾驶对象的驾驶体验。
[0036]接下来,将对驾驶交互方法的系统架构进行介绍。参见图1,图1为本申请实施例提供的一种驾驶交互方法的系统架构示意图,该系统架构中包括驾驶设备101的处理设备102,用于与驾驶设备101进行驾驶交互。
[0037]其中,处理设备102可以是终端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种驾驶交互的方法,其特征在于,所述方法包括:获取驾驶设备的目标驾驶输入数据;通过驾驶交互模型对所述目标驾驶输入数据进行输出预测,获得符合驾驶对象语言的目标驾驶输出数据;所述驾驶交互模型是基于驾驶对象反馈机制根据第一驾驶训练数据对预设驾驶模型进行强化训练获得的,所述预设驾驶模型是根据符合所述驾驶对象语言的第二驾驶训练数据对自动驾驶模型进行微调训练获得的;向所述驾驶设备的目标驾驶对象交互所述目标驾驶输出数据;所述目标驾驶输出数据的交互方式符合所述驾驶设备与所述目标驾驶对象的交互方式。2.根据权利要求1所述的方法,其特征在于,所述通过驾驶交互模型对所述目标驾驶输入数据进行输出预测,获得符合驾驶对象语言的目标驾驶输出数据,包括:对所述目标驾驶输入数据进行数据预处理,获得符合所述驾驶交互模型的输入数据需求的输入标记序列组;通过所述驾驶交互模型对所述输入标记序列组进行输出预测,获得所述输入标记序列组的输出标记序列组;对所述输出标记序列组进行数据后处理,获得符合所述驾驶对象语言的所述目标驾驶输出数据。3.根据权利要求2所述的方法,其特征在于,所述通过所述驾驶交互模型对所述输入标记序列组进行输出预测,获得所述输入标记序列组的输出标记序列组,包括:通过所述驾驶交互模型对所述输入标记数据序列组进行输出预测,获得多个预测标记序列组和多个所述预测标记序列组对应的多个预测概率分布;将多个所述预测概率分布中最大预测概率分布对应的预测标记序列组确定为所述输出标记序列组。4.根据权利要求3所述的方法,其特征在于,所述输入标记序列组包括多个输入标记序列时,所述预测标记序列组的获得步骤,具体为:按照第一优先级顺序或第一时间顺序对多个所述输入标记序列进行输出预测,获得多个预测标记序列形成所述预测标记序列组;所述第一优先级顺序是根据多个所述输入标记序列携带的多个优先级级别确定的,所述第一时间顺序是根据多个所述输入标记序列携带的多个已校准时间戳确定的。5.根据权利要求2所述的方法,其特征在于,所述输出标记序列组包括多个输出标记序列时,所述对所述输出标记序列组进行数据后处理,获得符合所述驾驶对象语言的所述目标驾驶输出数据,包括:对多个所述输出标记序列进行数据后处理,获得符合所述驾驶对象语言的多个第一后处理数据;从多个所述第一后处理数据中确定用于与所述目标驾驶对象交互的第二后处理数据集;若所述第二后处理数据集包括多个第二后处理数据,按照第二优先级顺序或第二时间顺序调整多个所述第二后处理数据,获得所述目标驾驶输出数据;所述第二优先级顺序是根据多个所述第二后处理数据携带的多个优先级级别确定的,所述第二时间顺序是根据多个所述第二后处理数据携带的多个后处理时间戳确定的;
若所述第二后处理数据集为一个第二后处理数据,将一个所述第二后处理数据确定为所述目标驾驶输出数据。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:按照所述目标驾驶对象针对输出数据的预设配置方式对所述目标驾驶输出数据进行数据配置,获得符合所述预设配置方式的目标驾驶输出数据;所述向所述驾驶设备的目标驾驶对象交互所述目标驾驶输出数据,具体为:向所述目标驾驶对象交互符合所述预设配置方式的目标驾驶输出数据。7.根据权利要求1至6任一项所述的方法,其特征在于,所述目标驾驶输入数据包括所述驾驶设备中驾驶传感器的传感器检测数据、所述驾驶设备所处的交通环境数据和所述目标驾驶对象输入的对象输入数据中的一种或多种。8.根据权利要求1至6任一项所述的方法,其特征在于,所述第一驾驶训练数据包括第一驾驶输入数据、第二驾驶输入数据和第三驾驶输入数据,所述驾驶交互模型的获得步骤,包括:根据所述第一驾驶输入数据和所述第一驾驶输入数据标注的第一驾驶输出数据,对所述预设驾驶模型进行微调训练获得目标驾驶模型;根据所述第二驾驶输入数据、所述第二驾驶输入数...

【专利技术属性】
技术研发人员:孙中阳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1