【技术实现步骤摘要】
自动驾驶的多任务决策方法及装置、电子设备和介质
[0001]本公开涉及数据处理领域,尤其涉及自然语言处理和自动驾驶
,具体涉及一种自动驾驶的多任务决策方法
、
装置
、
电子设备
、
计算机可读存储介质和计算机程序产品
。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为
(
如学习
、
推理
、
思考
、
规划等
)
的学科,既有硬件层面的技术也有软件层面的技术
。
人工智能硬件技术一般包括如传感器
、
专用人工智能芯片
、
云计算
、
分布式存储
、
大数据处理等技术
:
人工智能软件技术主要包括计算机视觉技术
、
语音识别技术
、
自然语言处理技术以及机器学习
/
深度学习
、
大数据处理技术
、
知识图谱技术等几大方向
。
[0003]相关技术中,用于自动驾驶的多任务决策模型会针对每个决策任务建立一个分支网络,并通过多个分支网络并行处理采集到的传感器数据,以同时生成多个控制决策
。
技术实现思路
[0004]本公开提供了一种自动驾驶的多任务决策方法
、
装置
、
电子设备
、
计算机 ...
【技术保护点】
【技术特征摘要】
1.
一种自动驾驶的多任务决策方法,包括:获取自动驾驶的场景数据,其中,所述场景数据包括主车的行驶状态信息和场景环境信息,所述场景环境信息指示会对所述主车的行驶状态产生影响的至少一种环境因素;基于所述场景数据和多个目标决策任务生成对应的文本数据,其中,所述文本数据指示与所述多个目标决策任务相关联的至少部分所述行驶状态信息和至少部分所述场景环境信息;以及将所述文本数据输入语义理解模型,以得到所述语义理解模型输出的针对所述多个目标决策任务的目标控制决策,其中,所述语义理解模型是基于第一文本训练数据和第二文本训练数据训练得到的,所述第一文本训练数据包括训练车辆的训练行驶状态信息和训练场景环境信息,所述训练场景环境信息指示会对所述训练车辆的行驶状态产生影响的至少一种环境因素,所述第二文本训练数据包括基于所述训练行驶状态信息和所述训练场景环境信息生成的针对多个训练决策任务的训练控制决策,所述多个训练决策任务至少包括所述多个目标决策任务
。2.
根据权利要求1所述的方法,其中,所述基于所述场景数据和多个目标决策任务生成对应的文本数据包括:对于所述多个目标决策任务中的每个目标决策任务,确定该目标决策任务对应的至少一个影响因素,以得到所述多个目标决策任务对应的多个影响因素,其中,每个影响因素与所述主车的行驶状态或所处场景环境相关联;从所述场景数据中提取与所述多个影响因素关联的特征数据;以及基于所述特征数据生成所述文本数据
。3.
根据权利要求2所述的方法,其中,所述基于所述特征数据生成所述文本数据包括:根据所述多个目标决策任务中每个目标决策任务获取相应的第一文本模板,以得到多个第一文本模板;以及基于所述特征数据和所述多个第一文本模板生成所述文本数据
。4.
根据权利要求2所述的方法,其中,所述基于所述特征数据生成所述文本数据包括:根据所述多个影响因素获取对应的第二文本模板;以及基于所述特征数据和所述第二文本模板生成所述文本数据
。5.
根据权利要求1‑4中任一项所述的方法,还包括:将所述文本数据和所述目标控制决策作为训练数据返回所述语义理解模型,以调整所述语义理解模型的网络参数
。6.
根据权利要求1‑5中任一项所述的方法,其中,所述多个目标决策任务包括风险预警任务
、
盲区提示任务和路径选择任务中的至少两个
。7.
一种语义理解模型的训练方法,包括:获取第一文本训练数据,所述第一文本训练数据包括主车的训练行驶状态信息和训练场景环境信息,其中,所述训练场景环境信息指示会对所述主车的行驶状态产生影响的至少一种环境因素;根据所述第一文本训练数据确定第二文本训练数据,其中,所述第二文本训练数据包括根据所述训练行驶状态信息和所述训练场景环境信息确定的针对多个训练决策任务的训练控制决策;
将所述第一文本训练数据输入初始语义理解模型,以得到所述初始语义理解模型输出的初始控制决策;以及基于所述初始控制决策和所述第二文本训练数据调整所述初始语义理解模型的网络参数,以得到目标语义理解模型
。8.
如权利要求7所述的方法,其中,所述根据所述第一文本训练数据确定第二文本训练数据包括:根据所述第一文本训练数据和预设驾驶规则确定所述第二文本训练数据
。9.
如权利要求7或8所述的方法,其中,所述根据所述第一文本训练数据确定第二文本训练数据包括:获取所述第一文本训练数据对应的场景测试数据,其中,所述场景测试数据包括所述主车在所述训练场景环境信息对应的目标场景下
、
以所述训练行驶状态信息对应的行驶状态继续行驶所得到的测试结果数据;以及基于所述第一文本训练数据和所述场景测试数据确定所述第二文本训练数据
。10.
一种自动驾驶的多任务决策装置,包括:第一获取单元,被配置为获取自动驾驶的场景数据,其中,所述场景数据包括主车的行驶状态信息和场景环境信息,所述场景环境信息指示会对所述主车的行驶状态产生影响的至少一种环境因素;生成单元,被配置为基于所述场景数据和多个目标决策任务生成对应的文本数据,其中,所述文本数据指示与所述多个目标决策任务相关联的至少部分所述行驶状态信息和至少部分所述场景环境信息;以及决策单元,被配置为将所述文本数据输入语义理解模型,以得到所述语义理解模型输出的针对所述多个目标决策任务的目标控制决策,其中,所述语义理解模型是基于第一文本训练数据和第二文本训练数据训练得到的,所述第一文本训练数据包括训练车...
【专利技术属性】
技术研发人员:郑欣悦,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。