【技术实现步骤摘要】
行为决策模型优化、行为决策方法、装置、设备及介质
[0001]本专利技术涉及车辆自动驾驶
,尤其涉及一种行为决策模型优化、行为决策方法、装置、设备及介质。
技术介绍
[0002]在车辆自动驾驶过程中,为了保证车辆行进的流畅性以及安全性,需要根据车辆当前行驶状态以及车辆周围环境状态对自动驾驶的当前行为进行决策。
[0003]在现有技术中,分类器可以用于各种场景下的事件决策,但现有的分类器无法直接用于根据车辆相关信息获取车辆行为决策,因此,对现有的分类器进行优化以获取最优车辆行为决策显得较为重要。
技术实现思路
[0004]本专利技术提供了一种行为决策模型优化、行为决策方法、装置、设备及介质,能够高效优化车辆行为决策模型,提高车辆行为决策模型的准确率。
[0005]根据本专利技术的一方面,提供了一种车辆行为决策模型的优化方法,包括:
[0006]获取待优化的车辆行为决策模型和与车辆行为决策模型匹配的标准验证样本集,标准验证样本中包括多个车辆环境描述特征值和标准行为决策结果;
[0007]对标准验证样本集进行数据预处理,得到归一化样本集;
[0008]基于蝙蝠算法设置参数,采用蝙蝠算法进行蝙蝠群体的多轮迭代处理;
[0009]其中,在每轮迭代过程中,使用与当前迭代轮次匹配的各蝙蝠对车辆行为决策模型进行更新后,以将标准验证样本集输入至各更新后车辆行为决策模型的适应度为评价指标,在各蝙蝠中识别当前轮次最优蝙蝠,并使用当前轮次最优蝙蝠进行当前轮次的蝙蝠群体迭代 ...
【技术保护点】
【技术特征摘要】
1.一种车辆行为决策模型的优化方法,其特征在于,包括:获取待优化的车辆行为决策模型和与车辆行为决策模型匹配的标准验证样本集,标准验证样本中包括多个车辆环境描述特征值和标准行为决策结果;对标准验证样本集进行数据预处理,得到归一化样本集;基于蝙蝠算法设置参数,采用蝙蝠算法进行蝙蝠群体的多轮迭代处理;其中,在每轮迭代过程中,使用与当前迭代轮次匹配的各蝙蝠对车辆行为决策模型进行更新后,以将标准验证样本集输入至各更新后车辆行为决策模型的适应度为评价指标,在各蝙蝠中识别当前轮次最优蝙蝠,并使用当前轮次最优蝙蝠进行当前轮次的蝙蝠群体迭代优化,蝙蝠中包括惩罚因子和高斯核函数;当满足蝙蝠迭代结束条件时,获取全局最优蝙蝠;利用全局最优蝙蝠对车辆行为决策模型进行更新,得到优化后车辆行为决策模型。2.根据权利要求1所述的方法,其特征在于,对标准验证样本集进行数据预处理,得到归一化样本集,包括:对各标准验证样本中的各车辆环境描述特征值进行数据归一化处理,得到经数据归一化处理的归一化样本集。3.根据权利要求1所述的方法,其特征在于,蝙蝠算法设置参数包括蝙蝠群体个数、最大迭代次数、蝙蝠初始位置、蝙蝠初始速度以及适应度函数。4.根据权利要求3所述的方法,其特征在于,所述基于蝙蝠算法设置参数,采用蝙蝠算法进行蝙蝠群体的多轮迭代处理,包括:利用蝙蝠初始位置更新待优化的车辆行为决策模型,将归一化数据输入至更新后的车辆行为决策模型,通过预设的适应度函数获取当前最优蝙蝠,并保存所述当前最优蝙蝠相关信息;根据所述当前最优蝙蝠相关信息,对当前蝙蝠群体中的各蝙蝠进行迭代;根据上一迭代轮次中的最优蝙蝠相关信息计算得到本轮迭代最优飞行位置,根据最优飞行位置以及蝙蝠初始速度对上一迭代后的各蝙蝠位置进行更新迭代更新;将本轮迭代后各蝙蝠的适应度值与上一轮迭代后各蝙蝠的适应度值进行对比,保存两轮迭代中适应度值较高的各蝙蝠位置,同时更新下一轮迭代所需的相关参数,进行下一轮迭代,直至满足蝙蝠迭代停止条件时,停止蝙蝠迭代。5.根据权利要求4所述的方法,其特征在于,所述当满足蝙蝠迭代结束条件时,获取全局最优蝙蝠,包括:当满足蝙蝠迭代结束条件时,根据归一化样本集计算行为决策模型针对各蝙蝠的最终适应度值;获取适应度值最高的蝙蝠,将适应度最高的蝙蝠作为全局最优蝙蝠。6.一种车辆行为决策方法,由车机系统执行,其特征在于,包括:通过车辆中设置的多个传感器的信息采集结果,获取与本车辆和车辆行为决策相关的至少一个关联车辆对应的多个车辆环境描述特征值;其中,车辆环境描述特征值包括本车辆与各相关车辆的车辆类型、本车辆与各相关车辆的当前车辆速度、本车辆与各相关车辆的当前车辆加速度、本车辆与各相关车辆的当前车辆左前方坐标、本车辆与各相关车辆的当前车辆前纵坐标、本车辆与各相关车辆的当前
车辆宽度、本车辆与各相关车辆的当前车辆长度、本车辆与至少一个前方车辆的间距以及本车辆与至少一个后方车辆的间距;将所述多个车辆环境描述特征值输入至采用权利要求1
‑
5任一项...
【专利技术属性】
技术研发人员:王兆麒,姜珊,孙忠刚,张晓谦,王兆麟,
申请(专利权)人:中国第一汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。