用于生成模型的方法和装置制造方法及图纸

技术编号：20851485 阅读：45 留言：0更新日期：2019-04-13 09:52

本公开的实施例公开了用于生成模型的方法和装置。该方法的一具体实施方式包括：采用强化学习算法，基于初始模型，执行如下训练步骤，以学习加速度的生成：从目标速度集合中，选取目标速度；从加速度集合中，选取加速度；确定目标车辆在按照所选取的加速度进行行驶的状态下，目标车辆是否满足预先确定的行驶平滑条件；响应于确定满足行驶平滑条件，建立所选取的目标速度与所选取的加速度之间的对应关系；确定是否满足预设的结束训练条件；响应于确定满足结束训练条件，生成表征所建立的至少一个对应关系的行驶模型。该实施方式采用强化学习算法得到的模型来控制车辆的行驶，从而丰富了车辆的控制方式。

全部详细技术资料下载

【技术实现步骤摘要】
用于生成模型的方法和装置
本公开的实施例涉及计算机
，具体涉及用于生成模型的方法和装置。
技术介绍
当今的闭环自动控制技术，往往是基于反馈来减少不确定性。在工程实际中，通常采用比例积分微分控制器，来实现上述调节控制。采用比例积分微分控制器的前馈控制系统进行补偿，从而减小系统的偏差。例如，在对车辆进行控制时，现有技术通常采用比例积分微分控制器，来实现对车辆的控制。
技术实现思路
本公开提出了用于生成模型的方法和装置，以及用于生成信息的方法和装置。第一方面，本公开的实施例提供了一种用于生成模型的方法，该方法包括：获取目标速度集合和加速度集合，其中，加速度集合中的加速度用于指示目标车辆达到目标速度待具有的加速度；采用强化学习算法，基于初始模型，执行如下训练步骤，以学习加速度的生成：从目标速度集合中，选取目标速度；从加速度集合中，选取加速度；确定目标车辆在按照所选取的加速度进行行驶的状态下，目标车辆是否满足预先确定的行驶平滑条件；响应于确定满足行驶平滑条件，建立所选取的目标速度与所选取的加速度之间的对应关系；确定是否满足预设的结束训练条件；响应于确定满足结束训练条件，生...

【技术保护点】
1.一种用于生成模型的方法，包括：获取目标速度集合和加速度集合，其中，所述加速度集合中的加速度用于指示目标车辆达到目标速度待具有的加速度；采用强化学习算法，基于初始模型，执行如下训练步骤，以学习加速度的生成：从所述目标速度集合中，选取目标速度；从所述加速度集合中，选取加速度；确定所述目标车辆在按照所选取的加速度进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件；响应于确定满足所述行驶平滑条件，建立所选取的目标速度与所选取的加速度之间的对应关系；确定是否满足预设的结束训练条件；响应于确定满足所述结束训练条件，生成表征所建立的至少一个对应关系的行驶模型。

【技术特征摘要】
1.一种用于生成模型的方法，包括：获取目标速度集合和加速度集合，其中，所述加速度集合中的加速度用于指示目标车辆达到目标速度待具有的加速度；采用强化学习算法，基于初始模型，执行如下训练步骤，以学习加速度的生成：从所述目标速度集合中，选取目标速度；从所述加速度集合中，选取加速度；确定所述目标车辆在按照所选取的加速度进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件；响应于确定满足所述行驶平滑条件，建立所选取的目标速度与所选取的加速度之间的对应关系；确定是否满足预设的结束训练条件；响应于确定满足所述结束训练条件，生成表征所建立的至少一个对应关系的行驶模型。2.根据权利要求1所述的方法，其中，所述方法还包括：响应于确定不满足所述结束训练条件，调整初始模型的模型参数，采用模型参数调整后的初始模型，继续执行所述训练步骤。3.根据权利要求1所述的方法，其中，所述确定所述目标车辆在按照所选取的加速度进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件，包括：确定所述目标车辆按照所选取的加速度在仿真环境中进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件。4.根据权利要求1所述的方法，其中，所述确定所述目标车辆在按照所选取的加速度进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件，包括：确定所述目标车辆，按照所选取的加速度在实际行驶过程中进行行驶的状态下，所述目标车辆是否满足预先确定的行驶平滑条件。5.根据权利要求1所述的方法，其中，所述目标速度集合中的目标速度与所述加速度集合中的加速度一一对应；以及针对所述目标速度集合中的目标速度，该目标速度对应的加速度是通过如下步骤得到的：确定目标车辆从初始速度达到该目标速度的时间；确定该目标速度与初始速度的差值；将所确定的差值与所确定的时间的比值，确定为该目标速度对应的加速度。6.根据权利要求1-5之一所述的方法，其中，所述行驶平滑条件包括以下至少一项：所述目标车辆的平均速度小于预设的速度阈值；所述目标车辆的加速度变化率小于预设的加速度变化率阈值。7.一种用于生成模型的方法，包括：获取目标车辆的初始速度和目标速度；将所述初始速度和所述目标速度输入至预先训练的行驶模型，得到加速度，其中，所述行驶模型是按照如权利要求1-6之一所述的方法训练得到的，所述加速度用于指示所述目标车辆达到所述目标速度待具有的加速度；根据所述加速度，生成用于指示所述目标车辆行驶的指令。8.一种用于生成模型的装置，包括：第一获取单元，被配置成获取目标速度集合和加速度集合，其中，所述加速度集合中的加速度用于指示目标车辆达到目标速度待具...

【专利技术属性】
技术研发人员：张连川，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人