机械的自动驾驶控制方法以及系统技术方案

技术编号：26064067 阅读：36 留言：0更新日期：2020-10-28 16:36

本发明专利技术提供机械的自动驾驶控制方法以及系统。通过去除基于数学地描述的函数的拟合的过学习的影响来削减实机与仿真的误差，以此将机械的自动驾驶控制最优化。控制机械的自动驾驶的自动驾驶控制系统设定第1模型，其基于数学地描述的函数来表示输入到所述机械的控制信号串与从遵循该控制信号串而控制的所述机械输出的数据的关系。系统在包含学习机械的自动驾驶控制的学习处理中，直到满足第1条件为止使用第1模型来执行学习，在满足第1条件以后，直到意味着过学习的第2条件得以满足为止，或直到该第2条件未得到满足而结束学习为止，使用使第1模型变化1次以上后的模型即第2模型来执行学习。

全部详细技术资料下载

【技术实现步骤摘要】
机械的自动驾驶控制方法以及系统
本专利技术总体涉及机械的自动驾驶控制。
技术介绍
大型工业机械等机械的自动驾驶控制进行以下操作：使用模仿实机的仿真，来寻找最优的自动驾驶控制方法，通过实机验证仿真上实现的自动驾驶控制。作为寻找该最优控制的方法，能举出最优化计算、强化学习等。作为大型工业机械的示例而有桥式起重机，在专利文献1中举出桥式起重机的自动驾驶控制的示例。根据专利文献1，进行以下操作：对某特定的搬运使用物理模型的搬运仿真，生成自动驾驶控制步骤，使得运送物不会摇晃。但由于实机与仿真间的误差，实机会进行与仿真不同的行动，难以得到希望的结果。因此，实机中的调整变得不可欠缺，但由于频繁使用大型工业机械的实机来进行实验则负担较大，因此较为困难。为了避免该问题，如专利文献2中所举出的那样，考虑生成仿真，使其接近实机。现有技术文献专利文献专利文献1：JP特开2007-161393号公报专利文献2：JP特开2004-178247号公报在桥式起重机中，考虑根据某标准的控制信号串的真实数据来生成专利文献2那样的精致的仿真，但为了对实机与仿真之间进行填补，进行基于数学地描述的函数的拟合(合わせ込み)。已知的是，在该拟合中，由于实机的数据不足、没有重现性，会进行过学习。在仿真进行了过学习的情况下，仿真强烈依赖于生成拟合仿真时的控制信号串、运送距离、运送物的重量、进行实机验证的环境等参数。因此，在控制信号串、运送距离、环境这样的参数发生变化时，仿真的结果较大变动...

【技术保护点】
1.一种自动驾驶控制系统，对机械的自动驾驶进行控制，所述自动驾驶控制系统的特征在于，具备：/n问题设定部，其设定第1模型，所述第1模型基于数学地描述的函数来表示输入到所述机械的控制信号串与从遵循该控制信号串而控制的所述机械输出的数据的关系；/n学习执行部，其执行包含学习所述机械的自动驾驶控制的学习处理；和/n驾驶控制部，其通过将遵循所述学习处理的结果的控制信号串输入到所述机械来对所述机械的自动驾驶进行控制，/n所述学习执行部在所述学习处理中，/n直到满足第1条件为止，使用所述第1模型来执行学习，/n在满足所述第1条件以后，直到意味着过学习的第2条件得以满足为止，或直到该第2条件未得到满足而结束学习为止，使用使所述第1模型变化1次以上后的模型即第2模型来执行学习。/n

【技术特征摘要】
20190417 JP 2019-0787371.一种自动驾驶控制系统，对机械的自动驾驶进行控制，所述自动驾驶控制系统的特征在于，具备：
问题设定部，其设定第1模型，所述第1模型基于数学地描述的函数来表示输入到所述机械的控制信号串与从遵循该控制信号串而控制的所述机械输出的数据的关系；
学习执行部，其执行包含学习所述机械的自动驾驶控制的学习处理；和
驾驶控制部，其通过将遵循所述学习处理的结果的控制信号串输入到所述机械来对所述机械的自动驾驶进行控制，
所述学习执行部在所述学习处理中，
直到满足第1条件为止，使用所述第1模型来执行学习，
在满足所述第1条件以后，直到意味着过学习的第2条件得以满足为止，或直到该第2条件未得到满足而结束学习为止，使用使所述第1模型变化1次以上后的模型即第2模型来执行学习。

2.根据权利要求1所述的自动驾驶控制系统，其特征在于，
所述第2模型是作为对所述第1模型施加与所述第1模型不同的数学地描述的第3模型当中的给定比例的第3模型的结果的模型。

3.根据权利要求2所述的自动驾驶控制系统，其特征在于，
所述自动驾驶控制系统具备：
可靠度设定部，其算出第1可靠度，所述第1可靠度基于从被输入第1控制信号串的所述第1模型输出的第1仿真结果数据、与从被输入所述第1控制信号串的所述机械输出的第1真实世界数据的第1误差，
所述给定比例是比算出的所述第1可靠度小的比例。

4.根据权利要求3所述的自动驾驶控制系统，其特征在于，
所述第1条件是基于所述第1可靠度和学习次数的条件。

5.根据权利要求3所述的自动驾驶控制系统，其特征在于，
所述自动驾驶控制系统具备：
施加模型生成部，其生成所述第3模型，所述所述第3模型是拟合所述第1模型以使得所述第1误差收在容许误差范围内的模型。

6.根据权利要求1所述的自动驾驶控制系统，其特征在于，
所述学习执行部在满足所述第2条件的情况下结束所述学习处理。

7.根据权利要求3所述的自动驾驶控制系统，其特征在于，
所述可靠度设定部显示所述第1误差以及所述第1可靠度当中的至少一者，
在针对该显示而接受到学习处理的许可的情况下，所述学习执行部执行所述学习处理。

8.根据权利要求1所述的自动驾驶控制系统，其特征在于，
利用所述第1模型的学习和利用所述第2模型的学习中的任何学习都是强化学习，
所述第2条件是下述当中的至少一者，
·遵循利用所述第2模型的强化学习中得到的报酬的值比遵循利用所述第1模型的强化学习中得到的报酬的值大，
·利用所述第2模型的强化学习中得到的报酬的变动幅度超过利用所述第1模...

【专利技术属性】
技术研发人员：松本杜青，工藤文也，鲸井俊宏，
申请(专利权)人：株式会社日立制作所，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人