一种基于强化学习的刀具路径生成与优化方法技术

技术编号：20621045 阅读：56 留言：0更新日期：2019-03-20 13:45

本发明专利技术属于人工智能和计算机辅助相关技术领域，其公开了一种基于强化学习的刀具路径生成与优化方法，该方法包括以下步骤：(1)将加工信息输入到环境仿真模型；(2)环境仿真模型依据来自深度神经网络模型的动作值产生状态值，并将状态值输出给深度神经网络模型，深度神经网络模型根据状态值作产生新的动作值，并将新的动作值传输给环境仿真模型，如此两者不断交互，使得刀具从加工起始点到达加工终点，进而生成刀具路径；(3)重复步骤(2)以获得多条刀具路径，将多条刀具路径输入到路径评判模块，路径评判模块对每刀具路径做出判断并输出评判分数，将评判分数最高的刀具路径作为最终的刀具路径。本发明专利技术提高精度及效率，适用性较强。

A Tool Path Generation and Optimization Method Based on Reinforcement Learning

The invention belongs to the field of artificial intelligence and computer-aided related technology, and discloses a method of tool path generation and Optimization Based on reinforcement learning. The method includes the following steps: (1) input processing information into environmental simulation model; (2) environmental simulation model generates state value according to action value from deep neural network model, and outputs state value to deep neural network. The deep neural network model generates new action values according to the state values, and transmits the new action values to the environmental simulation model, so that the two interact continuously, making the tool from the starting point to the end point of the processing, and then generates the tool path; (3) Repeat steps (2) to obtain multiple tool paths, and input multiple tool paths into the path evaluation module, and the path evaluation module. Each tool path is judged and the score is output. The tool path with the highest score is regarded as the final tool path. The invention improves accuracy and efficiency, and has strong applicability.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的刀具路径生成与优化方法
本专利技术属于人工智能和计算机辅助相关
，更具体地，涉及一种基于强化学习的刀具路径生成与优化方法。
技术介绍
为了提高数控机床的加工技术的应用水平，降低数控加工的加工成本以及确保零件与产品的加工质量，无论是国内还是国外对数控加工中的刀具轨迹优化技术做了大量的研究工作。在数控加工过程中，当刀具轨迹骤然变化时，有可能会导致刀具瞬间铣削力急剧增大，机床和刀具的振动幅度增加，这样不仅会降低零件或产品的加工精度，还会降低机床和刀具的使用寿命。因此，刀具路径的研究具有十分重要的理论意义和经济效益。目前，本领域相关技术人员已经做了一些研究，如采用了机器学习技术，然而当前的加工轨迹生成方法大都是基于几何形状而没有考虑实际加工过程中的动力学问题，导致刀具路径的生成速度较差、加速特性不佳、与实际机械加工过程的契合度较低、需要人为参与、灵活性较差等技术问题。相应地，本领域存在发展一种速度较好的基于强化学习的刀具路径生成与优化方法的技术需求。
技术实现思路
针对现有技术的以上缺陷或改进需求，本专利技术提供了一种基于强化学习的刀具路径生成与优化方法，其基于现有刀具路径的生成特点，研究及设计了一种速度较好的基于强化学习的刀具路径生成与优化方法。所述方法结合了强化学习强大的决策能力及深度神经网络强大的感知能力，且考虑了实际加工过程中的运动学及动力学特性，能够在公差带之中快速、准确地规划一条更加符合实际加工过程的刀具路径。为实现上述目的，本专利技术提供了一种基于强化学习的刀具路径生成及优化方法，该方法包括以下步骤：(1)将加工信息输入到环境仿真...

【技术保护点】
1.一种基于强化学习的刀具路径生成与优化方法，其特征在于，该方法包括以下步骤：(1)将加工信息输入到环境仿真模型，所述环境仿真模型依据所述加工信息产生仿真刀具加工环境及加工的公差带，并将所述公差带输入到所述仿真刀具加工环境中；(2)所述环境仿真模型依据来自训练好的深度神经网络模型的动作值产生状态值，并将所述状态值输出给所述深度神经网络模型，所述深度神经网络模型根据接受到的所述状态值作前向推导以产生新的动作值，并将新的动作值传输给所述环境仿真模型，如此所述环境仿真模型与所述深度神经网络模型不断交互，使得刀具不断做出动作以从加工起始点沿着所述公差带延伸方向到达加工终点，进而生成一条刀具路径；(3)重复步骤(2)以获得多条刀具路径，将多条所述刀具路径输入到路径评判模块，所述路径评判模块对接收到的每一条刀具路径做出判断并输出一个评判分数，将多条所述刀具路径中评判分数最高的刀具路径作为最终的刀具路径。

【技术特征摘要】
1.一种基于强化学习的刀具路径生成与优化方法，其特征在于，该方法包括以下步骤：(1)将加工信息输入到环境仿真模型，所述环境仿真模型依据所述加工信息产生仿真刀具加工环境及加工的公差带，并将所述公差带输入到所述仿真刀具加工环境中；(2)所述环境仿真模型依据来自训练好的深度神经网络模型的动作值产生状态值，并将所述状态值输出给所述深度神经网络模型，所述深度神经网络模型根据接受到的所述状态值作前向推导以产生新的动作值，并将新的动作值传输给所述环境仿真模型，如此所述环境仿真模型与所述深度神经网络模型不断交互，使得刀具不断做出动作以从加工起始点沿着所述公差带延伸方向到达加工终点，进而生成一条刀具路径；(3)重复步骤(2)以获得多条刀具路径，将多条所述刀具路径输入到路径评判模块，所述路径评判模块对接收到的每一条刀具路径做出判断并输出一个评判分数，将多条所述刀具路径中评判分数最高的刀具路径作为最终的刀具路径。2.如权利要求1所述的基于强化学习的刀具路径生成与优化方法，其特征在于：所述加工信息包括工件轮廓信息、公差带带宽及刀具半径。3.如权利要求1所述的基于强化学习的刀具路径生成与优化方法，其特征在于：步骤(1)之前还包括构建所述环境仿真模型的步骤，所述环境仿真模型的构建包括以下步骤：首先，对实际加工过程进行建模以得到刀具加工模型，且对加工过程中机床给予刀具的动力及摩擦力进行分析，以抽象出加工过程中的刀具动力学过程；接着，对所述刀具加工模型中的摩擦系数进行辨识；最后，采用物理引擎构建仿真环境，进而得到所述环境仿真模型。4.如权利要求1所述的基于强化学习的刀具路径生成与优化方法，其特征在于：所述环境仿真模型根据接受...

【专利技术属性】
技术研发人员：杨建中，向单奇，武俊雄，高嵩，朱万强，宋仕杰，傅有，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人