本发明专利技术公开了一种基于自注意力机制神经网络的悬臂梁结构设计方法。该设计方法能够解决传统MMC算法在生成悬臂梁结构的过程中计算迭代时间高的问题,该方法包括模型的获取和使用两个部分,其中模型获取的主要流程为:1、预先使用MMC法生成训练集和测试集;2、对生成的数据进行数据清洗;3、使用多重感知机模型构建类词向量模型;4、使用改进的Transformer模型来生成的最终的输出;5、使用模型进行训练;6、使用模型得到最后的结果。本发明专利技术使用最终模型进行结构优化设计时,通过输入边界条件向量进入模型得到模型输出,再将输出输入MMC绘图函数从而实现最终优化结构的快速计算。
【技术实现步骤摘要】
一种基于自注意力机制神经网络的悬臂梁结构设计方法
本专利技术属于人工智能和结构设计优化领域,尤其涉及一种基于自注意力机制神经网络的悬臂梁结构设计方法。
技术介绍
为了在给定的负载情况、约束条件和性能指标下设计出最优的悬臂梁结构,国内外的研究者应用拓扑优化方法来进行优化设计。拓扑优化的基本思想是将寻求结构的最优拓扑问题转化为在给定的设计区域内寻求最优材料的分布问题,目前拓扑优化方法主要有SIMP算法、ESO算法、水平集法和MMC算法等,以上方法的计算量取决于设计域的规模,随着设计域的不断增大,计算量成倍增加,使得获取最优设计结果需要花费很长的时间。随着深度学习的不断发展,其在各个领域的作用也越来越大;深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据。基于深度学习中的神经网络模型,可以定义约束条件矩阵,输入神经网络,通过训练出一个收敛好的神经网络模型,克服生成悬臂梁结构时计算量过大,生成结果花费时间长的问题。
技术实现思路
本专利技术提供了一种基于自注意力机制神经网络的悬臂梁结构设计方法,可以大幅度降低生成悬臂梁结构时的计算复杂度,减少计算开销。本专利技术采用如下技术方案来实现的:一种基于自注意力机制神经网络的悬臂梁结构设计方法,包括以下步骤:1)使用MMC算法准备悬臂梁结构数据;2)对生成的悬臂梁结构数据进行数据清洗;3)使用多重感知机模型构建类词向量模型;4)使用改进过的Transformer模型来生成的最终的输出;5)使用K折交叉验证的方法训练模型;6)使用最终模型输出最终结果。本专利技术进一步的改进在于,步骤1)的具体实现方法如下:101)使用MMC算法来生成输入向量和输出向量来构建悬臂梁结构数据集;102)按照8:1:1的比例将生成的悬臂梁结构数据集分为训练集、测试集和验证集。本专利技术进一步的改进在于,步骤2)的具体实现方法如下:对于步骤1)中获取数据集的悬臂梁结构数据,进行悬臂梁结构数据筛选,从悬臂梁结构数据集中挑选出生成效果不理想的数据进行删除。本专利技术进一步的改进在于,步骤3)的具体实现方法如下:使用多重感知机算法将原始数据进行尺寸变化,将输入的边界条件的一维向量转化为符合MMC算法数据格式的二维向量,并作为下一层模型的输入传入到下一层的模型。本专利技术进一步的改进在于,步骤4)的具体实现方法如下:401)将步骤3)生成的二维向量来作为Transformer模型的输入,使用positionEncoding方法进行向量组合;402)使用多层带自注意力机制的网络进行特征提取和组合生成一个能被MMC算法识别的二维向量。本专利技术进一步的改进在于,步骤5)的具体实现方法如下:501)将训练数据中的第1部分作为测试集,其余作为训练集;502)训练模型,计算模型在测试集上的loss;503)每次用不同的部分作为测试集,重复以上步骤多次直至神经网络收敛;504)将平均准确率作为模型的最终loss。本专利技术进一步的改进在于,步骤6)的具体实现方法如下:601)对改进的Transformer模型进行训练,提高模型的特征提取能力和生成模型的能力,当测试集的loss收敛的时候,模型的能力达到极限;602)使用模型进行验证,从验证集中随机选择一部分数据作为输入,输入进训练好的模型中得到输出;603)将输出结果输入到MMC绘图函数中进行处理,最终得到生成的悬臂梁结构图。本专利技术至少具有如下有益的技术效果:本专利技术提供的一种基于自注意力机制神经网络的悬臂梁结构设计方法,由于本专利技术使用了改进过的Transformer模型,所以可以在MMC算法生成的数据集的情况下训练模型,通过使用训练好的模型,输入边界条件向量得到可有MMC绘图函数识别的二维向量,通过绘图函数得到悬臂梁结构图,在保证生成结果正确的前提下,可大幅度降低计算复杂度,减少计算开销,提高预测准确性。本专利技术使用MMC方法生成数据集,因此可以在脱离MMC算法的情景下进行神经网络模型的训练,同时训练后的神经网络输出格式与MMC算法输出格式一致,降低了模型计算复杂度的同时,提高了模型的适用性。进一步,本专利技术使用了positionEncoding方法进行向量组合,通过给所计算的向量加入位置信息,从而使模型在预测过程中对不同位置的向量分配不同的权重,提高了模型的学习能力和预测的准确性。附图说明图1为本专利技术的流程示意图。图2为实施例中构建多重感知机的示意图。图3为实施例中构建改进的Transformer模型的示意图。具体实施方式下面结合附图和实施例对本专利技术做详细说明;如图1所示,本专利技术提供的一种基于自注意力机制神经网络的悬臂梁结构设计方法,包括以下步骤:步骤一:使用MMC算法准备悬臂梁结构数据;步骤二:对生成的悬臂梁结构数据进行数据清洗;步骤三:使用多重感知机模型构建类词向量模型;步骤四:使用改进的Transformer模型来生成的最终的输出;步骤五:使用模型进行训练;步骤六:使用最终模型;本专利技术具有准确生成优化结构、大幅度降低计算复杂度、减少计算开销的优点。自注意力机制的深度神经网络加速的结构优化设计方法的步骤如下:第一、使用MMC算法准备悬臂梁结构数据:在所有拓扑优化方法中选用传统的MMC算法来生成1000组数据,每组数据包含输入向量,输出向量和结果图并分别保存为txt格式、txt格式和jpg格式。数据集的生成方式如下:在2*1的设计域下,使用200*100的网格做有限元分析,取泊松比的取值范围为[0.1-0.8],负载点的位置为网格最右侧的[0-100],体积分数为0.4,杨氏模量为1。同时将数据集按照8:1:1的比例将这800组数据分为训练集(640组)和测试集(80组)和验证集(80组);第二、对生成的悬臂梁结构数据进行数据清洗:对于步骤一中获取数据集的数据,进行数据筛选,步骤一中有可能随机生成的结果与正常工程中使用的数据相差过大,导致MMC算法迭代的最终结果失去了物理意义。从数据集中挑选出生成效果不理想的数据进行删除。第三、使用多重感知机模型构建类词向量模型:如图2所示,先进行第二步操作以获取可作为输入的数据组,我们将数据以64组为一个batch进行输入。输入的数据尺寸为[batch,7],通过多重感知机将数据映射到更高维[batch,112]。在多重感知机的每层同时加入了残差模块,残差块分成两部分直接映射部分和残差部分。在模型中,使用两层全连接层网络作为残差映射,这样可以增大网络模型的自由度,使函数在高维空间更好的拟合,同时可以缓解由深度网络带来的梯度爆炸问题;在每层全连接的输出后使用批标准化技术,使得每层输出得数据分布重新集中于梯度最大的范围内,加快模型的收敛速度。在最后将数据维度[batch,112]本文档来自技高网...
【技术保护点】
1.一种基于自注意力机制神经网络的悬臂梁结构设计方法,其特征在于,包括以下步骤:/n1)使用MMC算法准备悬臂梁结构数据;/n2)对生成的悬臂梁结构数据进行数据清洗;/n3)使用多重感知机模型构建类词向量模型;/n4)使用改进过的Transformer模型来生成的最终的输出;/n5)使用K折交叉验证的方法训练模型;/n6)使用最终模型输出最终结果。/n
【技术特征摘要】
1.一种基于自注意力机制神经网络的悬臂梁结构设计方法,其特征在于,包括以下步骤:
1)使用MMC算法准备悬臂梁结构数据;
2)对生成的悬臂梁结构数据进行数据清洗;
3)使用多重感知机模型构建类词向量模型;
4)使用改进过的Transformer模型来生成的最终的输出;
5)使用K折交叉验证的方法训练模型;
6)使用最终模型输出最终结果。
2.根据权利要求1所述的一种基于自注意力机制神经网络的悬臂梁结构设计方法,其特征在于,步骤1)的具体实现方法如下:
101)使用MMC算法来生成输入向量和输出向量来构建悬臂梁结构数据集;
102)按照8:1:1的比例将生成的悬臂梁结构数据集分为训练集、测试集和验证集。
3.根据权利要求2所述的一种基于自注意力机制神经网络的悬臂梁结构设计方法,其特征在于,步骤2)的具体实现方法如下:
对于步骤1)中获取数据集的悬臂梁结构数据,进行悬臂梁结构数据筛选,从悬臂梁结构数据集中挑选出生成效果不理想的数据进行删除。
4.根据权利要求3所述的一种基于自注意力机制神经网络的悬臂梁结构设计方法,其特征在于,步骤3)的具体实现方法如下:
使用多重感知机算法将原始数据进行尺寸变化,将输入的边界条件的一维向量转化为符合MMC算法数据格式的二维向量,并作为下一层模型的输入传入到下一层的模型...
【专利技术属性】
技术研发人员:郑帅,栗阳阳,范浩杰,洪军,李宝童,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。