一种基于深度学习的工艺公差分类方法及系统技术方案

技术编号:39297532 阅读:10 留言:0更新日期:2023-11-07 11:05
本发明专利技术公开了一种基于深度学习的工艺公差分类方法及系统,其基于深度学习训练得到的分类模型文件来对工艺公差文本数据进行处理,自动确定工艺工差文本数据所属质检工序的类别,能提高分类准确率和分类效率,减少人力、物力资源的消耗。同时利用本发明专利技术可形成自动化工艺公差分类处理流程,提高工作效率,为机械加工行业提供便捷的操作流程。工行业提供便捷的操作流程。工行业提供便捷的操作流程。

【技术实现步骤摘要】
一种基于深度学习的工艺公差分类方法及系统


[0001]本专利技术属于工艺公差分类领域,具体涉及一种基于深度学习的工艺公差分类方法及系统。

技术介绍

[0002]随着机械行业工厂内质量管理系统的普及,工厂内质量管理系统中积累了大量包含产品机加工工艺公差检测要求的文本数据,且长短不一,描述方式因人而异。比如:(1)“圆弧R6

10”表示利用半径规测量圆弧是否达到标准,质检工序应为“圆弧测量”、类别为“圆弧”;而“外圆Ra1.6”表示需检测外圆的粗糙度是否达到标准,质检工序应为“粗糙度检测”、类别为“粗糙度”。(2)“M5

6H钻深7”表示要利用游标卡尺进行孔深度测量,质检工序应为“深度测量”、类别为“深度”;而“M5

6H攻深5”表示要利用螺纹塞规进行内螺纹深度测量,质检工序应为“螺纹深度测量”、类别为“螺纹深度”。
[0003]计量人员必须根据检测要求进行质检工序分类和任务调度。目前,采用的方式是人工识别和分类,但是其需要计量人员经验丰富,并且也费时费力,工作效率低,极易出错。因此,如何准确、高效的对工艺工差文本数据进行分类(即如何确定工艺工差文本数据所属质检工序的类别),是目前急需要解决的问题。

技术实现思路

[0004]本专利技术的目的是提供一种基于深度学习的工艺公差分类方法及系统,以准确、高效的对工艺工差文本数据进行分类。
[0005]本专利技术所述的基于深度学习的工艺公差分类方法,包括:
[0006]步骤一、对输入的待分类的n条工艺公差文本数据进行分词,得到与n条工艺公差文本数据一一对应的n个词集合。
[0007]步骤二、调用已保存的索引字典,对n个词集合进行向量转换,得到n个词集合的数值型字符向量。
[0008]步骤三、对n个词集合的数值型字符向量进行等长度填充,得到长度相等的n个词集合向量序列。
[0009]步骤四、调用已保存的分类模型文件,对所述n个词集合向量序列进行分类计算,得到与n条工艺公差文本数据一一对应的n个分类结果矩阵;其中,每个分类结果矩阵都由各个标签的可能性浮点数值构成,分类模型文件通过深度学习获得。
[0010]步骤五、将标签A
i
对应的类别作为第i条工艺公差文本数据的分类结果;其中,i依次取1至n的所有整数,A
i
为与第i条工艺公差文本数据对应的分类结果矩阵中可能性浮点数值最大的标签。
[0011]优选的,所述步骤一中,对输入的待分类的n条工艺公差文本数据进行分词的方法为:
[0012]基于已保存的用户词典和停用词表,利用中文分词库对输入的待分类的n条工艺
公差文本数据进行分词,得到与n条工艺公差文本数据一一对应的n个词集合;其中,用户词典由工艺公差领域的专用词汇构成,停用词表为工艺公差文本语料中出现的停用词集合。
[0013]优选的,所述步骤四中,分类模型文件的获得方法包括:
[0014]步骤S1、对质量管理系统数据库中已有的工艺公差文本数据进行处理,得到样本数据集数组;其中,样本数据集数组包括工艺公差文本数据和与工艺公差文本数据所属(质检工序的)类别对应的标签。
[0015]步骤S2、对样本数据集数组中的工艺公差文本数据进行分词,得到样本数据集数组的词集合。
[0016]步骤S3、利用样本数据集数组的词集合以及样本数据集数组中的与工艺公差文本数据所属类别对应的标签,制作深度学习所需的训练集、验证集和测试集。
[0017]步骤S4、搭建深度学习训练模型。
[0018]步骤S5、将训练集、验证集、测试集代入深度学习训练模型,经训练、测试,得到分类模型文件。
[0019]优选的,所述步骤S1中,对质量管理系统数据库中已有的工艺公差文本数据进行处理,得到样本数据集数组的方法包括:
[0020]步骤S101、利用数字序号作为(质检工序的)类别对应的标签,形成标签

类别关系表。
[0021]步骤S102、对质量管理系统数据库中已有的工艺公差文本数据以及该工艺公差文本数据所属类别进行梳理,将属于同一类别的工艺公差文本数据进行归类,并基于所述标签

类别关系表,将工艺公差文本数据与(工艺公差文本数据所属类别)对应的标签进行绑定,生成带标签的工艺公差文本数据集数组。
[0022]步骤S103、将带标签的工艺公差文本数据集数组中的工艺公差文本数据打乱顺序,得到所述样本数据集数组。
[0023]优选的,所述步骤S2中,对样本数据集数组中的工艺公差文本数据进行分词,得到样本数据集数组的词集合的方法包括:
[0024]步骤S201、加载用户词典;其中,用户词典由工艺公差领域的专用词汇构成。
[0025]步骤S202、加载停用词表;其中,停用词表为工艺公差文本语料中出现的停用词集合。
[0026]步骤S203、基于用户词典和停用词表,利用中文分词库对样本数据集数组中的工艺公差文本数据进行分词,得到所述样本数据集数组的词集合。
[0027]优选的,所述步骤S3中,制作深度学习所需的训练集、验证集和测试集的方法包括:
[0028]步骤S301、加载索引字典。
[0029]步骤S302、依据索引字典将所述样本数据集数组的词集合进行向量转换,得到样本数据集数组的词集合的数值型字符向量,并保存索引字典。
[0030]步骤S303、对样本数据集数组的词集合的数值型字符向量进行等长度填充,得到长度相等的样本数据集数组的词集合向量序列;同时将样本数据集数组中的与工艺公差文本数据所属类别对应的标签转换为二进制矩阵。
[0031]步骤S304、将样本数据集数组的词集合向量序列以及相应的二进制矩阵组合形成
数据包。
[0032]步骤S305、将数据包按照预设比例划分为深度学习所需的训练集、验证集和测试集。
[0033]优选的,所述预设比例为6:2:2;即60%的数据包作为训练集,20%的数据包作为验证集,20%的数据包作为测试集。
[0034]优选的,所述步骤S4中,搭建深度学习训练模型的方法包括:
[0035]步骤S401、选择卷积神经网络模型作为训练模型。
[0036]步骤S402、添加嵌入层。
[0037]步骤S403、添加卷积层和池化层。
[0038]步骤S404、添加全连接层,完成深度学习训练模型搭建。
[0039]优选的,所述步骤S5中,将训练集、验证集、测试集代入深度学习训练模型,经训练、测试,得到分类模型文件的方法包括:
[0040]步骤S501、设置训练时使用的优化器、损失函数和准确率。
[0041]步骤S502、设置批的大小和迭代次数。
[0042]步骤S503、将训练集、验证集、测试集输入深度学习训练模型,利用训练集进行深度学习训练,利用验证集进行模型参数调整,利用测试集进行模型的泛化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的工艺公差分类方法,其特征在于,包括:步骤一、对输入的待分类的n条工艺公差文本数据进行分词,得到与n条工艺公差文本数据一一对应的n个词集合;步骤二、调用已保存的索引字典,对n个词集合进行向量转换,得到n个词集合的数值型字符向量;步骤三、对n个词集合的数值型字符向量进行等长度填充,得到长度相等的n个词集合向量序列;步骤四、调用已保存的分类模型文件,对所述n个词集合向量序列进行分类计算,得到与n条工艺公差文本数据一一对应的n个分类结果矩阵;其中,每个分类结果矩阵都由各个标签的可能性浮点数值构成,分类模型文件通过深度学习获得;步骤五、将标签A
i
对应的类别作为第i条工艺公差文本数据的分类结果;其中,i依次取1至n的所有整数,A
i
为与第i条工艺公差文本数据对应的分类结果矩阵中可能性浮点数值最大的标签。2.根据权利要求1所述的基于深度学习的工艺公差分类方法,其特征在于:所述步骤一中,对输入的待分类的n条工艺公差文本数据进行分词的方法为:基于已保存的用户词典和停用词表,利用中文分词库对输入的待分类的n条工艺公差文本数据进行分词,得到与n条工艺公差文本数据一一对应的n个词集合;其中,用户词典由工艺公差领域的专用词汇构成,停用词表为工艺公差文本语料中出现的停用词集合。3.根据权利要求1所述的基于深度学习的工艺公差分类方法,其特征在于:所述步骤四中,分类模型文件的获得方法包括:步骤S1、对质量管理系统数据库中已有的工艺公差文本数据进行处理,得到样本数据集数组;其中,样本数据集数组包括工艺公差文本数据和与工艺公差文本数据所属类别对应的标签;步骤S2、对样本数据集数组中的工艺公差文本数据进行分词,得到样本数据集数组的词集合;步骤S3、利用样本数据集数组的词集合以及样本数据集数组中的与工艺公差文本数据所属类别对应的标签,制作深度学习所需的训练集、验证集和测试集;步骤S4、搭建深度学习训练模型;步骤S5、将训练集、验证集、测试集代入深度学习训练模型,经训练、测试,得到分类模型文件。4.根据权利要求3所述的基于深度学习的工艺公差分类方法,其特征在于:所述步骤S1中,对质量管理系统数据库中已有的工艺公差文本数据进行处理,得到样本数据集数组的方法包括:步骤S101、利用数字序号作为类别对应的标签,形成标签

类别关系表;步骤S102、对质量管理系统数据库中已有的工艺公差文本数据以及该工艺公差文本数据所属类别进行梳理,将属于同一类别的工艺公差文本数据进行归类,并基于所述标签

类别关系表,将工艺公差文本数据与对应的标签进行绑定,生成带标签的工艺公差文本数据集数组;步骤S103、将带标签的工艺公差...

【专利技术属性】
技术研发人员:赵瑞腾李永聪张宇钟秋吕智愚黄都徐辉
申请(专利权)人:重庆红江机械有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1