基于有监督机器学习的雷达质量问题分类预测方法及设备技术

技术编号:34130146 阅读:11 留言:0更新日期:2022-07-14 15:12
本发明专利技术属于天线与微波技术领域,公开了一种基于有监督机器学习的雷达质量问题分类预测方法及设备。本发明专利技术的方法包括:S110,将类别进行唯一编号,作为标签对已分类历史雷达质量问题打标签,分割成训练集和验证集,将待分类雷达质量问题作为测试集;S120,对雷达质量问题文本包含的特征子项进行中文分词并组合成关键词特征向量;S130,将关键词特征向量变换成数值特征向量;S140,同步开展若干个基于有监督机器学习的雷达质量问题分类模型训练;S150,选择性能最优的模型对测试集进行分类预测。采用本发明专利技术能够在短时间内完成大量雷达质量问题的自动分类,可应用于按故障模式、问题严重程度等类别进行雷达质量问题分类预测。严重程度等类别进行雷达质量问题分类预测。严重程度等类别进行雷达质量问题分类预测。

【技术实现步骤摘要】
基于有监督机器学习的雷达质量问题分类预测方法及设备


[0001]本专利技术属于天线与微波
,具体涉及一种基于有监督机器学习的雷达质量问题分类预测方法及设备。

技术介绍

[0002]在雷达质量问题处理过程中,雷达质量问题管理信息系统中存储了大量的历史雷达质量问题记录,这些记录通常以电子表格形式记载。合理利用历史雷达质量问题蕴藏的知识价值,开展雷达质量问题的分类管理,对新发生的质量问题进行分类预测,可以辅助质量管理人员决策,在科研生产活动中具有十分重要的现实意义。
[0003]针对雷达质量问题各种分类预测要求,通过关键字检索的方式开展分类预测是最容易想到的办法,但是这个方法存在虚报、漏报、人力资源开销大等缺点。
[0004]针对雷达质量问题分类预测的一种特定情形,即按照雷达故障模式开展质量问题分类,《信息技术与网络安全》期刊2021年第40卷第9期的论文《基于故障模式的装备质量问题文本分类方法》中,提出了通过计算雷达质量问题文本与雷达故障模式文本之间的“距离”开展分类,采用了独热键编码的方式构建了文本向量,计算质量问题文本与故障模式特征向量间的相似度,最后按照相似度的阈值判定质量问题归属故障模式的种类。该方法充分依赖于人工设计的雷达质量问题和雷达故障模式的特征,但未利用已分类雷达质量问题的信息来指导新雷达质量问题的分类预测,随着待分类雷达质量问题数量和雷达故障模式的数量增大,分类的准确度和召回率会大幅度下降;采用独热键编码的方式构建文本向量,在运用过程中引入维度灾难,在特定的情况下会导致内存溢出错误,直接导致分类预测任务执行的中断。而且,根据业务需求不同,存在多种分类需求,按照雷达故障模式开展质量问题分类只是分类预测的一种实例,该方法不能应用到其他分类需求中。

技术实现思路

[0005]本专利技术目的是:针对现有技术的不足,提供一种基于有监督机器学习的雷达质量问题分类预测方法及设备,能够解决在短时间内完成大量雷达质量问题的自动分类,大幅度地降低手工分类的工作量,分类的效果良好,可应用于按照故障模式、问题严重程度、责任类别、原因类别为依据的雷达质量问题分类预测。
[0006]具体地说,本专利技术是采用以下技术方案实现的。
[0007]一方面,本专利技术提供一种基于有监督机器学习的雷达质量问题分类预测方法,包括:
[0008]S110,根据雷达质量问题数据,形成按雷达质量问题类别进行分类的雷达质量问题文本数据库,将所述雷达质量问题类别进行唯一编号,并作为所述雷达质量问题数据的标签;对所述雷达质量问题文本数据库中已分类的历史雷达质量问题打标签,形成雷达质量问题分类标记库,将所述雷达质量问题分类标记库分割成训练集和验证集,将所述雷达质量问题文本数据库中未打标签的待分类的雷达质量问题作为测试集;
[0009]S120,对所述训练集、验证集和测试集中雷达质量问题文本进行预处理,即在预先建立的停用词典、雷达专业词典的基础上,对训练集、验证集和测试集中雷达质量问题文本包含的特征子项进行中文分词;将特征子项的中文分词结果组合成关键词特征向量;
[0010]S130,将关键词特征向量变换成含有段落标签的文本,作为语料;采用深度学习模型训练该语料,将其转换成固定长度的数值特征向量;
[0011]S140,构建基于有监督机器学习的雷达质量问题分类模型,利用所述训练集同步开展若干个分类模型训练,并保存相应的分类预测模型;
[0012]S150,在所述验证集上开展所述若干个分类预测模型的评估,选择性能最优的模型作为优选的分类预测模型,采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。
[0013]进一步的,所述基于有监督机器学习的雷达质量问题分类预测方法,按照勤劳模式进行雷达质量问题分类预测,所述按照勤劳模式进行雷达质量问题分类预测包括:将所述采用优选的分类预测模型对所述测试集进行雷达质量问题分类预测得到的已分类的雷达质量问题增补为所述已分类的历史雷达质量问题,加入所述训练集,重新利用该训练集同步开展若干个分类模型训练,并保存相应的分类预测模型;在该验证集上开展所述若干个分类预测模型的评估,选择性能最优的模型作为优选的分类预测模型,采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。
[0014]进一步的,当进行第m次雷达质量问题分类预测时,m的取值范围为[2,N],N为设定的数量范围,按照懒惰模式进行雷达质量问题分类预测;当m>N时,按照勤劳模式进行雷达质量问题分类预测;
[0015]所述按照懒惰模式进行雷达质量问题分类预测包括:
[0016]在预先建立的停用词典、雷达专业词典的基础上,对测试集中雷达质量问题文本包含的特征子项进行中文分词,将特征子项的中文分词结果组合成关键词特征向量;
[0017]将所述关键词特征向量变换成含有段落标签的文本,作为语料,采用深度学习模型训练该语料,将其转换成固定长度的数值特征向量;
[0018]采用第一次进行雷达质量问题分类预测得到的所述优选的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。
[0019]进一步的,所述基于有监督机器学习的雷达质量问题分类预测方法,还包括:
[0020]将所述测试集中两个以上待分类预测的雷达质量问题按照一个批次处理时,在所述验证集上开展所述若干个分类预测模型的评估,选择性能最优的模型作为优选的分类预测模型,利用该优选的分类预测模型对该批次处理的待分类预测的雷达质量问题开展分类预测。
[0021]进一步的,在将所述雷达质量问题分类标记库分割成训练集和验证集之前,将雷达质量问题分类标记库中雷达质量问题数据的顺序随机排列。
[0022]进一步的,所述深度学习模型为Doc2vec模型。
[0023]进一步的,所述基于有监督机器学习的雷达质量问题分类模型包括贝叶斯分类器模型、logistic回归分类器模型、支持向量机SVM分类器器模型、K

NN分类器模型、多层神经网络模型和随机森林模型。
[0024]进一步的,所述性能最优指准确度指标最优。
[0025]另一方面,本专利技术还提供一种基于有监督机器学习的雷达质量问题分类预测方法,按照懒惰模式执行分类预测任务,所述懒惰模式包括:
[0026]在预先建立的停用词典、雷达专业词典的基础上,对测试集中雷达质量问题文本包含的特征子项进行中文分词,将特征子项的中文分词结果组合成关键词特征向量;
[0027]将所述关键词特征向量变换成含有段落标签的文本,作为语料,采用深度学习模型训练该语料,将其转换成固定长度的数值特征向量;
[0028]采用预设的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。
[0029]再一方面,本专利技术还提供一种基于有监督机器学习的雷达质量问题分类预测设备,所述设备包括存储器和处理;所述存储器存储有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于有监督机器学习的雷达质量问题分类预测方法,其特征在于,包括:S110,根据雷达质量问题数据,形成按雷达质量问题类别进行分类的雷达质量问题文本数据库,将所述雷达质量问题类别进行唯一编号,并作为所述雷达质量问题数据的标签;对所述雷达质量问题文本数据库中已分类的历史雷达质量问题打标签,形成雷达质量问题分类标记库,将所述雷达质量问题分类标记库分割成训练集和验证集,将所述雷达质量问题文本数据库中未打标签的待分类的雷达质量问题作为测试集;S120,对所述训练集、验证集和测试集中雷达质量问题文本进行预处理,即在预先建立的停用词典、雷达专业词典的基础上,对训练集、验证集和测试集中雷达质量问题文本包含的特征子项进行中文分词;将特征子项的中文分词结果组合成关键词特征向量;S130,将关键词特征向量变换成含有段落标签的文本,作为语料;采用深度学习模型训练该语料,将其转换成固定长度的数值特征向量;S140,构建基于有监督机器学习的雷达质量问题分类模型,利用所述训练集同步开展若干个分类模型训练,并保存相应的分类预测模型;S150,在所述验证集上开展所述若干个分类预测模型的评估,选择性能最优的模型作为优选的分类预测模型,采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。2.根据权利要求1所述的基于有监督机器学习的雷达质量问题分类预测方法,其特征在于,按照勤劳模式进行雷达质量问题分类预测,所述按照勤劳模式进行雷达质量问题分类预测包括:将所述采用优选的分类预测模型对所述测试集进行雷达质量问题分类预测得到的已分类的雷达质量问题增补为所述已分类的历史雷达质量问题,加入所述训练集,重新利用该训练集同步开展若干个分类模型训练,并保存相应的分类预测模型;在该验证集上开展所述若干个分类预测模型的评估,选择性能最优的模型作为优选的分类预测模型,采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测,得到已分类的雷达质量问题。3.根据权利要求2所述的基于有监督机器学习的雷达质量问题分类预测方法,其特征在于,当进行第m次雷达质量问题分类预测时,m的取值范围为[2,N],N为设定的数量范围,按照懒惰模式进行雷达质量问题分类预测;当m>N时,按照勤劳模式进行雷达质量问题分类预测;所述按照懒惰模式进行雷达质量问题分类预测包括:在预先建立的停用词典、雷达专业词典的基础上,对测试集中雷达质量问题文本包含的特征子项进行中文分词,将特征子项...

【专利技术属性】
技术研发人员:费清春刘建鑫汤磊文歆磊秦剑叶波
申请(专利权)人:中国电子科技集团公司第十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1