基于有监督机器学习的雷达质量问题分类预测方法及设备技术

技术编号：34130146 阅读：11 留言：0更新日期：2022-07-14 15:12

本发明专利技术属于天线与微波技术领域，公开了一种基于有监督机器学习的雷达质量问题分类预测方法及设备。本发明专利技术的方法包括：S110，将类别进行唯一编号，作为标签对已分类历史雷达质量问题打标签，分割成训练集和验证集，将待分类雷达质量问题作为测试集；S120，对雷达质量问题文本包含的特征子项进行中文分词并组合成关键词特征向量；S130，将关键词特征向量变换成数值特征向量；S140，同步开展若干个基于有监督机器学习的雷达质量问题分类模型训练；S150，选择性能最优的模型对测试集进行分类预测。采用本发明专利技术能够在短时间内完成大量雷达质量问题的自动分类，可应用于按故障模式、问题严重程度等类别进行雷达质量问题分类预测。严重程度等类别进行雷达质量问题分类预测。严重程度等类别进行雷达质量问题分类预测。

全部详细技术资料下载

【技术实现步骤摘要】
基于有监督机器学习的雷达质量问题分类预测方法及设备

[0001]本专利技术属于天线与微波
，具体涉及一种基于有监督机器学习的雷达质量问题分类预测方法及设备。

技术介绍

[0002]在雷达质量问题处理过程中，雷达质量问题管理信息系统中存储了大量的历史雷达质量问题记录，这些记录通常以电子表格形式记载。合理利用历史雷达质量问题蕴藏的知识价值，开展雷达质量问题的分类管理，对新发生的质量问题进行分类预测，可以辅助质量管理人员决策，在科研生产活动中具有十分重要的现实意义。
[0003]针对雷达质量问题各种分类预测要求，通过关键字检索的方式开展分类预测是最容易想到的办法，但是这个方法存在虚报、漏报、人力资源开销大等缺点。
[0004]针对雷达质量问题分类预测的一种特定情形，即按照雷达故障模式开展质量问题分类，《信息技术与网络安全》期刊2021年第40卷第9期的论文《基于故障模式的装备质量问题文本分类方法》中，提出了通过计算雷达质量问题文本与雷达故障模式文本之间的“距离”开展分类，采用了独热键编码的方式构建了文本向量，计算质量问题文本与故障模式特征向量间的相似度，最后按照相似度的阈值判定质量问题归属故障模式的种类。该方法充分依赖于人工设计的雷达质量问题和雷达故障模式的特征，但未利用已分类雷达质量问题的信息来指导新雷达质量问题的分类预测，随着待分类雷达质量问题数量和雷达故障模式的数量增大，分类的准确度和召回率会大幅度下降；采用独热键编码的方式构建文本向量，在运用过程中引入维度灾难，在特定的情况下会导致内存溢出错误...

【技术保护点】

【技术特征摘要】
1.一种基于有监督机器学习的雷达质量问题分类预测方法，其特征在于，包括：S110，根据雷达质量问题数据，形成按雷达质量问题类别进行分类的雷达质量问题文本数据库，将所述雷达质量问题类别进行唯一编号，并作为所述雷达质量问题数据的标签；对所述雷达质量问题文本数据库中已分类的历史雷达质量问题打标签，形成雷达质量问题分类标记库，将所述雷达质量问题分类标记库分割成训练集和验证集，将所述雷达质量问题文本数据库中未打标签的待分类的雷达质量问题作为测试集；S120，对所述训练集、验证集和测试集中雷达质量问题文本进行预处理，即在预先建立的停用词典、雷达专业词典的基础上，对训练集、验证集和测试集中雷达质量问题文本包含的特征子项进行中文分词；将特征子项的中文分词结果组合成关键词特征向量；S130，将关键词特征向量变换成含有段落标签的文本，作为语料；采用深度学习模型训练该语料，将其转换成固定长度的数值特征向量；S140，构建基于有监督机器学习的雷达质量问题分类模型，利用所述训练集同步开展若干个分类模型训练，并保存相应的分类预测模型；S150，在所述验证集上开展所述若干个分类预测模型的评估，选择性能最优的模型作为优选的分类预测模型，采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测，得到已分类的雷达质量问题。2.根据权利要求1所述的基于有监督机器学习的雷达质量问题分类预测方法，其特征在于，按照勤劳模式进行雷达质量问题分类预测，所述按照勤劳模式进行雷达质量问题分类预测包括：将所述采用优选的分类预测模型对所述测试集进行雷达质量问题分类预测得到的已分类的雷达质量问题增补为所述已分类的历史雷达质量问题，加入所述训练集，重新利用该训练集同步开展若干个分类模型训练，并保存相应的分类预测模型；在该验证集上开展所述若干个分类预测模型的评估，选择性能最优的模型作为优选的分类预测模型，采用该优选的分类预测模型对所述测试集进行雷达质量问题分类预测，得到已分类的雷达质量问题。3.根据权利要求2所述的基于有监督机器学习的雷达质量问题分类预测方法，其特征在于，当进行第m次雷达质量问题分类预测时，m的取值范围为[2，N]，N为设定的数量范围，按照懒惰模式进行雷达质量问题分类预测；当m>N时，按照勤劳模式进行雷达质量问题分类预测；所述按照懒惰模式进行雷达质量问题分类预测包括：在预先建立的停用词典、雷达专业词典的基础上，对测试集中雷达质量问题文本包含的特征子项进行中文分词，将特征子项...

【专利技术属性】
技术研发人员：费清春，刘建鑫，汤磊，文歆磊，秦剑，叶波，
申请(专利权)人：中国电子科技集团公司第十四研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人