【技术实现步骤摘要】
一种汽车维修记录库异常数据的检测方法
[0001]本专利技术涉及数据检测
,具体涉及一种汽车维修记录库异常数据的检测方法。
技术介绍
[0002]汽车维修记录库数据包含送修里程、行驶时间、故障描述、维修项目及维修配件5个数据字段, 汽车维修记录库是汽车维修电子健康档案系统运行的数据基础。汽车维修电子健康档案系统在行业管理部 门、维修企业和车主之间建立联系,在后市场渠道和维修大数据两个层面具有重要价值。通过系统的数据 资源与优势建设数据分析和大数据服务系统,为车主、维修企业、行业管理部门和汽车后市场相关行业提 供服务。因此,做好汽车维修记录库异常数据的检测工作,提高异常数据识别的精度和库内数据的质量显 得尤为重要。
[0003]目前相关的检测方法适用于对数据的完整性和数据类型的匹配性进行异常检测。现有方法数据匹 配性弱,检测精度低,且故障描述、维修项目、维修配件三个数据字段之间未建立对应关系。原因为现有 方法以穷举匹配的传统思想构建异常数据检测算法,而其无法穷举整个汽车1万多个零部件中每个字段的 所有描述结果;同 ...
【技术保护点】
【技术特征摘要】
1.一种汽车维修记录库异常数据的检测方法,其特征在于,包括如下步骤:步骤S1:采集汽车维修记录数据样本,完成数据分类及标注;步骤S2:构建包括故障描述、维修项目和维修配件3个字段的汽车维修词库,向量化表示所完成标注的数据,确定训练集及测试集;步骤S3:确定抑制深度自动编码器模型,限制变量规模,增加正常数据与异常数据的区分度;步骤S4:将汽车维修记录库数据输入抑制深度自动编码器模型;步骤S5:模型判断数据类型,输出数据标签。2.根据权利要求1所述的一种汽车维修记录库异常数据的检测方法,其特征在于,所述步骤S1具体包括:步骤S11:采集汽车维修记录数据样本,对数据分类,分类类型为“正常”或“异常”;步骤S12:将“正常”数据标注为“0”,将“异常”数据标注为“1”。3.根据权利要求1所述的一种汽车维修记录库异常数据的检测方法,其特征在于,所述步骤S2具体包括:步骤S21:在完成标注的数据中,提取故障描述、维修项目和维修配件3个字段内属于汽车维修行业领域内的词语,将提取的词语保存为专有名词;提取故障描述、维修项目和维修配件3个字段内不属于汽车维修行业领域内的词语,将提取的词语保存为停用词;步骤S22:将专有名词及停用词导入中文分词词库,对中文文本分词;步骤S23:将分词后的词汇输入语言向量化算法模型,调整参数训练模型;步骤S24:完成模型训练,得到向量化表示的每个故障描述字段、每个维修项目字段和每个维修配件字段;步骤S25:将向量化后的数据分为训练集及测试集,且训练集数据大于测试集数据个数。4.根据权利要求1所述的一种汽车维修记录库异常数据的检测方法,其特征在于,所述步骤S3具体包括:步骤S31:建立抑制深度自动编码器模型;步骤S32:训练抑制深度自动编码器模型。5.根据权利要求4所述的一种汽车维修记录库异常数据的检测方法,其特征在于,所述步骤S31具体包括...
【专利技术属性】
技术研发人员:周刚,陈方华,耿心,蔡凤田,
申请(专利权)人:交通运输部公路科学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。