基于词向量的汽车故障智能辅助诊断方法和系统技术方案

技术编号:20159736 阅读:23 留言:0更新日期:2019-01-19 00:12
基于词向量实现汽车故障智能辅助诊断的方法和系统,包括:建立故障‑故障相关因子字典;获取故障描述;利用词向量模型建立替换词表,对故障描述进行关键词匹配;结合故障‑故障相关因子字典得到故障相关因子对应于故障的相关性打分,计算故障的分数;对故障的分数进行排序,确定故障。本发明专利技术使用词向量嵌入技术,使得对自然语言的处理能力大大加强,实现了对过往汽车维修沟通记录的有效利用,使得碎片化的自然语言数据变成了可以利用的数值型数据。

【技术实现步骤摘要】
基于词向量的汽车故障智能辅助诊断方法和系统
本专利技术涉及数据处理技术和计算机软件领域,具体地说是一种基于词向量实现汽车故障智能辅助诊断的方法和系统。
技术介绍
随着我国经济实力的不断提升,人民生活水平也不断增加,与之相伴的私家车的保有量辆也屡创新高。通过4S店购买和维修车辆已经是非常普遍的现象。目前客户在4S店购买的汽车出现故障去4S店维修时,4S店维修技工判定故障原因时一般只有两种途径。第一,维修技工凭借个人经验判定故障原因;第二,当维修技工不能凭借个人经验判定故障原因时需要和主机厂技术支持沟通,按照主机厂给的建议排查原因。虽然上述流程是现在大多数4S店处理车辆故障的方式,但仍然有一些不足:第一,维修技工凭借个人经验判定故障原因需要较好的经验积累,但当维修技工是新人时,凭借个人经验判定故障的能力不足,无法迅速准确的判定故障点;第二由于主机厂的技术支持负责的区域较广,当4S店提出技术支持申请后,主机厂技术支持反馈时间较长,沟通过于耗时。这些情况会严重影响4S店的客户体验。4S店和主机厂技术支持的沟通记录,主要是汽车故障现象的描述,以及主机厂技术支持诊断结果问答对。这些问答对形成了宝贵的汽车故障诊断数据,但由于这些记录往往是非结构化数据,而且存在大量口语化描述所导致的非规范术语,直接利用这些数据会存在诸多挑战。与此同时求助主机厂技术支持中有大量的重复性工作,这对于宝贵的技术支持资源也是一种浪费。CN201010183798.X号中国专利申请公开了一种基于数据流的车辆故障诊断方法,首先利用数据流算法,对实时汽车故障数据进行挖掘,获得汽车故障数据流中的有用信息,并将挖掘结果保存在临时汽车故障案例库中,作为汽车故障知识库的来源;然后利用所述临时汽车故障案例库对汽车故障知识库进行更新,通过相似度匹配计算,实现汽车故障知识库的及时更新;再针对新问题的特征,通过检索汽车故障知识库或者临时汽车故障案例库中的知识或者案例,获得与新汽车故障问题具有最相似特征的信息,用来解决诊断问题。CN201410806492.3号中国专利提供了一种车辆故障分析方法及系统,接收故障发生时车辆输出的所述故障码后,从车辆故障知识库中查询出与所述故障码相匹配的故障分析数据模型,其中所述车辆故障知识库包括多个用于车辆故障分析的故障分析数据模型,通过与所述故障码相匹配的故障分析数据模型得出针对该故障的诊断结果。在车辆发生故障时,只需将故障发生时车辆输出的故障码输入与其相匹配的故障分析数据模型就会得到针对该故障的诊断结果,无需人为判断,降低了车辆故障诊断中的用人风险,实现了对车辆故障的规范化和智能化的诊断。
技术实现思路
本专利技术为解决现有的问题,旨在提供一种基于词向量实现汽车故障智能辅助诊断的方法和系统,以实现帮助维修技工更加准确的判定故障原因的同时缩短故障判定时间。为了达到上述目的,本专利技术采用的技术方案包括下列步骤:步骤一,利用4S店和主机厂技术支持的沟通记录,建立故障-故障相关因子字典;步骤二,获取汽车故障描述;步骤三,利用词向量模型建立替换词表,对故障描述进行关键词匹配,提取故障描述中跟汽车相关的词语和表达;步骤四,基于检测结果,结合故障-故障相关因子字典得到故障相关因子对应于故障的相关性打分,计算故障的分数;步骤五,对故障的分数进行排序,根据排序结果确定故障。进一步地,步骤一中,所述故障-故障相关因子字典通过以下步骤建立:对沟通记录根据故障类型进行分类打标签;利用互信息原理对每条沟通记录进行关键词提取;利用FP-Growth算法计算得到每个故障类别的频繁项集,构建故障-故障相关因子字典。进一步地,步骤三中,所述替换词表通过以下步骤建立:获取汽车维修信息训练语料;对训练语料进行清洗,去掉无意义字符;进行中文分词,得到训练文本;对训练文本进行训练,生成词向量嵌入分布式表示模型;基于词向量嵌入分布式模型,使用距离度量方法建立替换词表;检测提取出来的词语和表达是否在故障-故障相关因子字典中。进一步地,步骤四中,基于标准表达,统计故障及相关因子共现的频数,得到故障相关因子和故障的共现频数记录矩阵;基于故障相关因子和故障的共现频数记录矩阵,使用非线性变换方法,得到故障相关因子对应于故障的相关性打分;基于故障相关因子对应于故障的相关性的打分,计算故障的分数。本专利技术还提供一种基于词向量实现汽车故障智能辅助诊断的系统,包含:语料获取和存储模块:获取故障描述以及问答记录,并进行存储;故障-故障相关因子字典模块:用于建立故障-故障相关因子字典;训练模块:训练词向量嵌入分布式表示模型;分词匹配模块:用于分词和关键词匹配;计算排序模块:计算可能故障的分数,根据分数排序输出可能性最高的故障;上述各模块通过总线相互连接,且通过数据交换端口连接若干终端。和现有技术相比,本专利技术使用词向量嵌入技术,使得对自然语言的处理能力大大加强,实现了对过往汽车维修沟通记录的有效利用,使得碎片化的自然语言数据变成了可以利用的数值型数据。通过本专利技术实施例提出的系统,维修人员可以更加快速准确的定位问题原因,节省了维修时间;同时避免了主机厂技术支持人员回答重复的问题,大大减轻了技术支持的压力。附图说明图1为本专利技术实施例中各个模块的结构示意图;图2为本专利技术实施例中故障-故障相关因子字典产生原理图;图3为本专利技术实施例中替换词表产生原理图;图4为共现频数记录矩阵。具体实施方式现结合附图对本专利技术作进一步地说明。本专利技术实施例的基本思想是词向量嵌入技术,生成对通用维修信息和维修记录、维修沟通记录中故障-故障相关因子的词向量表示,进而实现对故障描述的辅助诊断。需要说明的术语或定义如下:故障相关因子:可能导致、帮助判断或含有某种故障信息的各种因子,如故障部位,故障现象等。词向量嵌入:利用“DistributedRepresentation”的方法,将一个词语或短语用低维度(小于1000维)的连续实数向量表示,从而可以用这些向量来区分或者表示这些词语,处理文本分类、关系提取等自然语言处理的任务。共现频数:在一个语段或者文档中,某几个词语或者概念同时出现被称为一次共现,统计在有代表性的全部文档中的这些词语的出现数目,即共现频数。参见图1-4,本专利技术实施例提供一种基于词向量实现汽车故障辅助诊断方法,该方法包括以下步骤:1.利用4S店和主机厂技术支持的沟通记录,建立故障-故障相关因子字典。参见图2,其中故障-故障相关因子字典通过以下步骤建立:1.1对沟通记录根据故障类型进行分类打标签。1.2利用互信息原理对每条沟通记录进行关键词提取。互信息是用于表示两个特征共同出现的程度。当词汇w和类Ci总是共同出现,那么它们的互信息度高,词汇w就是Ci类文档的一个特征词。其中,P(w)是在整个训练集中,出现词汇w的文档的概率(用频率代替);P(Ci)是在训练集中,属于类Ci的文档的概率;P(w,Ci)表示在训练集中既出现词汇w又属于类Ci的概率。然而互信息的一个缺点是没有考虑词汇w在某类文档中的词汇频率,因而稀有词汇常常可以有很大的权重。为此我们加入一个控制因子TF(w,Ci),它表示词汇w在Ci类文章中的词汇频率。其中,count(w)是词汇w在所有文章中出现的词汇数,count(w|Ci)是w在Ci类文章中出现的概率。1本文档来自技高网
...

【技术保护点】
1.一种基于词向量实现汽车故障辅助诊断的方法,其特征在于包括下列步骤:步骤一,利用4S店和主机厂技术支持的沟通记录,建立故障‑故障相关因子字典;步骤二,获取汽车故障描述;步骤三,利用词向量模型建立替换词表,对故障描述进行关键词匹配,提取故障描述中跟汽车相关的词语和表达;步骤四,基于检测结果,结合故障‑故障相关因子字典得到故障相关因子对应于故障的相关性打分,计算故障的分数;步骤五,对故障的分数进行排序,根据排序结果确定故障。

【技术特征摘要】
1.一种基于词向量实现汽车故障辅助诊断的方法,其特征在于包括下列步骤:步骤一,利用4S店和主机厂技术支持的沟通记录,建立故障-故障相关因子字典;步骤二,获取汽车故障描述;步骤三,利用词向量模型建立替换词表,对故障描述进行关键词匹配,提取故障描述中跟汽车相关的词语和表达;步骤四,基于检测结果,结合故障-故障相关因子字典得到故障相关因子对应于故障的相关性打分,计算故障的分数;步骤五,对故障的分数进行排序,根据排序结果确定故障。2.根据权利要求1所述的一种基于词向量实现汽车故障辅助诊断的方法,其特征在于:步骤一中,所述故障-故障相关因子字典通过以下步骤建立:对沟通记录根据故障类型进行分类打标签;利用互信息原理对每条沟通记录进行关键词提取;利用FP-Growth算法计算得到每个故障类别的频繁项集,构建故障-故障相关因子字典。3.根据权利要求1所述的一种基于词向量实现汽车故障辅助诊断的方法,其特征在于:步骤三中,所述替换词表通过以下步骤建立:获取汽车维修信息训练语料;对训练语料进行清洗,去掉无意义字符;进行...

【专利技术属性】
技术研发人员:陈汝烨
申请(专利权)人:上海万行信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1