【技术实现步骤摘要】
基于故障文本的分类方法、装置、设备及存储介质
[0001]本申请属于风力发电领域,尤其涉及一种基于故障文本的分类方法、装置、设备及存储介质。
技术介绍
[0002]随着风力发电技术的大力发展,风力发电机的数量不断增长,对应地,风力发电机组的故障数据也在不断累积。风力发电机组的故障数据可为风力发电机组的故障诊断、故障分析等提供有力的支持。
[0003]故障数据可以故障文本的方式呈现,为了便于进行故障诊断、故障分析等过程,需要预先将故障文本中的内容进行分类。现阶段可通过专门负责信息分类的工作人员对故障文本中的内容手动进行分类,但故障文本中的内容较为复杂,工作人员分类后的内容可能会存在不同类别的内容的混杂,导致对故障文本中内容的分类的精确度较低。
技术实现思路
[0004]本申请实施例提供一种基于故障文本的分类方法、装置、设备及存储介质,能够提高对故障文本中内容的分类的精确度。
[0005]第一方面,本申请实施例提供一种基于故障文本的分类方法,包括:将从风电场获取的故障文本作为故障文本训练集,故障文 ...
【技术保护点】
【技术特征摘要】
1.一种基于故障文本的分类方法,其特征在于,包括:将从风电场获取的故障文本作为故障文本训练集,所述故障文本训练集存储于风电语料数据库;从所述故障文本训练集的故障文本中提取与风力发电机组关联的第一故障特征词;按照预设的多个候选分类数目,分别对所述第一故障特征词分类,得到各所述候选分类数目对应的分类结果;根据所述分类结果,将不同类别所述第一故障特征词的差异度最大的所述候选分类数目确定为目标分类数目;基于所述目标分类数目,对待分类的故障文本中与风力发电机组关联的第二故障特征词分类,得到分类后的所述第二故障特征词。2.根据权利要求1所述的方法,其特征在于,在所述得到分类后的所述第二故障特征词之后,还包括:控制分类后的所述第二故障特征词被显示到显示装置,以用于对风力发电机组进行故障分析。3.根据权利要求1所述的方法,其特征在于,所述分类结果包括所述第一故障特征词划分至每一类别的概率;所述根据所述分类结果,将不同类别所述第一故障特征词的差异度最大的所述候选分类数目确定为目标分类数目,包括:在任意一个所述候选分类数目的条件下,计算概率差绝对值,所述概率差绝对值包括所述第一故障特征词划分至不同类别的概率的差值的绝对值;将一个所述候选分类数目的条件下所述概率差绝对值确定为不同类别所述第一故障特征词的差异度;将最大的所述概率差绝对值对应的所述候选分类数目确定为目标分类数目。4.根据权利要求1所述的方法,其特征在于,所述分类结果包括所述第一故障特征词划分至每一类别的概率;所述按照预设的多个候选分类数目,分别对所述第一故障特征词分类,得到各所述候选分类数目对应的分类结果,包括:针对多个所述候选分类数目中的每一个所述候选分类数目,利用线性判别分析算法,将所述第一故障特征词划分为数目为所述候选分类数目的类别,并得到所述第一故障特征词划分至每一类别的概率。5.根据权利要求1所述的方法,其特征在于,所述基于所述目标分类数目,对待分类的故障文本中与风力发电机组关联的第二故障特征词分类,包括:将所述目标分类数目设置为分类器的分类数目,利用标注有类别的故障训练数据对分类器进行训练,得到目标分类器;利用所述目标分类器对待分类的故障文本中与风力发电机组关联的所述第二故障特征词分类。6.根据权利要求1所述的方法,其特征在于,所述候选分类数目包括以下至少两者:2、3、4、5。7.根...
【专利技术属性】
技术研发人员:历莹,宋建军,
申请(专利权)人:北京金风科创风电设备有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。