The embodiment of the invention discloses a fault data processing method and device, and a computer readable storage medium. The method includes: obtaining the original fault data of the wind turbine, processing the original fault data by word segmentation, and getting the key words set corresponding to each original fault data; clustering the key word set corresponding to all the original fault data, obtaining multiple fault categories and corresponding to each fault category. A collection of characteristic words. By adopting the technical proposal in the embodiment of the invention, the automatic failure analysis of the historical fault handling information of the wind turbine can be realized.
【技术实现步骤摘要】
故障数据的处理方法和装置、计算机可读存储介质
本专利技术涉及风力发电
,尤其涉及一种风力发电机组故障数据的处理方法和装置、计算机可读存储介质。
技术介绍
风能资源通常集中在环境较恶劣的寒冷地区或者高原地区,恶劣的环境使得风力发电机组在运行过程中不可避免地发生各种类型的故障。每次故障处理完成后,现场人员会记录相关的故障处理信息。为提高风力发电机组的故障排除效率及展开对风力发电机组的故障优化设计,研发人员需要对风力发电机组的历史故障处理信息做可靠性故障分析。现有技术中主要通过手工完成对风力发电机组的历史故障处理信息的可靠性故障分析。但是,由于风力发电机组的历史故障处理信息涉及的数据量相当大,通过手工完成对风力发电机组的历史故障处理信息的可靠性故障分析的方式会耗费研发人员大量的时间和精力。
技术实现思路
本专利技术实施例提供了一种风力发电机组故障的数据处理方法和装置、计算机可读存储介质,能够实现对风力发电机组的历史故障处理信息的可靠性故障的自动分析。第一方面,本专利技术实施例提供了一种风力发电机组故障数据的处理方法,该方法包括:获取风力发电机组的原始故障数据;对原始故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合;对与所有原始故障数据对应的关键词集合进行聚类,得到多个故障类别和与每个故障类别对应的特征词集合。在第一方面的一些实施例中,对原始故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合,包括:清洗每条原始故障数据;对清洗后的故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合。在第一方面的一些实施例中,清洗每条原始故障数据,包 ...
【技术保护点】
1.一种风力发电机组故障数据的处理方法,其特征在于,包括:获取风力发电机组的原始故障数据;对所述原始故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合;对与所有原始故障数据对应的关键词集合进行聚类,得到多个故障类别和与每个故障类别对应的特征词集合。
【技术特征摘要】
1.一种风力发电机组故障数据的处理方法,其特征在于,包括:获取风力发电机组的原始故障数据;对所述原始故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合;对与所有原始故障数据对应的关键词集合进行聚类,得到多个故障类别和与每个故障类别对应的特征词集合。2.根据权利要求1所述的方法,其特征在于,所述对所述原始故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合,包括:清洗每条原始故障数据;对清洗后的故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合。3.根据权利要求2所述的方法,其特征在于,所述清洗每条原始故障数据,包括:剔除所述原始故障数据中的空字符;和/或,利用正则表达式,剔除所述原始故障数据中与所述风力发电机组故障无关的数字符;和/或,根据预定固定词库,剔除所述原始故障数据中与所述风力发电机组故障无关的固定词组。4.根据权利要求3所述的方法,其特征在于,所述对清洗后的故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合,包括:利用结巴分词包对清洗后的故障数据进行分词处理,得到与每条原始故障数据对应的关键词集合,其中,所述结巴分词包中的词库包括风力发电机组行业词库和/或停用词库。5.根据权利要求1所述的方法,其特征在于,所述对与所有原始故障数据对应的关键词集合进行聚类,得到多个故障类别和与每个故障类别对应的特征词集合,包括:从原始待聚类关键词集合组中选取第一关键词集合,所述原始待聚类关键词集合组为与所有原始故障数据对应的关键词集合构成的组合;分别判断所述原始待聚类关键词集合组中除所述第一关键词集合外的、其他每组关键词集合是否能够与所述第一关键词集合聚为一类;将所有能够与所述第一关键词集合聚为一类的关键词集合中的关键词的组合,作为用于表征与所述第一关键词集合对应的故障类别的特征词集合,并将所有未能够与所述第一关键词集合聚为一类的关键词集合构成更新后的待聚类关键词集合组;从所述更新后的待聚类关键词集合组中选取第二关键词集合;分别判断所述更新后的待聚类关键词集合组中除所述第二关键词集合外的、其他每组关键词集合是否能够与所述第二关键词集合聚为一类;将所有能够与所述第二关键词集合聚为一类的关键词集合中的关键词的组合,作为用于表征与所述第二关键词集合对应的故障类别的特征词集合,直到所述更新后的待聚类关键词集合组中的关键词集合的数目下降至0。6.根据权利要求5所述的方法,其特征在于,所述分别判断所述原始待聚类关键词集合组中除所述第一关键词集合外的、其他每组关键词集合是否能够与所述第一关键词集合聚为一类,包括:从所述原始待聚类关键词集合组中除所述第一关键词集合外的、其他关键词集合中依次选取第三关键词集合;分别获取所述第一关键词集合的关键词总数目和每组所述第三关键词集合的关键词总数目,将所述关键词总数目较大的关键词集合的关键词总数目作为第一总数目;分别获取所述第一关键词集合和每组所述第三关键词集合之间的共有关键词的第二总数目;分别计算每个所述第二总数目和对应的第一总数目的比值;若所述第二总数目和对应的第一总数目的比值大于预定比值,则判断与所述第二总数目对应的所述第三关键词集合能够与所述第一关键词集合聚为一类。7.根据权利要求1所述的方法,其特征在于,所述对与所有原始故障数据对应的关键词集合进行聚类,得到多个故障类别和与每个故障类别对应的特征词集合,包括:计算所述原始待聚类关键词集合组中每两组关键词集合之间的第一相似度值,所述原始待聚类关键词集合组为与所有原始故障数据对应的关键词集合构成的组合;将所述第一相似度值最大的两组关键词集合聚为一组新的关键词集合,并将所述新的关键词集合和所述原始待聚类关键词集合组中除所述第一相似度值最大的两组关键词集合外的、其他关键词集合构成更新后的待聚类关键词集合组;计算所述更新后的待聚类关键词集合组中每两组关键词集合之间的第二相似度值,并将所述第二相似度值最大的两组关键词集合聚为一组新的关键词集合,直到所有第二相似度值中的最大第二相似度值大于预定阈值;或者,直到所述更新后的待聚类关键词集合组中的关键词集合的数目下降至预...
【专利技术属性】
技术研发人员:宋明彦,董兆宇,马晓丽,
申请(专利权)人:新疆金风科技股份有限公司,
类型:发明
国别省市:新疆,65
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。