用于设备树聚类求解的语言模型的训练方法及其装置制造方法及图纸

技术编号:39979015 阅读:24 留言:0更新日期:2024-01-09 01:22
本申请提出了一种用于设备树聚类求解的语言模型的训练方法及其装置,涉及数据处理技术领域。该方法包括:获取多种类型设备的语料数据,并对任一类型设备的语料数据进行语言处理,生成第一语料数据集;根据第一语料数据集中的数据量进行不同次数的数据增强,生成第二语料数据集;将第二语料数据集部署在初始语言模型后,基于初始语言模型对预设设备树进行聚类求解,获取目标聚类结果;基于目标聚类结果对初始语言模型进行训练,直至完成训练,生成目标语言模型。本申请可以提高设备盘点和生成设备树的准确度和效率,避免人力资源的浪费。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种用于设备树聚类求解的语言模型的训练方法及其装置、一种设备树聚类求解方法及其装置。


技术介绍

1、电厂进行信息化统计和管理,信息化的具体程度视投入程度、项目进度等各种原因各电厂均有所不同。以信息化程度较高的水电领域为例,目前其信息化技改程度依旧无法满足各电厂和其上级管理、调度单位所需。

2、相关技术中,电厂内数以十万、百万计的设备和设备相关的各类台账(如检修台账、物资台账)进行系统梳理时,系统中的设备树存在统计不全面、更新不及时等问题,因此全厂范围的设备盘点需由设备列表中增删改查。又因各个电厂从设备选型、后续生产情况均不同导致的不同检修与技改路径,设备盘点时容易出现误差,影响设备盘点的效率。设备盘点、设备树编制工作往往按专业分工,从而导致回收的设备树质量好坏不一、专有名词和惯用叫法混杂等问题,因此设备树的编制需要经过二次矫正的过程。其中对于专有名词和惯用叫法混杂、同名称设备指向不同用途设备等问题具有专业性较强等问题,无法被轻易鉴别。

3、因此,如何提高设备盘点和生成设备树的准确度,提高设备盘点和生成设备本文档来自技高网...

【技术保护点】

1.一种用于设备树聚类求解的语言模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对任一类型设备的所述语料数据进行语言处理,生成第一语料数据集,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集中的数据量进行不同次数的数据增强,生成第二语料数据集,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述目标聚类结果对所述初始语言模型进行训练,直至完成训练,生成目标语言模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述目标聚类结果和预设的参考聚类结果进行...

【技术特征摘要】

1.一种用于设备树聚类求解的语言模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对任一类型设备的所述语料数据进行语言处理,生成第一语料数据集,包括:

3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集中的数据量进行不同次数的数据增强,生成第二语料数据集,包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述目标聚类结果对所述初始语言模型进行训练,直至完成训练,生成目标语言模型,包括:

5.根据权利要求4所述...

【专利技术属性】
技术研发人员:杨紫阳徐剑董智磊席盛代伊然杨康李辉杨震何战勇贾成薛松赵文举曾令龙吴春锐韦杰文薛丽彭鹏
申请(专利权)人:华能澜沧江水电股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1