【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种用于设备树聚类求解的语言模型的训练方法及其装置、一种设备树聚类求解方法及其装置。
技术介绍
1、电厂进行信息化统计和管理,信息化的具体程度视投入程度、项目进度等各种原因各电厂均有所不同。以信息化程度较高的水电领域为例,目前其信息化技改程度依旧无法满足各电厂和其上级管理、调度单位所需。
2、相关技术中,电厂内数以十万、百万计的设备和设备相关的各类台账(如检修台账、物资台账)进行系统梳理时,系统中的设备树存在统计不全面、更新不及时等问题,因此全厂范围的设备盘点需由设备列表中增删改查。又因各个电厂从设备选型、后续生产情况均不同导致的不同检修与技改路径,设备盘点时容易出现误差,影响设备盘点的效率。设备盘点、设备树编制工作往往按专业分工,从而导致回收的设备树质量好坏不一、专有名词和惯用叫法混杂等问题,因此设备树的编制需要经过二次矫正的过程。其中对于专有名词和惯用叫法混杂、同名称设备指向不同用途设备等问题具有专业性较强等问题,无法被轻易鉴别。
3、因此,如何提高设备盘点和生成设备树的准确度,提
...【技术保护点】
1.一种用于设备树聚类求解的语言模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对任一类型设备的所述语料数据进行语言处理,生成第一语料数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集中的数据量进行不同次数的数据增强,生成第二语料数据集,包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述目标聚类结果对所述初始语言模型进行训练,直至完成训练,生成目标语言模型,包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述目标聚类结果和预
...【技术特征摘要】
1.一种用于设备树聚类求解的语言模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对任一类型设备的所述语料数据进行语言处理,生成第一语料数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一语料数据集中的数据量进行不同次数的数据增强,生成第二语料数据集,包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述目标聚类结果对所述初始语言模型进行训练,直至完成训练,生成目标语言模型,包括:
5.根据权利要求4所述...
【专利技术属性】
技术研发人员:杨紫阳,徐剑,董智磊,席盛代,伊然,杨康,李辉,杨震,何战勇,贾成,薛松,赵文举,曾令龙,吴春锐,韦杰文,薛丽,彭鹏,
申请(专利权)人:华能澜沧江水电股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。