一种建立样本集的方法及计算设备技术

技术编号:29934464 阅读:12 留言:0更新日期:2021-09-04 19:08
本发明专利技术公开了一种建立样本集的方法,在计算设备中执行,包括步骤:获取一种或多种设备的振动数据以及设备属性信息;将所述振动数据输入预训练模型,经由所述预训练模型对所述振动数据处理后输出相应的标注数据;基于所述振动数据和相应的标注数据生成待定样本,基于多个待定样本生成待定样本集;以及对所述待定样本集中的多个待定样本进行修正处理,生成目标样本集,以便基于所述目标样本集对所述预训练模型进行训练。本发明专利技术还一并公开了相应的计算设备。根据本发明专利技术的建立样本集的方法,可以生成大量的更全面的样本,且样本的生成效率高,基于样本训练后的模型能够满足对设备多种状态的监测需求,有利于提升设备状态监测的智能化水平。化水平。化水平。

【技术实现步骤摘要】
一种建立样本集的方法及计算设备


[0001]本专利技术涉及智能监测
,特别涉及一种建立样本集的方法及计算设备。

技术介绍

[0002]在大数据和人工智能的背景下,各行各业都在推进智能化程度。在研究智能算法和工程实践的过程中,实验样本是训练和评测智能算法的重要工具,实验样本的规模甚至比算法模型的精妙设计更为重要。目前,由于设备状态监测领域缺乏有效、全面、大量的反映设备故障状态的相关样本,导致设备状态监测领域的智能化水平依旧较低。
[0003]现阶段最常见、且智能化发展最为成熟的设备状态监测手段是基于振动的设备状态监测。现有技术中,基于振动的设备状态智能化监测技术使用的训练样本一般是通过以下两种途径获得:
[0004]一种是通过人工在实验室模拟某些故障,例如,通过对正常轴承内圈进行损坏,采集此类数据用于表证轴承内圈故障时的振动信号特征,此类样本多用于高校研究。这种方案存在以下缺陷:所模拟的设备单一,无法模拟设备类型纷繁复杂的工业现场所有设备的运行状态;设备运行工况较真实工业现场设备运行工况太过简单;能够模拟的设备运行状态较为单一,很难获取设备整个生命周期的状态数据。因此,通过实验室获取的设备设备振动状态数据的客观性及代表性不足。
[0005]还有一种方案是基于业内从事设备状态监测的厂家通过长期看护过程积累的部分一致设备运行状态的特征数据,通过人工标记形成相应样本。这种方案的缺点在于,目前业内各厂家监测设备数量较少,样本来源不足;业内相关厂家无相应设备状态监测的服务团队,对监测过程中设备状态跟踪、闭环不及时,无法及时获知设备运行状态,进而无法及时将设备运行状态和对应状态数据特征相结合;目前业内相关厂家形成的样本往往偏向于某一种运行状态,样本种类不够丰富,而且目前各个厂家偏向于创建各类损伤样本,如轴承缺陷样本,对设备状态监测过程中其他环节的样本创建较少,如设备状态数据采集过程中可能涉及的采集、报警、分析等相关的样本(误信号、启停机、报警、诊断等),从而导致样本全面性较差。
[0006]为此,需要一种建立样本集的方法来解决上述技术方案中存在的问题。

技术实现思路

[0007]为此,本专利技术提供一种建立样本集的方法,以力图解决或者至少缓解上面存在的问题。
[0008]根据本专利技术的一个方面,提供了一种建立样本集的方法,在计算设备中执行,包括步骤:获取一种或多种设备的振动数据以及设备属性信息;将所述振动数据输入预训练模型,经由所述预训练模型对所述振动数据处理后输出相应的标注数据;基于所述振动数据和相应的标注数据生成待定样本,基于多个待定样本生成待定样本集;以及对所述待定样本集中的多个待定样本进行修正处理,生成目标样本集,以便基于所述目标样本集对所述
预训练模型进行训练。
[0009]可选地,在根据本专利技术的建立样本集的方法中,所述预训练模型为预训练启停机状态确定模型,所述标注数据包括启机状态或停机状态。
[0010]可选地,在根据本专利技术的建立样本集的方法中,在生成目标样本集之后,还包括步骤:根据设备属性信息对所述目标样本集进行划分,以生成与每种设备属性信息相对应的样本子集。
[0011]可选地,在根据本专利技术的建立样本集的方法中,所述设备属性信息包括设备类型、设备名称、设备标识、设备厂商信息、结构组件信息中的一种或多种。
[0012]可选地,在根据本专利技术的建立样本集的方法中,根据设备属性信息对目标样本集进行划分的步骤包括:根据设备类型对所述目标样本集进行划分,以生成与每个设备类型相对应的样本子集。
[0013]可选地,在根据本专利技术的建立样本集的方法中,根据设备属性信息对所述目标样本集进行划分的步骤还包括:对于同一设备类型的设备,根据设备的结构组件对与所述设备类型相对应的样本子集进行划分,以生成与结构组件相对应的样本子集。
[0014]可选地,在根据本专利技术的建立样本集的方法中,在将振动数据输入预训练模型之前,还包括步骤:定义一种或多种样本集以及每种样本集对应的标签类型。
[0015]可选地,在根据本专利技术的建立样本集的方法中,所述样本集包括误信号样本集、启停机样本集、报警样本集、诊断样本集中的一种或多种。
[0016]可选地,在根据本专利技术的建立样本集的方法中,获取一种或多种设备的振动数据包括:获取一种或多种设备在预定时间段内的振动数据,所述振动数据包括趋势数据或频谱数据。
[0017]可选地,在根据本专利技术的建立样本集的方法中,在获取一种或多种设备的振动数据之前,包括步骤:通过数据采集系统采集一种或多种设备的振动数据,以便从所述数据采集系统获取振动数据。
[0018]根据本专利技术的一个方面,提供了一种计算设备,包括:至少一个处理器;以及存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如上所述的建立样本集的方法的指令。
[0019]根据本专利技术的一个方面,提供了一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如上所述方法。
[0020]根据本专利技术的技术方案,提供了一种建立样本集的方法,通过获取多种类型的设备的实际振动数据,并利用预训练模型对振动数据进行初步标注后生成待定样本集,进而对待定样本集中的多个待定样本进行人工修正后生成目标样本集。这样,不仅可以生成大量、覆盖多种设备状态的样本,而且,利用预训练模型结合人工修正处理,有利于提高样本的生成效率和准确性。基于更全面、准确的样本来训练模型,经训练后的模型能够满足在设备实际运行过程中对设备多种状态的监测需求,有利于提升设备状态监测的智能化水平。
[0021]进一步地,本专利技术通过对样本集进行细分,生成与每个设备类型相对应的样本子集,采用与设备类型相对应的样本子集对预训练模型进行训练。这样,在基于训练后的模型来检测设备状态时,对于每个类型的设备,分别可以利用与设备类型相对应的训练后的模型来判断设备的状态,有利于更加精确地确定设备的状态。
附图说明
[0022]为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
[0023]图1示出了根据本专利技术一个实施例的计算设备100的示意图;以及
[0024]图2示出了根据本专利技术一个实施例的建立样本集的方法200的流程图。
具体实施方式
[0025]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0026]图1是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立样本集的方法,在计算设备中执行,包括步骤:获取一种或多种设备的振动数据以及设备属性信息;将所述振动数据输入预训练模型,经由所述预训练模型对所述振动数据处理后输出相应的标注数据;基于所述振动数据和相应的标注数据生成待定样本,基于多个待定样本生成待定样本集;以及对所述待定样本集中的多个待定样本进行修正处理,生成目标样本集,以便基于所述目标样本集对所述预训练模型进行训练。2.如权利要求1所述的方法,其中,所述预训练模型为预训练启停机状态确定模型,所述标注数据包括启机状态或停机状态。3.如权利要求1所述的方法,其中,在生成目标样本集之后,还包括步骤:根据设备属性信息对所述目标样本集进行划分,以生成与每种设备属性信息相对应的样本子集。4.如权利要求1

3中任一项所述的方法,其中,所述设备属性信息包括设备类型、设备名称、设备标识、设备厂商信息、结构组件信息中的一种或多种。5.如权利要求1

4中任一项所述的方法,其中,根据设备属性信息对目标样本集进行划分的步骤包括:根据设备类型...

【专利技术属性】
技术研发人员:张神林宋海峰贾维银
申请(专利权)人:安徽容知日新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1