当前位置: 首页 > 专利查询>清华大学专利>正文

样本数据的扩增方法、训练方法、识别方法和装置、介质制造方法及图纸

技术编号:41408140 阅读:27 留言:0更新日期:2024-05-20 19:34
一种样本数据的扩增方法、训练方法、识别方法和装置、介质,涉及人工智能领域,其中,样本数据的扩增方法包括:获取用于训练泄漏识别模型的样本数据,样本数据包括供水管网泄漏时采集高频信号得到的原始时间序列及其标签;采用预设方式对原始时间序列进行扩增处理,得到原始时间序列对应的至少一个扩增时间序列,扩增时间序列与原始时间序列具有相同或相似的统计量和能量频谱,预设方式包括振幅抖动处理、振幅缩放处理和数值重排处理中的至少一种;将原始时间序列的标签作为该原始时间序列对应的扩增时间序列的标签;将扩增时间序列及其标签作为扩增的样本数据,以训练泄漏识别模型。有助于降低训练数据的不均衡对模型识别性能的不利影响。

【技术实现步骤摘要】

本公开实施例涉及人工智能领域,尤指一种样本数据的扩增方法、训练方法、识别方法和装置、介质


技术介绍

1、供水管网是城市的大型基础设施,承载着输送清洁水资源的重要任务。然而,由于管道老化腐蚀、外力破坏以及管理不当等因素,供水管网的漏损问题成为可持续利用和管理城市水资源的一大阻碍。泄漏识别是漏损治理的重要一环,其目的是通过技术手段尽早发现供水管网中的泄漏事件,对于降低供水管网漏损率、建设节水型社会具有重大意义。

2、随着监测设备和通讯技术的发展以及分区计量的全面推广,水量、压力以及声学等监测设备大量安装应用于供水管网,供水企业逐渐收集并积累了大量数据。在这一背景下,数据驱动的泄漏识别已成为供水管网领域的一大热点问题,例如利用深度学习模型(例如卷积神经网络)对采集到的数据进行识别,以预测供水管网中是否发生泄漏。

3、对于深度学习模型而言,训练数据的质量直接关系到深度学习模型的识别性能。然而现实中供水管网中的监测数据绝大部分为正常运行状态下采集到的非泄漏数据,泄漏数据的数量极少,因而用于识别泄漏的深度学习模型的训练数据中表征泄漏状态下的样本文档来自技高网...

【技术保护点】

1.一种样本数据的扩增方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述振幅抖动处理包括:获取第一预设数量个白噪声序列;将待抖动的时间序列分别与每个白噪声序列合成,得到第一预设数量个振幅抖动后的时间序列;

3.根据权利要求2所述的方法,其特征在于,获取第一预设数量个白噪声序列,包括:

4.根据权利要求2所述的方法,其特征在于,采用预设方式对所述原始时间序列进行扩增处理,得到所述原始时间序列对应的至少一个扩增时间序列,包括:

5.根据权利要求2所述的方法,其特征在于,采用预设方式对所述原始时间序列进行扩增处理,得到所述原...

【技术特征摘要】

1.一种样本数据的扩增方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述振幅抖动处理包括:获取第一预设数量个白噪声序列;将待抖动的时间序列分别与每个白噪声序列合成,得到第一预设数量个振幅抖动后的时间序列;

3.根据权利要求2所述的方法,其特征在于,获取第一预设数量个白噪声序列,包括:

4.根据权利要求2所述的方法,其特征在于,采用预设方式对所述原始时间序列进行扩增处理,得到所述原始时间序列对应的至少一个扩增时间序列,包括:

5.根据权利要求2所述的方法,其特征在于,采用预设方式对所述原始时间序列进行扩增处理,得到所述原始时间序列对应的至少一个扩增时间序列,包括:

6.根据权利要求5所述的方法,其特征在于,将所述振幅抖动后的时间序列确定为所述待缩放的时间序列进行振幅缩放,得到所述振幅缩放后的时间序列之前,所述方法还包括:获取第一预设数量个所述缩放系数;以及,

7.根据权利要求2所述的方法,其特征在于,采用预设方式对所述原始时间序列进行扩增处理,得到所述原始时间序列对应的至少一个扩增时间序列,包括:

8.根据权利要求5至7之一所述的方法,其特征在于,将所述振幅缩放后的时间序列确定为所述待重排的时间序列进行数值重排,得到所述调整后的时间序列,包括:

9.根据权利要求8所述的方法,其特征在于,基于所述原始时间序列调整所述第一时间序列的频谱,得到与所述原始时间序列的能量频谱相同的第二时间序列,包括:

10.根据权利要求9所述的方法,其特征在于,基于所述原始时间序列调整所述第二时间序列的振幅,得到所述调整后的时间序列,包括:

11.根据权利要求10所述的方法,其特征在...

【专利技术属性】
技术研发人员:刘书明吴以朋吴雪
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1