一种施工数据可靠性的预测方法、系统、设备及存储介质技术方案

技术编号：40960439 阅读：2 留言：0更新日期：2024-04-18 20:38

本发明专利技术公开了一种施工数据可靠性的预测方法、系统、设备及存储介质，包括：确定第一训练数据集和第一测试数据集；采用改进助推算法对第一训练数据集进行助推以每个子数据组的权重；基于权重，采用改进装袋算法为每个子数据组生成多个数据标签，根据数据标签识别数据类型并更新第一训练数据集；重复执行采用改进助推算法对第一训练数据集进行助推以每个子数据组的权重的步骤，直至边际贡献降低至预定阈值以下，得到权重更新后的第二训练数据集，进而得到目标施工数据可靠性识别模型；通过上述识别模型对施工数据进行可靠性识别。本发明专利技术能够为只有单个标签的施工数据生成多个数据标签，适用范围广，预测准确度高，可广泛应用于计算机技术领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，尤其涉及一种施工数据可靠性的预测方法、系统、设备及存储介质。

技术介绍

1、在施工的安全管理过程中，时常需要对各项施工参数进行预测，例如隧道施工时建筑物倾斜率(btr)的预测。在进行预测时，通常需要输入施工数据，但是输入的数据可靠性不稳定，可能出现不太可靠的数据，例如从传感器中收集的定量数据可能由于恶劣工作环境的影响或者传感器退化的影响而变得不可靠，而从工程师那里收集的定性数据可能会受到歧义或者知识限制的影响而变得不可靠。此外，隧道施工数据计算、传输或者记录中的错误也可能导致数据不太可靠。采用不可靠的数据得到的预测结果可能会误导决策者采取不适当的措施。

2、在实际施工实践中，现有技术使用多个标签，例如来自多个传感器的冗余读数、专家知识等，通过交叉检查来识别和区分可靠数据和不可靠数据。例如，在btr预测的场景下，记录中的每个切削扭矩是掘进机(tbm)在一段时间内(例如一小时)的多个读数的平均值，沉降是地铁隧道施工现场关键位置的多个传感器读数的平均数，然后计算平均切削扭矩或者沉降。从这个意义上讲，多个读数被用作多个标签。当多个读数不可用时，通常会咨询现场工程师，在单个读数成为正式记录之前对其进行检查，此时，专家知识被用作第二个标签。无论哪种方式，都需要获取多个标签来相互证实，以帮助区分可靠数据和不可靠数据，这是一种常见的工程实践。

3、然而，当隧道施工数据只有一个标签时，例如，当数据已被记录且无法重新收集数据时。对于这种单标签数据，上述传统的基于多标签的交叉检查不再适用，因此，这种方法具有局限性，适用范围较小。

技术实现思路

1、本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术提出一种适用范围广、预测准确度高的施工数据可靠性的预测方法、系统、设备及存储介质。

2、一方面，本专利技术实施例提供了一种施工数据可靠性的预测方法，包括：

3、获取施工数据的总数据集，根据所述总数据集确定第一训练数据集和第一测试数据集；

4、采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集中每个子数据组的权重；

5、基于所述权重，采用改进装袋算法为每个所述子数据组生成多个数据标签，根据所述数据标签识别所述子数据组的数据类型，并根据所述数据类型更新所述第一训练数据集；其中，所述数据类型包括可靠数据和不太可靠数据；所述可靠数据是具有一致输入输出关系的所述施工数据；所述不太可靠数据是输入输出关系不一致的所述施工数据；

6、重复执行所述采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集的权重的步骤，直至边际贡献降低至预定阈值以下，得到权重更新后的第二训练数据集；

7、所述根据所述第二训练数据集和所述第一测试数据集，得到目标施工数据可靠性识别模型；

8、通过所述目标施工数据可靠性识别模型对待识别施工数据进行可靠性识别，得到可靠性识别结果。

9、可选地，所述采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集中每个子数据组的权重，包括以下之一：

10、对于第一轮助推，根据所述子数据组的数据类型，更新所述子数据组的权重；

11、对于第r轮助推，当所述子数据组在前一轮次中被识别为不可靠数据，则更新所述子数据组的权重。

12、可选地，所述基于所述权重，采用改进装袋算法为每个所述子数据组生成多个数据标签，根据所述数据标签识别所述子数据组的数据类型，包括：

13、对所述第一训练数据集中进行随机采样，得到若干个子训练数据集；其中，每个所述子训练数据集的大小相同；

14、通过训练后的子模型计算所述子数据组的输出误差，采用基线模型根据所述输出误差生成数据标签；其中，所述子模型是根据子训练数据集构建的；

15、根据所述数据标签计算所述子数据组的度量误差；

16、根据所述度量误差对所述子数据组进行排序筛选，得到所述第一训练数据集的数据类型。

17、可选地，所述根据所述第二训练数据集和所述第一测试数据集，得到目标施工数据可靠性识别模型，包括：

18、根据所述第二训练数据集构建第一施工数据可靠性识别模型；

19、采用所述第一测试数据集对所述第一施工数据可靠性识别模型进行模型验证，得到目标施工数据可靠性识别模型。

20、可选地，所述方法还包括：

21、配置改进装袋算法的算法模型参数；其中，所述模型参数包括子模型的数量和子训练数据集的大小。

22、可选地，所述输出误差的计算公式为：

23、

24、其中，表示第p个子数据组在第r轮的输出误差；yp表示第p个子数据组的实际输出，表示第r轮中第s个子模型的第p个估计输出。

25、可选地，对于第一轮助推，所述边际贡献的计算公式为：

26、

27、其中，δctr(1)表示第一轮助推的边际贡献；mmae1表示第一轮助推的平均绝对误差；mmae0表示第一训练数据集的平均绝对误差；nd1表示第一轮助推的数据组数量；nd0表示第一训练数据集的数据组数量。

28、对于第r轮助推，所述边际贡献的计算公式为：

29、

30、其中，δctr(r+1)表示第r+1轮助推的边际贡献；mmaer+1表示第r+1轮助推的平均绝对误差；maer表示第r轮的平均绝对误差；ndr+1表示第r+1轮助推的子数据组数量；ndr表示第r轮助推的子数据组数量；δmmaer表示本次助推前后的平均绝对误差的差值；δnd表示本次助推前后的子数据组数量的差值。

31、另一方面，本专利技术实施例还提供了一种施工数据可靠性的预测系统，包括：

32、第一模块，用于获取施工数据的总数据集，根据所述总数据集确定第一训练数据集和第一测试数据集；

33、第二模块，用于采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集中每个子数据组的权重；

34、第三模块，用于基于所述权重，采用改进装袋算法为每个所述子数据组生成多个数据标签，根据所述数据标签识别所述子数据组的数据类型，并根据所述数据类型更新所述第一训练数据集；其中，所述数据类型包括可靠数据和不太可靠数据；所述可靠数据是具有一致输入输出关系的所述施工数据；所述不太可靠数据是输入输出关系不一致的所述施工数据；

35、第四模块，用于重复执行所述采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集的权重的步骤，直至边际贡献降低至预定阈值以下，得到权重更新后的第二训练数据集；

36、第五模块，用于所述根据所述第二训练数据集和所述第一测试数据集，得到目标施工数据可靠性识别模型；

37、第六模块，用于通过所述目标施工数据可靠性识别模型对待识别施工数据进行可靠性识别，得到可靠性识别结本文档来自技高网...

【技术保护点】

1.一种施工数据可靠性的预测方法，其特征在于，包括：

2.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，所述采用改进助推算法对所述第一训练数据集进行助推操作，更新所述第一训练数据集中每个子数据组的权重，包括以下之一：

3.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，所述基于所述权重，采用改进装袋算法为每个所述子数据组生成多个数据标签，根据所述数据标签识别所述子数据组的数据类型，包括：

4.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，所述根据所述第二训练数据集和所述第一测试数据集，得到目标施工数据可靠性识别模型，包括：

5.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，所述方法还包括：

6.根据权利要求3所述的一种施工数据可靠性的预测方法，其特征在于，所述输出误差的计算公式为：

7.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，

8.一种施工数据可靠性的预测系统，其特征在于，包括：

9.一种电子设备，其特

10.一种计算机存储介质，其中存储有处理器可执行的程序，其特征在于，所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种施工数据可靠性的预测方法，其特征在于，包括：

4.根据权利要求1所述的一种施工数据可靠性的预测方法，其特征在于，所述根据所述第二训练数据集和所述第一测试数据集，得到目标施工数据可靠性识...

【专利技术属性】
技术研发人员：梁健伟，
申请(专利权)人：广州番禺职业技术学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人