System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 预测模型的构建方法和数据预测方法技术_技高网
当前位置: 首页 > 专利查询>复旦大学专利>正文

预测模型的构建方法和数据预测方法技术

技术编号:41133311 阅读:14 留言:0更新日期:2024-04-30 18:03
本发明专利技术涉及数据预测模型的构建方法,用于客户端,包括:使用反向传播训练得到数据预测模型,其中,数据预测模型包括参数识别模块和机理模型;参数识别模块基于低级已知数据和/或高级已知数据,确定机理模型的可变参数的值;机理模型基于确定的可变参数的值和低级已知数据,预测得到目标数据;高级已知数据由具有相互关系的多个低级已知数据组成。本发明专利技术还涉及数据预测方法,装置、设备集群、介质和计算机程序产品。

【技术实现步骤摘要】

本专利技术涉及计算机,特别涉及预测模型的构建方法和数据预测方法


技术介绍

1、制造业需要大量的数据分析任务。例如,在造船业,装配机械的机械运行状态预测(mosp)任务对于安全操作至关重要,而合金熔体的熔体粘度预测(mvp)任务对于船用钢很重要板材生产。这些任务传统上是通过机理模型(mm)来完成的。除此之外,最近,神经网络(nn)越来越多地应用于制造业。面对mm和nn各有优缺点,因此它们也被结合在一起,将mm嵌入深度网络中,称为机理引导的神经网络框架(mnnf)。然而现有的mnnf通常是针对特定任务或mm类型而定制的,需要花费大量的领域专家精力和时间,并且还不能满足很多工业应用中的要求。


技术实现思路

1、本专利技术的目的在于提供预测模型的构建方法和数据预测方法方法、装置、设备集群、介质和计算机程序产品,解决如何利用多示例互连、实现自适应误差修正和多机理模型集成的技术问题。

2、本专利技术的第一实施方式公开了一种数据预测模型的构建方法,用于客户端,包括:

3、使用反向传播训练得到所述数据预测模型,其中,

4、所述数据预测模型包括参数识别模块和机理模型;

5、所述参数识别模块基于低级已知数据和/或高级已知数据,确定所述机理模型的可变参数的值;所述机理模型基于确定的所述可变参数的值和低级已知数据,预测得到目标数据;所述高级已知数据由具有相互关系的多个低级已知数据组成。

6、可选地,所述参数识别模块包括特征学习器和参数标识器,所述特征学习器从低级已知数据和/或高级已知数据中学习特征,所述参数标识器基于学习的所述特征确定所述可变参数的值。

7、可选地,所述可变参数包括依赖低级已知数据而变化的低级可变参数,和依赖高级已知数据而变化的高级可变参数。

8、可选地,

9、所述特征学习器包括低级特征学习器和高级特征学习器;所述低级特征学习器从低级已知数据学习低级特征,所述高级特征学习器从高级已知数据学习高级特征;

10、所述参数标识器包括低级参数标识器和高级参数标识器,所述低级参数标识器基于低级特征和高级特征确定低级可变参数的值,所述高级参数标识器基于高级特征确定高级可变参数的值。

11、可选地,所述低级已知数据是依赖时刻的数据点,所述高级数据是时间序列。

12、可选地,所述低级特征学习器从实时的所述数据点学习低级特征,所述高级特征学习器从实时更新的时间序列学习高级特征;

13、所述机理模型基于确定的低级可变参数的值、高级可变参数的值和实时的所述数据点,预测所述目标数据。

14、可选地,所述低级已知数据包括:像素点或图像块、视频帧或视频片段、三维点或三维点簇;

15、当所述低级已知数据是像素点或图像块时,所述高级已知数据是图像;

16、当所述低级已知数据是视频帧或视频片段时,所述高级已知数据是视频;

17、当所述低级已知数据是三维点或三维点簇时,所述高级已知数据是三维点云。

18、可选地,所述数据预测模型还包括对所述目标数据进行误差修正的误差修正模块;

19、所述误差修正模块包括误差估计器,所述误差估计器以所述目标数据为输入,输出误差项向量e;所述误差估计器的架构是:

20、

21、其中,⊙表示逐元素乘法;g(·)是多层感知器,输出与e长度相同的向量;tanh是双曲正切函数;β是误差界限向量;

22、所述误差修正模块将所述误差项向量e添加到所述目标数据得到修正后的目标数据

23、可选地,还包括:删除所述机理模型中内置的误差项。

24、可选地,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:

25、

26、其中,是主要损失,是惩罚项,其中是预定的模板损失函数,λ是超参数。

27、可选地,所述机理模型还包括不依赖于所述低级已知数据和所述高级已知数据的常量参数,所述常量参数被所述数据预测模型学习。

28、可选地,所述数据预测模型包括多个所述机理模型;并且所述数据预测模型还包括注意力聚合器,所述注意力聚合器将多个所述机理模型的预测的目标数据进行聚合。

29、可选地,所述注意力聚合器将多个所述机理模型的预测的目标数据进行加权平均,得到聚合后的目标数据,其中权重向量w是:

30、

31、其中,矩阵的各列分别是所述多个所述机理模型中的一个预测的目标数据,h(·)是多层感知机,softmax函数将权重之和标准化为1。

32、可选地,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:

33、

34、m是所述机理模型的数量,是修正后的聚合后的目标数据,是未修正的聚合后的目标数据,是第i个所述机理模型预测的目标数据,是预定的模板损失函数。

35、本专利技术的第二实施方式公开了一种数据预测方法,用于客户端,包括使用根据本专利技术的第一实施方式公开的方法构建的数据预测模型,基于已知数据,预测得到目标数据。

36、本专利技术的第三实施方式公开了一种数据预测模型的构建装置,包括:

37、训练模块,使用反向传播训练得到所述数据预测模型,其中,

38、所述数据预测模型包括参数识别模块和机理模型;

39、所述参数识别模块基于低级已知数据和/或高级已知数据,确定所述机理模型的可变参数的值;所述机理模型基于确定的所述可变参数的值和低级已知数据,预测得到目标数据;所述高级已知数据由具有相互关系的多个低级已知数据组成。

40、本专利技术的第四实施方式公开了一种数据预测装置,包括:数据预测模块,使用根据第三实施方式公开的装置构建的数据预测模型,基于已知数据,预测得到目标数据。

41、本专利技术的第五实施方式公开了一种计算设备集群,包括至少一个计算设备,每个计算设备包括处理器和存储器;所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行根据本专利技术的第一实施方式公开的数据预测模型的构建方法,或者根据本专利技术的第二实施方式公开的数据预测方法。

42、本专利技术的第六实施方式公开了一种包含指令的计算机程序产品,当所述指令被计算设备集群运行时,使得所述计算设备集群执行根据本专利技术的第一实施方式公开的数据预测模型的构建方法,或者根据本专利技术的第二实施方式公开的数据预测方法。

43、本专利技术的第七实施方式公开了一种计算机可读取存储介质,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行根据本专利技术的第一实施方式公开的数据预测模型的构建方法,或者根据本专利技术的第二实施方式公开的数据预测方法。

44、本专利技术实施方式与现有技术相比,主要区本文档来自技高网...

【技术保护点】

1.一种数据预测模型的构建方法,用于客户端,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述参数识别模块包括特征学习器和参数标识器,所述特征学习器从低级已知数据和/或高级已知数据中学习特征,所述参数标识器基于学习的所述特征确定所述可变参数的值。

3.根据权利要求2所述的方法,其特征在于,所述可变参数包括依赖低级已知数据而变化的低级可变参数,和依赖高级已知数据而变化的高级可变参数。

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述低级已知数据是依赖时刻的数据点,所述高级数据是时间序列。

6.根据权利要求5所述的方法,其特征在于,所述低级特征学习器从实时的所述数据点学习低级特征,所述高级特征学习器从实时更新的时间序列学习高级特征;

7.根据权利要求1所述的方法,其特征在于,所述低级已知数据包括:像素点或图像块、视频帧或视频片段、三维点或三维点簇;

8.根据权利要求1所述的方法,其特征在于,所述数据预测模型还包括对所述目标数据进行误差修正的误差修正模块;

9.根据权利要求8所述的方法,其特征在于,还包括:删除所述机理模型中内置的误差项。

10.根据权利要求8所述的方法,其特征在于,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:

11.根据权利要求10所述的方法,其特征在于,所述机理模型还包括不依赖于所述低级已知数据和所述高级已知数据的常量参数,所述常量参数被所述数据预测模型学习。

12.根据权利要求1所述的方法,其特征在于,所述数据预测模型包括多个所述机理模型;并且所述数据预测模型还包括注意力聚合器,所述注意力聚合器将多个所述机理模型的预测的目标数据进行聚合。

13.根据权利要求12所述的方法,其特征在于,所述注意力聚合器将多个所述机理模型的预测的目标数据进行加权平均,得到聚合后的目标数据,其中权重向量w是:

14.根据权利要求13所述的方法,其特征在于,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:

15.一种数据预测方法,用于客户端,其特征在于,包括使用根据权利要求1-14中任一项所述的方法构建的数据预测模型,基于已知数据,预测得到目标数据。

16.一种数据预测模型的构建装置,其特征在于,包括:

17.一种数据预测装置,其特征在于,包括:数据预测模块,使用根据权利要求16所述的装置构建的数据预测模型,基于已知数据,预测得到目标数据。

18.一种计算设备集群,其特征在于,包括至少一个计算设备,每个计算设备包括处理器和存储器;所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行根据权利要求1-14中任意一项所述的数据预测模型的构建方法,或者根据权利要求15所述的数据预测方法。

19.一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备集群运行时,使得所述计算设备集群执行根据权利要求1-14中任意一项所述的数据预测模型的构建方法,或者根据权利要求15所述的数据预测方法。

20.一种计算机可读取存储介质,其特征在于,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行根据权利要求1-14中任意一项所述的数据预测模型的构建方法,或者根据权利要求15所述的数据预测方法。

...

【技术特征摘要】

1.一种数据预测模型的构建方法,用于客户端,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述参数识别模块包括特征学习器和参数标识器,所述特征学习器从低级已知数据和/或高级已知数据中学习特征,所述参数标识器基于学习的所述特征确定所述可变参数的值。

3.根据权利要求2所述的方法,其特征在于,所述可变参数包括依赖低级已知数据而变化的低级可变参数,和依赖高级已知数据而变化的高级可变参数。

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述低级已知数据是依赖时刻的数据点,所述高级数据是时间序列。

6.根据权利要求5所述的方法,其特征在于,所述低级特征学习器从实时的所述数据点学习低级特征,所述高级特征学习器从实时更新的时间序列学习高级特征;

7.根据权利要求1所述的方法,其特征在于,所述低级已知数据包括:像素点或图像块、视频帧或视频片段、三维点或三维点簇;

8.根据权利要求1所述的方法,其特征在于,所述数据预测模型还包括对所述目标数据进行误差修正的误差修正模块;

9.根据权利要求8所述的方法,其特征在于,还包括:删除所述机理模型中内置的误差项。

10.根据权利要求8所述的方法,其特征在于,所述数据预测模型使用标准反向传播进行训练,并且对于带有真实标签y的训练样本,所述数据预测模型的目标函数为:

11.根据权利要求10所述的方法,其特征在于,所述机理模型还包括不依赖于所述低级已知数据和所述高级已知数据的常量参数,所述常量参数被所述数据预测模型学习。

12.根据权利要求1所述的方法,其特征在于,所述数据预测模型包括多个所述机理模型;并且所述数据预测模型还包...

【专利技术属性】
技术研发人员:王鹏李姜辛张翰博汪卫
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1