线性模型验证制造技术

技术编号：41098000 阅读：17 留言：0更新日期：2024-04-25 13:55

本发明专利技术涉及验证线性模型。接收输入数据(102)并提供要验证的线性模型(104)。基于由线性模型处理输入数据来确定预测数据(106)。基于预测数据与输入数据之间的差来确定残差数据(108)。基于残差数据生成包括同方差性验证数据或正态性验证数据的验证数据集(110)。提供二元分类器并用于确定验证数据集是否满足验证条件(112)，即，同方差性条件或正态性条件。二元分类器是取决于验证数据集而输出满足或不满足验证条件的经训练的数据驱动模型。最后，基于二元分类器的输出来确定线性模型是否有效(114)。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术涉及一种用于验证线性模型的系统、一种用于验证线性模型的方法以及一种用于验证线性模型的计算机程序产品。

技术介绍

1、m.发表在neural comput&applic[神经计算与应用](2021)(https://doi.org/10.1007/s00521-021-06229-7)上的文章“testing for normality with neuralnetworks[利用神经网络测试正态性]”披露了将正态性测试问题作为二元分类问题处理并构建可以充当正态性测试的前馈神经网络(nn)。nn可以通过检查从分布中抽取的小样本来将该分布分类为正态分布或非正态分布。可以通过改变前馈nn的决策阈值来控制错误非正态预测的频率。这使得网络更类似于标准统计测试。考虑的超参数有：决定所谓的描述符的结构的q；网络的深度d，即，隐藏层的数量；网络的宽度w，即，隐藏层中的神经元的数量；以及正则化系数c。描述符表示样本的多个描述性统计量，比如均值、中位数、标准差等。描述符是包括描述性统计量的数组。最高准确度基于以下参数配置来实现。前馈nn的网络深度d为五个隐藏层，每个隐藏层的网络宽度w为100个神经元，参数q设置为0.05，并且利用设置为1的正则化系数c来训练该网络。前馈nn的最后一层被设计为softmax层，使得前馈nn的输出是样本来自正态分布的概率值。如果概率值等于或高于决策阈值，则相应样本被分类为来自正态分布，如果概率值低于决策阈值，则相应样本被分类为来自非正态分布。

技术实现思路

<p>1、可以将本专利技术的目的视为提供一种用于验证线性模型的系统、一种用于验证线性模型的方法、一种用于验证线性模型的计算机程序产品以及一种计算机可读介质，其允许实现线性模型的改进的或至少替代的验证。

2、在本专利技术的第一方面中，提出了一种用于验证线性模型的系统。该系统包括通信接口和处理器。该通信接口被配置用于接收输入数据，该输入数据包括针对不同解释值的响应值。该处理器被配置用于通过执行以下步骤来验证该线性模型：

3、-基于由该线性模型处理该输入数据来确定预测数据，其中，该预测数据包括针对这些不同解释值的预测值，

4、-基于该预测数据与该输入数据之间的差来确定残差数据，其中，该残差数据包括针对这些不同解释值的残差值，这些残差值基于这些响应值与其对应的预测值之间的差来确定，

5、-基于该残差数据生成验证数据集，其中，该验证数据集包括同方差性验证数据或正态性验证数据，

6、-提供二元分类器以确定该验证数据集是否满足验证条件，其中，如果该验证数据集包括同方差性验证数据，则该验证条件是同方差性条件，或者如果该验证数据集包括正态性验证数据，则该验证条件是正态性条件，并且其中，该二元分类器是基于满足该验证条件的训练验证数据的训练集和不满足该验证条件的训练验证数据的训练集来训练的数据驱动模型，使得该二元分类器取决于作为输入提供给该二元分类器的该验证数据集而输出满足或不满足该验证条件，

7、-由该二元分类器确定该验证数据集是否满足该验证条件，以及

8、-基于该二元分类器的输出来确定该线性模型是否有效。

9、由于系统基于二元分类器来验证线性模型，因此提出了对线性模型的改进的或至少替代的验证。系统可以允许相应地使用线性模型的自动验证的假设或必要条件。此外，系统可以允许相应地使用客观验证的假设或必要条件，从而导致对线性模型的验证的客观化。该系统可以允许实现对线性模型的正确自动应用。由于二元分类器确定是否满足同方差性验证条件或正态性验证条件，因此可以相应地基于针对基于线性模型获得的残差数据的、最重要的验证条件或假设来验证线性模型。

10、本专利技术基于以下理解：线性模型用于预测例如化学工业中的各种过程的值。验证线性模型，即，确定线性模型是否正确反映观测到的行为，是统计学中的突出问题。可以通过对测量数据的残差使用统计测试或通过人类专家对残差图的目视检查来验证线性模型。可以基于确定线性模型是否违反线性模型的给定假设(比如残差的正态性和同方差性以及解释变量和响应变量的线性)来验证线性模型。出版物：nornadiah mohd razali和yap beewah,“power comparisons of shapiro-wilk,kolmogorov-smirnov,lilliefors andanderson-darling tests[shapiro-wilk、kolmogorov-smirnov、lilliefors和anderson-darling测试的功效比较]”,j.stat.model.analytics[统计模型分析汇刊],第2卷,第1期,21-33,2011年,以及tjen-sien lim、wei-yin loh,“a comparison of tests of equalityof variances[方差齐性测试的比较]”,computational statistics&data analysis[计算统计和数据分析],第22卷,第3期,287-301,1996年，指出通过现有技术中已知的统计测试验证的线性模型并不总是表现令人满意。经验表明，现有技术中已知的统计测试可能是不充分的。通过人类专家的目视检查验证的线性模型需要经验丰富且训练有素的人类专家来解释残差图，但在她或他对线性模型的验证中也可能存在主观偏差。该系统允许克服这些缺点。例如，不需要生成残差图，因为二元分类器可以确定验证数据集是否满足验证条件。此外，使用二元分类器允许客观且准确地验证线性模型，从而避免使用统计上不准确的方法或依赖于人类专家的知识。此外，在对验证过程进行自动化时，利用二元分类器允许避免对所有情况使用固定规则或阈值，从而实现更高的客观性。这种规则和阈值算法具有很大的缺点，即，它们仅对于非常有限数量的情况是准确的，并且不足够灵活以处理预定的非常有限的应用范围之外的情况。因此，本专利技术允许提高经验证的线性模型的可靠性，并因此提高线性模型在应用背景下的应用安全性。

11、通过为线性模型提供更可靠和客观的验证可能性来提高线性模型的可靠性是许多相关应用的重要任务。例如，在现代农业背景下，线性模型通常用于预测如植物保护剂和肥料的添加剂物质的必要量。如果该背景下的线性模型没有得到准确验证，并且例如，如果验证线性模型的专家犯了人为错误，则后果可能会直接导致植物和环境损害(例如，如果线性模型预测出远远过高的保护剂或肥料量)。通常，这种场景在大多数情况下可以通过实施相应的安全阈值来避免，但例如保护剂的预测量的轻微不准确也可能产生不想要的后果，特别是建立对特定保护剂的耐受性。此外，线性模型也经常用于质量控制场景，其中基于产品生产期间执行的指示所生产的产品的质量的测量来评估所生产的产品的质量。同样在这种情况下，准确、客观地验证线性模型也很重要，以避免交付质量低下或甚至无功能的产品。此外，线性模型在大多数情况下允许直接确定生产过程是否导致生产出不符合生产目标的产品，使得可以直接改本文档来自技高网...

【技术保护点】

1.一种用于验证线性模型(300)的系统(200)，该系统(200)包括通信接口(210)和处理器(220)，

2.根据权利要求1所述的系统(200)，其中，该处理器(220)进一步被配置用于如果该线性模型(300)被确定为是有效的，则提供该线性模型(300)。

3.根据权利要求1或2所述的系统(200)，其中，该处理器(220)进一步被配置用于将该线性模型(300)调整为经调整的线性模型，并对该经调整的线性模型执行用于验证该线性模型(300)而执行的步骤。

4.根据权利要求3所述的系统(200)，其中，该处理器(220)被配置用于基于变换该输入数据(315)来调整该线性模型(300)。

5.根据权利要求3或4所述的系统(200)，其中，该处理器(220)进一步被配置用于迭代地调整该线性模型(300)，直到确定该经调整的线性模型是有效的。

6.根据权利要求1至5中至少一项所述的系统(200)，其中，这些响应值(310)是所测量的植物产量值(310)，并且这些不同的解释值(320)与生长这些植物的不同田地(320)有关。</p>

7.根据权利要求6所述的系统(200)，其中，该系统(200)被配置用于如果该线性模型(300)被确定为是有效的，则基于该线性模型(300)控制在这些不同田地中的这些植物的生长。

8.根据权利要求1至7中至少一项所述的系统(200)，其中，该处理器(220)被配置用于基于该残差数据(335)生成至少两个不同的验证数据集(415，455，475)，并提供至少两个二元分类器(500；600)，每个二元分类器被配置用于确定相应的验证数据集(415，455，475)是否满足相应的验证条件，并且其中，该处理器(220)被配置用于基于该至少两个二元分类器的输出来确定该线性模型(300)是否有效(500；600)。

9.根据权利要求1至8中至少一项所述的系统(200)，其中，该二元分类器(500；600)是经训练的卷积神经网络(500；600)。

10.根据权利要求9所述的系统(200)，其中，该卷积神经网络至少有4个卷积层(512，516，518，524；612，616，618，624)。

11.根据权利要求9或10所述的系统(200)，其中，该卷积神经网络(500；600)具有以下架构：

12.一种用于验证线性模型的计算机实施的方法，该方法包括以下步骤：

13.根据权利要求12所述的计算机实施的方法，该方法包括一个或多个步骤：

14.一种用于验证线性模型(300)的计算机程序产品，其中，该计算机程序产品包括用于当该计算机程序产品在处理器(220)上运行时使该处理器(220)执行根据权利要求12或13所述的计算机实施的方法的程序代码装置。

15.一种计算机可读介质(230)，该计算机可读介质存储有如权利要求14所述的计算机程序产品。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于验证线性模型(300)的系统(200)，该系统(200)包括通信接口(210)和处理器(220)，

2.根据权利要求1所述的系统(200)，其中，该处理器(220)进一步被配置用于如果该线性模型(300)被确定为是有效的，则提供该线性模型(300)。

4.根据权利要求3所述的系统(200)，其中，该处理器(220)被配置用于基于变换该输入数据(315)来调整该线性模型(300)。

5.根据权利要求3或4所述的系统(200)，其中，该处理器(220)进一步被配置用于迭代地调整该线性模型(300)，直到确定该经调整的线性模型是有效的。

6.根据权利要求1至5中至少一项所述的系统(200)，其中，这些响应值(310)是所测量的植物产量值(310)，并且这些不同的解释值(320)与生长这些植物的不同田地(320)有关。

8.根据权利要求1至7中至少一项所述的系统(200)，其中，该处理器(220...

【专利技术属性】
技术研发人员：I·普罗克托，E·索埃克斯，G·克里提科斯，T·艾格斯，
申请(专利权)人：巴斯夫欧洲公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人