基于大语言模型和顺序因果链约束的因果学习方法与系统技术方案

技术编号：40672281 阅读：5 留言：0更新日期：2024-03-18 19:09

本发明专利技术公开了一种基于大语言模型和顺序因果链约束的因果学习方法与系统，基于大型语言模型的潜力，通过引导大型语言模型推导出链式因果关系，并根据因果链中的变量顺序获取顺序约束，此举旨在挖掘因果关系的直接和间接联系，过滤与因果无关的变量，并降低在因果学习过程中计算因果关系的复杂性。此外，本发明专利技术避免了因混淆相关性和因果性而产生的误解，进一步提高了因果学习的准确性。通过应用这种方法，目标是实现更精确且效率更高的因果学习。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能、自然语言处理和机器学习，尤其涉及一种基于大语言模型和顺序因果链约束的因果学习方法与系统。

技术介绍

1、因果学习是人工智能，特别是在机器学习中的重要研究方向，其目标是从观测数据中发现变量之间的因果关系。这些关系对于理解复杂系统的行为，预测未来事件，以及制定有效的干预策略至关重要。然而，因果关系的发现是具有挑战性的，特别是在面对大规模数据集和噪声数据的时候。在这样的环境中，传统的因果学习方案往往需要进行大量的计算，且对样本数量和噪声的敏感性高。这使得在现实世界的应用中，这些方法的效率和精度受到限制。随着大数据和计算能力的发展，现代因果学习方法需要能够有效地处理大规模，高维度，和噪声数据，并在这些环境中准确地发现因果关系。因此，新的因果学习方法应能够在处理大规模数据和噪声数据时，保持高效率和高精度，以满足现代数据环境的需求。

2、申请号为cn202310743834.0的中国专利技术专利申请《一种基于条件独立性测试和连续优化的因果发现方法》。其首先利用条件独立性测试建立掩盖矩阵，然后基于掩盖矩阵设计连续优化损失函数中的约束项。此外，还利用变分自编码器和结构因果模型结合建立变分图自编码器模型，并导出对应的证据下界目标函数。最后，基于二次罚函数法优化等式约束优化问题得到权重矩阵。然而，这种方法在处理较少样本和异质噪声场景下发现因果关系的能力尚有限。

3、申请号为cn202310588420.5的中国专利技术专利申请《一种基于因果发现老年慢病的医学风险要素分析方法》。其利用因果发现算法挖掘老

4、申请号为cn202310518076.2的中国专利技术专利申请《一种基于互信息度量的时序数据因果发现方法》。该方法在确定时间序列变量间存在混杂因子的情况下，采用pcsmi算法实现因果发现，以构建概要因果图。在确定时间序列变量间不存在混杂因子的情况下，采用fcismi算法实现因果发现，以构建概要因果图。该方法对概要因果图、因果概要互信息和条件因果概要互信息进行定义，并在此基础上推导出基于因果互信息的时序变量定向规则。

5、申请号为cn202310540168.0的中国专利申请《数字农业信息的分层因果发现方法、装置、介质及设备》。其获取数字农业信息的数据集，构建包括高层策略和低层策略两层分层结构的因果发现框架。通过高层策略获取数据集的因果分割集合，将数据集转换为多个因果变量子集合组成的因果变量子集族。然后通过低层策略对每一个因果变量子集合进行因果发现，获取每一个因果变量子集合的因果发现结果。最后，通过高层策略将所有因果发现结果合并，获取数据集中全部变量的因果关系。本专利技术能够有效降低独立性测试的复杂性，能够显著提高大规模变量情况下的因果发现效率。

6、以上方案在各自的应用领域中都取得了一定的效果，但是仍然存在一些共性的问题和挑战。例如，这些方法普遍对样本数量和噪声的敏感性高，这导致在处理大规模和噪声数据时，其效率和精度都受到限制。此外，当面对大规模变量时，这些方法往往需要进行大量的计算，这在实际应用中可能导致计算资源的大量消耗和计算效率的下降。尽管各个方法在特定的研究领域和问题中有其独特的优点，但这些共性问题和挑战仍然阻碍了这些方法在更广泛的应用领域中的应用。

技术实现思路

1、本专利技术的目的是提供一种基于大语言模型和顺序因果链约束的因果学习方法与系统，可以提高因果学习的准确性，实现更精确且效率更高的因果学习，从而更准确的预测未来事件，进而制定有效的干预策略。

2、本专利技术的目的是通过以下技术方案实现的：

3、一种基于大语言模型和顺序因果链约束的因果学习方法，包括：

4、从观察数据中获取待研究变量集合，确定观察数据所处领域，并获取各个待研究变量对应的文字描述，基于大语言模型进行链式因果推理，获得包含待研究变量因果顺序的顺序链；

5、利用顺序链构建顺序图并判断是否存在循环顺序，若存在，则基于有向无环图消除循环顺序，获得新的顺序图，根据所述顺序图或新的顺序图确定顺序约束；

6、基于所述顺序约束进行因果学习，获得所有待研究变量的顺序。

7、一种基于大语言模型和顺序因果链约束的因果学习系统包括：

8、基于大语言模型的顺序链获取单元，用于从观察数据中获取待研究变量集合，确定观察数据所处领域，并获取各个待研究变量对应的文字描述，基于大语言模型进行链式因果推理，获得包含待研究变量因果顺序的顺序链；

9、基于有向无环图的循环顺序消除单元，用于利用顺序链构建顺序图并判断是否存在循环顺序，若存在，则基于有向无环图消除循环顺序，获得新的顺序图，根据所述顺序图或新的顺序图确定顺序约束；

10、基于顺序约束的因果学习单元，用于基于所述顺序约束进行因果学习，获得所有待研究变量的顺序。

11、一种处理设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

12、其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现前述的方法。

13、一种可读存储介质，存储有计算机程序，当计算机程序被处理器执行时实现前述的方法。

14、由上述本专利技术提供的技术方案可以看出，基于大型语言模型的潜力，通过引导大型语言模型推导出链式因果关系，并根据因果链中的变量顺序获取顺序约束，此举旨在挖掘因果关系的直接和间接联系，过滤与因果无关的变量，并降低在因果学习过程中计算因果关系的复杂性。此外，本专利技术避免了因混淆相关性和因果性而产生的误解，进一步提高了因果学习的准确性。通过应用这种方法，目标是实现更精确且效率更高的因果学习。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，包括：

2.根据权利要求1所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述基于大语言模型进行链式因果推理，获得包含待研究变量因果顺序的顺序链包括：

3.根据权利要求2所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述为因果链集合C中的每一条因果链指定顺序，获得对应的顺序链包括：

4.根据权利要求1所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述利用顺序链构建顺序图表示为：

5.根据权利要求4所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述基于有向无环图消除循环顺序，获得新的顺序图包括：

6.根据权利要求4所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述根据所述顺序图或新的顺序图确定顺序约束包括：

7.根据权利要求1所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述基于所述顺序约束进行因果学习，获得所有待研究变量的顺序包括：

8.一种基于大语言模型和顺序因果链约束的因果学习系统，其特征在于，包括：

9.一种处理设备，其特征在于，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

10.一种可读存储介质，存储有计算机程序，其特征在于，当计算机程序被处理器执行时实现如权利要求1～7任一项所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，包括：

3.根据权利要求2所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述为因果链集合c中的每一条因果链指定顺序，获得对应的顺序链包括：

4.根据权利要求1所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述利用顺序链构建顺序图表示为：

5.根据权利要求4所述的一种基于大语言模型和顺序因果链约束的因果学习方法，其特征在于，所述基于有向无环图...

【专利技术属性】
技术研发人员：陈欢欢，王翔宇，班泰瑜，陈律舟，杨立山，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人