System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多粒度语义和大模型辅助的工业知识生成式决策方法技术_技高网
当前位置: 首页 > 专利查询>重庆大学专利>正文

基于多粒度语义和大模型辅助的工业知识生成式决策方法技术

技术编号:43357512 阅读:21 留言:0更新日期:2024-11-19 17:43
本发明专利技术公开了基于多粒度语义和大模型辅助的工业知识生成式决策方法,包括如下步骤:步骤一:将业务问题编码为高维的问题语义特征;步骤二:利用实体链接对多模态工业知识图谱进行处理;基于TOP‑K路径拓展,得到不同的子图;步骤三:采用图神经网络GNN捕捉子图中不同粒度特征,得到工业知识多粒度语义特征;步骤四:利用图卷积网络GCN对工业知识多粒度语义特征与问题语义特征进行统一融合;步骤五:构建基SPARQL编写查询的三元组采样流程,提取相关的三元组数据;步骤六:将结构化的三元组数据重写为自由格式文本,构建问题‑决策对数据集;步骤七:基于问题‑决策对数据集对大语言模型进行微调,获得知识文本增强的工业知识生成式决策模型。

【技术实现步骤摘要】

本专利技术属于工业智能决策,具体的为一种基于多粒度语义和大模型辅助的工业知识生成式决策方法


技术介绍

1、工业环境通常涉及复杂的操作流程和多样化的设备、资源及人员。有效决策能够管理这些复杂性,确保各环节协调运行,提高生产效率和减少错误。通过优化生产流程和资源分配,决策不仅提升了生产效率和产品质量,还帮助企业在激烈的市场竞争中保持成本优势。此外,工业环境中常常面临不确定性和风险,如市场变化、供应链中断、设备故障等。科学的决策方法可以提前识别和评估这些风险,并制定相应的应对策略,减少不确定性带来的负面影响。

2、然而,现有针对工业领域的决策方法在处理复杂的业务需求和知识匹配时往往不够精确,特别是在涉及大量专有名词和领域特定术语的情况下。传统方法对语义关系的理解和处理能力有限,难以全面捕捉和匹配不同层次的业务需求。工业决策通常需要综合多个数据源的信息,如传感器数据、文本报告、图像数据等。现有方法难以有效整合这些异构数据,导致信息利用效率低下。知识图谱的应用虽然有所改善,但在多模态数据的深度融合和语义理解上仍存在挑战。且传统决策方法往往只关注某一方面的数据或特征,缺乏对全局信息的综合分析,导致决策结果片面,难以应对实际业务中的复杂情况。例如,设备故障诊断可能只依赖于历史故障数据,而未能考虑设备运行的实时状态和环境因素。同时,决策过程依赖于人工经验和手工操作,自动化程度低,容易受到人为因素的影响。尤其在复杂和动态的生产环境中,决策过程的实时性和精准性难以保证,影响了生产的连续性和效率。因此,提升工业决策方法的精确性和自动化程度,尤其是在处理复杂和动态的生产环境时显得尤为重要。

3、多粒度语义信息建模方法旨在从不同粒度对句子建模,如实体级、句子级和主题级粒度。建模后需合并多粒度语义表示,形成最终语义表示。这些多粒度语义信息可以通过图神经网络(gnn)进行提取,gnn能够建模不同粒度语义向量间的依存关系,实现多粒度语义信息的建模,从而解决文本匹配任务中文本简短且包含特定领域词汇导致的语义稀疏和匹配准确率低的问题。通过这种方法,可以提高翻译质量和文本匹配的精度,增强模型在处理复杂语义关系中的能力。

4、知识图谱作为自然语言处理(nlp)领域的重要技术,通过将结构化的知识表示为图形结构,有效地提升了信息检索、问答系统等任务的性能。在知识图谱中,节点代表实体或概念,边表示实体之间的关系。知识图谱的构建和利用,需要解决实体识别、关系抽取和知识融合等关键问题。大语言模型(llm),如gpt和bert,通过预训练-微调范式在多种nlp任务中展现出强大的泛化能力,这些模型在构建知识图谱时也有显著应用。例如,通过预训练模型进行实体识别和关系抽取,能自动化地从海量文本中提取知识。


技术实现思路

1、有鉴于此,针对工业决策中知识匹配不精确、决策方案片面等问题,本专利技术的目的在于提供一种基于多粒度语义和大模型辅助的工业知识生成式决策方法,通过大语言模型辅助和多层次语义建模,有效整合多模态数据,能够提高决策的精度和自动化程度,提升决策方案的精准性和全周期性。

2、为达到上述目的,本专利技术提供如下技术方案:

3、一种基于多粒度语义和大模型辅助的工业知识生成式决策方法,包括如下步骤:

4、步骤一:基于工业业务问题的高维特征表示方法,构建基于bert大语言模型的业务问题语义特征嵌入模型,将业务问题编码为高维的问题语义特征;

5、步骤二:利用实体链接对多模态工业知识图谱进行多层特征提取和全局融合处理;基于top-k路径拓展,从每个主题实体扩展一条路径并引出相应的树,合并不同主题实体的树以形成一个统一的子图,得到不同的子图;

6、步骤三:采用图神经网络gnn捕捉子图中不同粒度特征,得到工业知识多粒度语义特征;

7、步骤四:利用图卷积网络gcn对工业知识多粒度语义特征与问题语义特征进行统一融合,使工业知识多粒度语义特征与问题语义特征在同一特征空间下进行语义特征融合,形成全周期工业知识的语义特征融合空间;

8、步骤五:构建基sparql编写查询的三元组采样流程,定义业务问题并转化为相应的sparql查询,从多模态工业知识图谱和语义特征融合空间提取相关的三元组数据;

9、步骤六:将结构化的三元组数据重写为自由格式文本,构建基于工业业务的问题-决策对数据集;

10、步骤七:基于问题-决策对数据集对大语言模型进行微调,获得知识文本增强的工业知识生成式决策模型。

11、进一步,所述步骤二中,基于top-k路径拓展,从每个主题实体扩展一条路径的方法步骤为:

12、21)将问题q编码为向量表示,通过线性分类层计算关系分布,选择概率最高的前k个关系作为一跳关系路径;

13、22)将问题q和前一步的关系路径连接作为输入,编码为向量表示后计算关系分布;根据预测关系路径的得分排序,实现不同子图的获取。

14、进一步,所述步骤21)还包括如下步骤:

15、211)给定问题q,使用plm对问题q进行编码并获得向量表示qv:

16、qv=plm(q)

17、其中:plm为预训练语言模型;

18、212)将向量表示qv输入线性分类层以预测潜在跳数h1,h2,...,hh的概率分布d′h:

19、

20、其中:linear为线性变换函数;是给定问题表示qv的跳数hc的概率:

21、

22、213)选择概率最高的跳数h作为预测结果:

23、

24、其中:h为潜在跳数的总数。

25、进一步,在训练期间,将地面真值分布dh表示为一个单热向量,其中真实跳数hgold的概率为1,其他跳数的概率为0:

26、

27、使用交叉熵损失lce,预测概率分布d′h会因与地面真实分布dh不同而受到惩罚:

28、

29、其中:为模型在训练过程中实际跳数分布中的概率。

30、进一步,所述步骤22)包括如下步骤:

31、221)将向量表示qv输入线性分类层计算知识图谱中r个关系的概率分布d′r,1:

32、

33、其中:是给定问题表示qv的关系rc的概率:

34、

35、选择概率最高的前k个关系作为第一跳关系路径p1;r表示为知识图谱中可能关系的总数;

36、222)在第t跳关系中,第t―1跳关系路径pt―1中的关系路径pt―1,i可以表示为:

37、pt―1,i=ri,1|ri,2|...|ri,t―1,i=1,2,...,kt―1

38、将问题q和关系路径pt―1,i用"|"连接起来作为输入序列qt:

39、qt=q|ri,1|ri,2|...|ri,t―1

40、qt被plm编码为向量表qt,v,通过线性分类层计算kg中的本文档来自技高网...

【技术保护点】

1.一种基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:包括如下步骤:

2.根据权利要求1所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤二中,基于TOP-K路径拓展,从每个主题实体扩展一条路径的方法步骤为:

3.根据权利要求2所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤21)还包括如下步骤:

4.根据权利要求3所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:在训练期间,将地面真值分布Dh表示为一个单热向量,其中真实跳数hgold的概率为1,其他跳数的概率为0:

5.根据权利要求2所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤22)包括如下步骤:

6.根据权利要求2所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤七中,对大语言模型进行微调的方法步骤为:

【技术特征摘要】

1.一种基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:包括如下步骤:

2.根据权利要求1所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤二中,基于top-k路径拓展,从每个主题实体扩展一条路径的方法步骤为:

3.根据权利要求2所述基于多粒度语义和大模型辅助的工业知识生成式决策方法,其特征在于:所述步骤21)还包括如下步骤:

4.根据权利要求3所述基于多粒...

【专利技术属性】
技术研发人员:杨波魏建东杜卡泽张正萍王昱
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1