System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型结果的输出方法、装置、电子设备及存储介质制造方法及图纸_技高网

模型结果的输出方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40317495 阅读:9 留言:0更新日期:2024-02-07 21:00
本申请公开了一种模型结果的输出方法、装置、电子设备及存储介质,属于人工智能技术领域。其中,该方法包括:获取知识图谱中所有实体对应的实体向量和所有关系对应的关系向量,其中,所述实体包括头实体和尾实体,所述知识图谱包括多个三元组,每个三元组包括头实体、尾实体、以及所述头实体和所述尾实体的关系;针对所述知识图谱中的每个三元组,根据所述实体向量和所述关系向量计算头实体、关系和尾实体的分值;获取待推理的目标问题,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案。通过本申请,解决了相关技术中语言模型输出的推理结果的准确度较低的技术问题。

【技术实现步骤摘要】

本申请涉及人工智能,具体而言,涉及一种模型结果的输出方法、装置、电子设备及存储介质


技术介绍

1、大型语言模型llms(language and logic models)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径,相比以往知识图谱的方式,具有更加高效智能可扩展等优势。然而,大型语言模型是黑箱模型,常常难以捕获和获取事实知识,即缺乏事实知识。相关技术中,语言模型输出的推理结果的准确度较低。

2、针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。


技术实现思路

1、本申请提供了一种模型结果的输出方法、装置、电子设备及存储介质,以解决相关技术中存在的上述技术问题。

2、根据本申请的一个实施例,提供了一种模型结果的输出方法,包括:获取知识图谱中所有实体对应的实体向量和所有关系对应的关系向量,其中,所述实体包括头实体和尾实体,所述知识图谱包括多个三元组,每个三元组包括头实体、尾实体、以及所述头实体和所述尾实体的关系;针对所述知识图谱中的每个三元组,根据所述实体向量和所述关系向量计算头实体、关系和尾实体的分值;获取待推理的目标问题,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案。

3、根据本申请的另一个实施例,提供了一种模型结果的输出装置,包括:获取模块,用于获取知识图谱中所有实体对应的实体向量和所有关系对应的关系向量,其中,所述实体包括头实体和尾实体,所述知识图谱包括多个三元组,每个三元组包括头实体、尾实体、以及所述头实体和所述尾实体的关系;计算模块,用于针对所述知识图谱中的每个三元组,根据所述实体向量和所述关系向量计算头实体、关系和尾实体的分值;输出模块,用于获取待推理的目标问题,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案。

4、可选地,所述输出模块包括第一输出单元,用于针对所述知识图谱中的每个三元组,对所述头实体h和所述尾实体t通过所述关系r进行第一转换,得到所述头实体h的关系表示e_h=r*h,以及所述尾实体t的关系表示e_t=r*t;采用以下公式计算所述头实体h、所述关系r和所述尾实体t的第一分值:score1(h, r, t) = e_h * r * e_t+m,其中,所述m为所述知识图谱的调优阀值,score1(h, r, t)表示第一分值;最小化所述知识图谱中的正三元组的第一分值,并最大化所述知识图谱中的负三元组的第一分值,获取第一分值在预设阈值内的三元组集合;采用所述三元组集合训练所述语言模型,得到推理模型,将所述目标问题的目标头实体和目标关系输入所述推理模型,得到分值最大的目标尾实体;将所述分值最大的目标尾实体输出为与所述目标问题最匹配的目标答案。

5、可选地,所述模型结果的输出装置还包括扩展模块,用于将所述目标头实体、所述目标关系和所述目标尾实体组成目标三元组;将所述目标三元组添加至所述知识图谱中。

6、可选地,所述模型结果的输出装置还包括映射模块,用于调用激活函数sigmoid函数;采用所述sigmoid函数,将计算得出的所述头实体h、所述关系r和所述尾实体t的分值映射到[0, 1]的概率空间,将映射后的值作为第一分值。

7、可选地,所述输出模块包括第二输出单元,用于针对所述知识图谱中的每个三元组,对所述头实体h和所述尾实体t通过所述关系r进行第二转换,得到所述头实体h的关系表示e_h = h + r,以及所述尾实体t的关系表示e_t = t + r;采用以下公式计算所述头实体h、所述关系r和所述尾实体t的第二分值:score2(h, r, t) = ||e_h + r+m - e_t||_2,其中,m为所述知识图谱的调优阀值,||.||_2表示l2范数,score2(h, r, t) 为第二分值;最小化所述知识图谱中的正三元组的第二分值,并最大化所述知识图谱中的负三元组的第二分值,获取第二分值在预设阈值内的三元组集合;采用所述三元组集合训练所述语言模型,得到推理模型,将所述目标问题的目标头实体和目标关系输入所述推理模型,得到分值最小的目标尾实体;将所述分值最小的目标尾实体输出为与所述目标问题最匹配的目标答案。

8、可选地,所述模型结果的输出装置还包括训练模块,用于获取所述目标头实体对应的头实体向量、所述目标尾实体对应的尾实体向量、以及所述目标关系对应的关系向量;将所述头实体向量、所述尾实体向量、以及所述关系向量作为训练数据输入初始语言模型进行训练,得到训练完成的所述语言模型。

9、可选地,所述输出模块包括第三输出单元,用于针对所述知识图谱中的每个三元组,对所述头实体h和所述尾实体t通过所述关系r进行第三转换,得到所述头实体h的关系表示e_h = h - r * r_h,以及所述尾实体t的关系表示e_t = t - r * r_t ,r_h和r_t分别是所述关系r在所述头实体h和所述尾实体t上的投影向量;采用以下公式计算所述头实体h、所述关系r和所述尾实体t的第三分值:score3(h, r, t) = ||e_h + r+m - e_t||_2,其中,m为所述知识图谱的调优阀值,||.||_2表示l2范数,score3(h, r, t)为第三分值;最小化所述知识图谱中的正三元组的第三分值,并最大化所述知识图谱中的负三元组的第三分值,获取第三分值在预设阈值内的三元组集合;获取所述目标问题的提示词,采用所述三元组集合和所述提示词训练所述语言模型,得到推理模型,将所述目标问题的目标头实体和目标关系输入所述推理模型,得到分值最小的目标尾实体;将所述分值最小的目标尾实体输出为与所述目标问题最匹配的目标答案。

10、根据本申请的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项装置实施例中的步骤。

11、根据本申请的又一个实施例,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。

12、根据本申请的又一个实施例,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。

13、通过本申请实施例,获取知识图谱中所有实体对应的实体向量和所有关系对应的关系向量,其中,实体包括头实体和尾实体,知识图谱包括多个三元组,每个三元组包括头实体、尾实体、以及头实体和尾实体的关系;针对知识图谱中的每个三元组,根据实体向量和关系向量计算头实体、关系和尾实体的分值;获取待推理的目标问题,采用语言模型根据分值输出与目标问题匹配度最高的目标答案,采用语言模型进行推理具备高效、可扩展的性能,但具有缺乏事实知识的缺陷,知识图谱为结构化知识模型,本文档来自技高网...

【技术保护点】

1.一种模型结果的输出方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在将所述分值最大的目标尾实体输出为与所述目标问题最匹配的目标答案之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在最小化所述知识图谱中的正三元组的第一分值之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案包括:

5.根据权利要求4所述的方法,其特征在于,在将所述分值最小的目标尾实体输出为与所述目标问题最匹配的目标答案之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案包括:

7.一种模型结果的输出装置,其特征在于,包括:

8.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:

9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至6中任一项所述的方法步骤。

...

【技术特征摘要】

1.一种模型结果的输出方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在将所述分值最大的目标尾实体输出为与所述目标问题最匹配的目标答案之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,在最小化所述知识图谱中的正三元组的第一分值之前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,采用语言模型根据所述分值输出与所述目标问题匹配度最高的目标答案包括:

5.根据权利要求4所述的方法,其特征在于,在将所述分值最小的目标尾实体输...

【专利技术属性】
技术研发人员:赵鹏辉李绍斌唐杰史欣宇黄鑫
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1