System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其是一种知识问答方法、系统、装置及存储介质。
技术介绍
1、语言模型在知识问答、路线导航、客服系统等多个领域有重要的应用;语言模型在生成连贯回答或流畅续写方面非常有效。在生成过程中,主要依赖两个知识来源:(1)先验知识,这是在预训练期间学习的并存储在模型参数中的隐含知识;(2)上下文知识,这是作为外部上下文输入传递给语言模型。相关技术中的语言模型能够依据先验知识进行回答信息的准确预测,然而,回答信息对于上下文的相关性不佳,可能存在回答信息与上下文矛盾的情况。对此,相关技术中通过对先验知识和上下文进行权重设置后影响模型训练过程,以提升预测准确度。但是,该方案需要人为调整权重,无法区分上下文的不同重要程度;需依靠人的经验知识,对模型预测准确度的提升有限;同时需要对模型进行调整,耗时耗力。
技术实现思路
1、本专利技术的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
2、为此,本专利技术的目的在于提供一种高准确度的知识问答方法、系统、装置及存储介质。
3、为了达到上述技术目的,本专利技术实施例所采取的技术方案包括:
4、一方面,本专利技术实施例提供了一种知识问答方法,包括以下步骤:
5、本专利技术实施例的知识问答方法,该方法包括:获取输入信息和上下文信息;将所述输入信息和所述上下文信息输入大语言模型,得到第一概率分布;所述第一概率分布用于表征基于所述输入信息和所述上下文信息预测的回答信息及对应的概率;将所
6、另外,根据本专利技术上述实施例的知识问答方法,还可以具有以下附加的技术特征:
7、进一步地,本专利技术实施例的知识问答方法,所述根据所述上下文信息、所述第一概率分布和所述第二概率分布,确定调整因子,包括:
8、根据所述第一概率分布和所述第二概率分布的关系,确定第一数值;
9、以所述第一数值为底数,以第一参数为指数确定调整因子;所述第一参数用于调节预测的回答信息对所述上下文信息的关注程度。
10、进一步地,在本专利技术的一个实施例中,所述方法还包括:
11、若所述第一概率分布与所述第二概率分布相同,确定所述第一参数为0;
12、或者,若所述第一概率分布与所述第二概率分布的相似度大于第一阈值,确定所述第一参数为第二数值;
13、或者,若所述第一概率分布与所述第二概率分布的相似度小于或等于所述第一阈值,确定所述第一参数为第三数值;所述第三数值大于所述第二数值。
14、进一步地,在本专利技术的一个实施例中,所述方法还包括以下步骤:
15、根据所述第一概率分布与所述第二概率分布,确定第一散度;所述第一散度与所述第一概率分布与所述第二概率分布的商相关;
16、根据所述第一概率分布与所述第二概率分布,确定第二散度;所述第二散度与所述第二概率分布与所述第一概率分布的商相关;
17、对所述第一散度和所述第二散度取平均,确定第一参数。
18、进一步地,在本专利技术的一个实施例中,所述通过所述调整因子更新所述第一概率分布,得到第三概率分布,包括:
19、通过所述调整因子更新所述第一概率分布,并进行归一化处理,得到第四概率分布;
20、将所述第四概率分布通过全连接层处理,得到第三概率分布。
21、进一步地,在本专利技术的一个实施例中,所述大语言模型通过以下步骤训练得到:
22、获取输入信息样本;所述输入信息样本包括与所述输入信息相对应的回答信息的真实结果;
23、将所述输入信息样本通过大语言模型处理,得到样本预测结果;
24、根据所述样本预测结果与所述真实结果之间的误差,对所述大语言模型进行训练,直至所述误差小于或等于预设阈值。
25、进一步地,在本专利技术的一个实施例中,所述对所述第三概率分布进行采样操作,确定目标回答信息,包括:
26、确定第二阈值;根据概率排名,从所述第三概率分布中确定若干概率分布,对所述若干概率分布进行采样操作,确定目标回答信息;所述若干概率分布的数量为所述第二阈值;
27、或者,确定第三阈值,通过所述第三阈值对所述第三概率分布进行更新操作,对所述更新后的第三概率分布进行采样操作,确定目标回答信息。
28、另一方面,本专利技术实施例提出了一种知识问答系统,包括:
29、第一模块,用于获取输入信息和上下文信息;
30、第二模块,用于将所述输入信息和所述上下文信息输入大语言模型,得到第一概率分布;所述第一概率分布用于表征基于所述输入信息和所述上下文信息预测的回答信息及对应的概率;
31、第三模块,用于将所述输入信息输入所述大语言模型,得到第二概率分布;
32、第四模块,用于根据所述上下文信息、所述第一概率分布和所述第二概率分布,确定调整因子;并通过所述调整因子更新所述第一概率分布,得到第三概率分布;
33、第五模块,用于对第三概率分布进行采样操作,确定目标回答信息。
34、另一方面,本专利技术实施例提供了一种知识问答装置,包括:
35、至少一个处理器;
36、至少一个存储器,用于存储至少一个程序;
37、当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的知识问答方法。
38、另一方面,本专利技术实施例提供了一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现上述的知识问答方法。
39、本专利技术实施例的知识问答方法,该方法包括:获取输入信息和上下文信息;将所述输入信息和所述上下文信息输入大语言模型,得到第一概率分布;所述第一概率分布用于表征基于所述输入信息和所述上下文信息预测的回答信息及对应的概率;将所述输入信息输入所述大语言模型,得到第二概率分布;根据所述上下文信息、所述第一概率分布和所述第二概率分布,确定调整因子;并通过所述调整因子更新所述第一概率分布,得到第三概率分布;对第三概率分布进行采样操作,确定目标回答信息。本申请实施例通过输入信息和上下信息生成第一概率分布,并通过输入信息生成第二概率分布;根据第一概率分布和第二概率分布的关系,对第一概率分布进行调整后采样得到目本文档来自技高网...
【技术保护点】
1.一种知识问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的知识问答方法,其特征在于,所述根据所述上下文信息、所述第一概率分布和所述第二概率分布,确定调整因子,包括:
3.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:
4.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括以下步骤:
5.根据权利要求1所述的知识问答方法,其特征在于,所述通过所述调整因子更新所述第一概率分布,得到第三概率分布,包括:
6.根据权利要求1所述的知识问答方法,其特征在于,所述大语言模型通过以下步骤训练得到:
7.根据权利要求1所述的知识问答方法,其特征在于,所述对所述第三概率分布进行采样操作,确定目标回答信息,包括:
8.一种知识问答系统,其特征在于,包括:
9.一种知识问答装置,其特征在于,包括:
10.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于实现如权利要求1至7中任一项所述的知识问答方
...【技术特征摘要】
1.一种知识问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的知识问答方法,其特征在于,所述根据所述上下文信息、所述第一概率分布和所述第二概率分布,确定调整因子,包括:
3.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括:
4.根据权利要求2所述的知识问答方法,其特征在于,所述方法还包括以下步骤:
5.根据权利要求1所述的知识问答方法,其特征在于,所述通过所述调整因子更新所述第一概率分布,得到第三概率分布,包括:
<...【专利技术属性】
技术研发人员:邹阳,阮宜龙,张云龙,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。