一种基于大语言模型的智能问答方法技术

技术编号:39437092 阅读:13 留言:0更新日期:2023-11-19 16:20
本发明专利技术提供了一种基于大语言模型的智能问答方法,根据用户的私有数据在本地创建问答库和资料库;问答库包括多个标准问题以及关联的标准答案;资料库包括多个标准段落;根据问题查询问答库和/或资料库;当问答库中存在与问题匹配的标准问题时,输出问答库中标准问题关联的标准答案,作为问题的答案;获取资料库中与问题匹配的标准段落,将标准段落和问题输入至大语言模型中;当大语言模型输出的答案与问题匹配时,可定义答案为问题的标准答案,加入问答库。该方法根据用户的私有数据创建问答库和资料库,并结合大语言模型共同完成智能问答,克服了部分领域公开的现成数据较少,大模型在该领域训练不充分,导致大模型在该领域精准度低的缺陷。准度低的缺陷。准度低的缺陷。

【技术实现步骤摘要】
一种基于大语言模型的智能问答方法


[0001]本专利技术属于人工智能
,具体涉及一种基于大语言模型的智能问答方法。

技术介绍

[0002]随着大语言模型的迭代更新,大语言模型的功能越来越通用和智能,其问答能力、文本生成能力更强,且在众多领域得到广泛使用。但是如果某些领域公开的现成数据较少,就会导致大语言模型在该领域训练过程中由于缺少训练数据,使得大语言模型在该领域表现得不够优秀。
[0003]因此,如何将各个领域更多的数据和大语言模型进行有机融合,进而提高问答的精准度,是目前面临的重要课题。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术提供一种基于大语言模型的智能问答方法,提高了问答的精准度。
[0005]第一方面,一种基于大语言模型的智能问答方法,包括:
[0006]根据用户的私有数据在本地创建问答库和资料库;问答库包括多个标准问题以及关联的标准答案;资料库包括多个标准段落;
[0007]接收问题;
[0008]根据问题查询问答库和/或资料库;
[0009]当问答库中存在与问题匹配的标准问题时,输出问答库中标准问题关联的标准答案,作为问题的答案;
[0010]获取资料库中与问题匹配的标准段落,将标准段落和问题输入至大语言模型中;当大语言模型输出的答案与问题匹配时,定义答案为问题的标准答案,加入问答库。
[0011]进一步地,问答库的创建方法包括:
[0012]手动输入已有的标准问题及对应的标准答案;
[0013]将私有数据输入至大语言模型中,以得到大语言模型输出的标准问题和标准答案;
[0014]根据标准问题计算标准问题语义向量;
[0015]将标准问题语义向量、标准问题和标准答案进行关联存储。
[0016]进一步地,问答库的匹配方法包括:
[0017]创建问答匹配函数;
[0018]根据问题查询问答库,以得到问答库输出的标准问题以及关联的标准问题语义向量;
[0019]当问答库输出的标准问题与所述问题语义向量距离落入问答匹配函数的问答匹配区域时,定义问答库输出的标准问题与问题匹配。
[0020]进一步地,问答匹配函数的创建方法包括:
[0021]获取一系列样本问题;
[0022]分别计算每个样本问题与相似问题、其他样本问题的语义向量距离;
[0023]在平面坐标上标出所有所述语义向量距离;
[0024]根据平面坐标上各点的分布,拟合出一条曲线,定义为所述问答匹配函数;
[0025]其中每个样本问题与相似问题、其他样本问题的语义向量距离的计算方法包括:
[0026]获取样本问题A;
[0027]计算样本问题A的语义向量;
[0028]将样本问题A输入至大语言模型中,定义大语言模型输出的多个标准问题为多个相似问题A1,A2,...,An;
[0029]分别计算相似问题A1,A2,...,An的相似问题语义向量,并求出它们与样本问题A的语义向量距离,分别得到TA1,TA2...TAn,语义向量距离在平面坐标上表示为(A,TA1),(A,TA2)...(A,TAn)的点;
[0030]分别计算其他样本问题B,C,...,N的语义向量,并求出它们与样本问题A的语义向量距离,分别得到TAB,TAC...TAN,语义向量距离在平面坐标上表示为(A,TAB),(A,TAC)...(A,TAN)。
[0031]进一步地,资料库的创建方法包括:
[0032]接收资料文档;
[0033]利用文档处理工具对资料文档进行预处理,以得到多个标准段落;
[0034]计算标准段落的标准段落语义向量;
[0035]将标准段落和标准段落语义向量进行关联存储。
[0036]进一步地,资料库的匹配方法包括:
[0037]创建资料匹配函数;
[0038]根据问题查询资料库,以得到资料库输出的多个标准段落;
[0039]将所有标准段落合并后输入至大语言模型;
[0040]当大语言模型输出的答案达到用户满意度时,定义大语言模型的输出的答案为标准答案,加入问答库。
[0041]进一步地,资料匹配函数的创建方法包括:
[0042]获取样本问题;
[0043]计算样本问题的语义向量;
[0044]将样本问题输入至大语言模型中,定义大语言模型输出的多个标准问题为多个相似问题;
[0045]分别计算各个相似问题的相似问题语义向量;
[0046]根据多个相似问题语义向量查询资料库,每个相似问题都得到最近语义向量距离和第n近语义向量距离;
[0047]以相似问题语义向量为横坐标,以语义向量距离为纵坐标建立平面坐标;
[0048]在平面坐标上,根据所有最近语义向量距离绘制第一曲线;根据所有第n近语义向量距离绘制第二曲线,以得到资料匹配函数;
[0049]定义第一曲线和第二曲线之间的区域为资料匹配区域。
[0050]进一步地,还包括:
[0051]将接收到的评价信息作为监督学习样本;
[0052]根据监督学习样本对大语言模型进行微调训练。
[0053]进一步地,还包括:
[0054]配置每个用户的问答权限;
[0055]依据问答权限为不同的用户提供不同的问答。
[0056]进一步地,还包括:
[0057]创建多个提示词模版;
[0058]显示用户选中的提示词模版。
[0059]由上述技术方案可知,本专利技术提供的基于大语言模型的智能问答方法,根据用户的私有数据创建问答库和资料库,并结合大语言模型共同完成智能问答,克服了部分领域公开的现成数据较少,大模型在该领域训练不充分,导致大模型在该领域精准度低的缺陷。
附图说明
[0060]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0061]图1为实施例提供的智能问答方法的流程图。
[0062]图2为实施例提供的问答库创建方法的流程图。
[0063]图3为实施例提供的问答匹配函数创建方法的流程图。
[0064]图4为实施例提供的资料库创建方法的流程图。
[0065]图5为实施例提供的资料库匹配方法的流程图。
[0066]图6为实施例提供的资料匹配函数创建方法的流程图。
具体实施方式
[0067]下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大语言模型的智能问答方法,其特征在于,包括:根据用户的私有数据在本地创建问答库和资料库;所述问答库包括多个标准问题以及关联的标准答案;所述资料库包括多个标准段落;接收问题;根据所述问题查询所述问答库和/或所述资料库;当所述问答库中存在与所述问题匹配的标准问题时,输出所述问答库中所述标准问题关联的标准答案,作为所述问题的答案;获取所述资料库中与所述问题匹配的标准段落,将所述标准段落和所述问题输入至大语言模型中;当所述大语言模型输出的答案与所述问题匹配时,定义所述答案为所述问题的标准答案,加入问答库。2.根据权利要求1所述基于大语言模型的智能问答方法,其特征在于,所述问答库的创建方法包括:手动输入已有的标准问题及对应的标准答案;将所述私有数据输入至所述大语言模型中,以得到大语言模型输出的标准问题和标准答案;根据所述标准问题计算标准问题语义向量;将所述标准问题语义向量、所述标准问题和所述标准答案进行关联存储。3.根据权利要求2所述基于大语言模型的智能问答方法,其特征在于,所述问答库的匹配方法包括:创建问答匹配函数;根据所述问题查询所述问答库,以得到所述问答库输出的标准问题以及关联的标准问题语义向量;当所述问答库输出的标准问题与所述问题的语义向量距离落入所述问答匹配函数的问答匹配区域时,定义所述问答库输出的标准问题与所述问题匹配。4.根据权利要求3所述基于大语言模型的智能问答方法,其特征在于,所述问答匹配函数的创建方法包括:获取一系列样本问题;分别计算每个样本问题与相似问题、其他样本问题的语义向量距离;在平面坐标上标出所有所述语义向量距离;根据平面坐标上各点的分布,拟合出一条曲线,定义为所述问答匹配函数;其中每个样本问题与相似问题、其他样本问题的语义向量距离的计算方法包括:获取样本问题A;计算所述样本问题A的语义向量;将所述样本问题A输入至所述大语言模型中,定义所述大语言模型输出的多个标准问题为多个相似问题A1,A2,...,An;分别计算相似问题A1,A2,...,An的相似问题语义向量,并求出它们与样本问题A的语义向量距离,分别得到TA1,TA2...TAn,所述语义向量距离在平面坐标上表示为(A,TA1),(A,TA2...

【专利技术属性】
技术研发人员:朱太和晏士康
申请(专利权)人:北京智慧火种科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1