【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种知识问答方法、装置、设备和存储介质。
技术介绍
1、知识问答通常是用户向机器提出问题指令,由机器针对用户提出的指令给出对应的答复内容的过程。
2、当前大语言模型自定义知识库的构建方法为使用llamaindex创建文档数据索引,以使用自然语言搜索索引,从而在原始文档中搜索出相关片段后将由llamaindex检索并传递给大语言模型。具体地,llamaindex会将原始文档数据转换为查询友好的矢量化索引,并利用该索引根据查询和数据的匹配程度找到最相关的答案段落,之后,这些相关的答案段落将被发送到大语言模型,以便大语言模型具备必要的背景知识来回答用户提出的问题。
3、然而,通常会存在有些原始文档的内容十分庞大,而且其中可能存在大量重复或者碎片化的片段,因此,在通过索引查询时,可能会出现遗漏,因此,相关的答案段落将无法精确地被召回并被大语言模型所学习,导致大语言模型输出的答案准确度较低。
技术实现思路
1、本专利技术提供一种知识问答方法、装
...【技术保护点】
1.一种知识问答方法,其特征在于,包括:
2.根据权利要求1所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定目标段落,包括:
3.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定各段落的第一度量分数,包括:
4.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述候选段落的第一度量分数和所述第二度量分数,确定所述目标段落,包括:
5.根据权利要求2所述的知识问答方法,其特征在于,所述将所述待回答问题和所述候选段落输入机器阅读
...【技术特征摘要】
1.一种知识问答方法,其特征在于,包括:
2.根据权利要求1所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定目标段落,包括:
3.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定各段落的第一度量分数,包括:
4.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述候选段落的第一度量分数和所述第二度量分数,确定所述目标段落,包括:
5.根据权利要求2所述的知识问答方法,其特征在于,所述将所述待回答问题和所述候选段落输入机器阅读理解模型中,得到所述机器阅读理解模型输出的所述候选段落的第二度量分数,包括...
【专利技术属性】
技术研发人员:王思睿,管晓钱,代茹烟,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。