知识问答方法、装置、设备和存储介质制造方法及图纸

技术编号:40433124 阅读:21 留言:0更新日期:2024-02-22 22:58
本发明专利技术提供一种知识问答方法、装置、设备和存储介质,应用于人工智能技术领域,该方法包括:获取待回答问题和至少一个候选文档;针对各候选文档,确定所述待回答问题与所述候选文档中各段落的匹配分数,所述匹配分数与所述待回答问题中的分词在所述段落中出现的频率、所述待回答问题中的分词在所述待回答问题中出现的频率和所述段落的长度相关;确定所述待回答问题与所述候选文档中各段落的语义相似度;基于各所述段落的所述匹配分数和所述语义相似度,确定目标段落;基于所述目标段落,确定所述待回答问题的答案信息。该方法可以提高召回的目标段落的准确性,从而可以提高大语言模型输出答案的准确度。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种知识问答方法、装置、设备和存储介质


技术介绍

1、知识问答通常是用户向机器提出问题指令,由机器针对用户提出的指令给出对应的答复内容的过程。

2、当前大语言模型自定义知识库的构建方法为使用llamaindex创建文档数据索引,以使用自然语言搜索索引,从而在原始文档中搜索出相关片段后将由llamaindex检索并传递给大语言模型。具体地,llamaindex会将原始文档数据转换为查询友好的矢量化索引,并利用该索引根据查询和数据的匹配程度找到最相关的答案段落,之后,这些相关的答案段落将被发送到大语言模型,以便大语言模型具备必要的背景知识来回答用户提出的问题。

3、然而,通常会存在有些原始文档的内容十分庞大,而且其中可能存在大量重复或者碎片化的片段,因此,在通过索引查询时,可能会出现遗漏,因此,相关的答案段落将无法精确地被召回并被大语言模型所学习,导致大语言模型输出的答案准确度较低。


技术实现思路

1、本专利技术提供一种知识问答方法、装置、设备和存储介质,本文档来自技高网...

【技术保护点】

1.一种知识问答方法,其特征在于,包括:

2.根据权利要求1所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定目标段落,包括:

3.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定各段落的第一度量分数,包括:

4.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述候选段落的第一度量分数和所述第二度量分数,确定所述目标段落,包括:

5.根据权利要求2所述的知识问答方法,其特征在于,所述将所述待回答问题和所述候选段落输入机器阅读理解模型中,得到所述...

【技术特征摘要】

1.一种知识问答方法,其特征在于,包括:

2.根据权利要求1所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定目标段落,包括:

3.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述段落的所述匹配分数和所述语义相似度,确定各段落的第一度量分数,包括:

4.根据权利要求2所述的知识问答方法,其特征在于,所述基于各所述候选段落的第一度量分数和所述第二度量分数,确定所述目标段落,包括:

5.根据权利要求2所述的知识问答方法,其特征在于,所述将所述待回答问题和所述候选段落输入机器阅读理解模型中,得到所述机器阅读理解模型输出的所述候选段落的第二度量分数,包括...

【专利技术属性】
技术研发人员:王思睿管晓钱代茹烟
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1