System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种问答处理方法、装置、设备及存储介质。
技术介绍
1、随着人工智能技术的不断发展,大模型的应用越来越广泛,构建大模型问答系统便是其中之一。
2、目前大模型问答系统在进行问答处理时,通常是将用户输入的问题、问题的特征向量与数据库中文档的特征向量进行匹配得到的与问题最接近的目标文档。大模型理解并分析用户的问题,根据目标文档快速准确地给出问题的答案。
3、但是,匹配得到目标文档往往存在信息缺失,导致大模型给出的答案不准确或遗漏内容。
技术实现思路
1、本申请提供一种问答处理方法、装置、设备及存储介质,用以解决现有技术中问答系统给出的答案不准确的问题。
2、第一方面,本申请提供一种问答处理方法,包括:
3、获取待回答问题并根据待回答问题生成问题向量;
4、确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,其中,关联向量表示与至少一个第一文本向量存在关联关系的向量,关联关系包括上下位关系、引用关系、补充关系和限制关系中的至少一个;
5、根据问题向量、至少一个第一文本向量和至少一个第一文本向量的关联向量,确定候选文本;
6、将候选文本和待回答问题输入至问答模型,使问答模型输出待回答问题的答案。
7、在一种可能的设计中,根据问题向量、至少一个第一文本向量和至少一个第一文本向量的关联向量,确定候选文本,包括:
8
9、将第二相似度大于或等于第二预设阈值的关联向量对应的文本、第二相似度小于第二预设阈值的关联向量对应的文本的描述信息、至少一个第一文本向量对应的文本、以及至少一个第一文本向量对应的文本与关联向量对应的文本之间的关联关系信息作为候选文本。
10、在一种可能的设计中,计算关联向量与问题向量的第二相似度,包括:
11、将关联向量按照预设关系分类;
12、分别将每类关联向量对应的文本与至少一个第一文本向量对应的文本进行聚类得到聚类文本;
13、将聚类文本与待回答问题进行语义相似度计算,得到每类关联向量与问题向量的第二相似度。
14、在一种可能的设计中,确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,包括:
15、根据待回答问题,确定目标文本向量的数量;
16、确定与问题向量的第一相似度大于第一预设阈值的多个第二文本向量;
17、若目标文本向量的数量为1,则确定第一相似度最大的第二文本向量为第一文本向量;
18、若目标文本向量的数量不为1,则确定多个第二文本向量为第一文本向量。
19、在一种可能的设计中,确定与问题向量的第一相似度大于第一预设阈值的多个第二文本向量之后,还包括:
20、若目标文本向量的数量为1,则将多个第二文本向量按照文件分为多组,其中,每组第二文本向量对应的文本属于同一文件;
21、确定第二文本向量数量最多的组中所有第二文本向量为第一文本向量。
22、在一种可能的设计中,方法还包括:
23、将预设文件拆分为多个文本并确定多个文本之间的关联关系,其中,存在关联关系的文本互为关联文本;
24、根据多个文本,生成多个文本向量,其中,存在关联关系的文本对应的向量互为关联向量;
25、将多个文本向量存储至向量数据库;
26、确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,具体为:
27、从向量数据库中确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量。
28、在一种可能的设计中,将预设文件拆分为多个文本并确定多个文本之间的关联关系之后,还包括:
29、将多个文本以树状图的形式进行存储,将多个文本之间的关联关系以连接边的形式添加至树状图中。
30、在一种可能的设计中,将多个文本向量存储至向量数据库之后,还包括:
31、将向量数据库中的多个文本向量分别与树状图中的多个文本进行关联存储;
32、确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,具体包括:
33、确定与至少一个第一文本向量对应的文本;
34、根据树状图,确定与至少一个第一文本向量对应的文本的关联文本;
35、从向量数据库中,确定关联文本对应的向量为至少一个第一文本向量的关联向量。
36、第二方面,本申请提供一种问答处理装置,包括:
37、获取模块,用于获取待回答问题并根据待回答问题生成问题向量;
38、确定模块,用于确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,其中,关联向量表示与至少一个第一文本向量存在关联关系的向量,关联关系包括上下位关系、引用关系、补充关系和限制关系中的至少一个;
39、确定模块,还用于根据问题向量、至少一个第一文本向量和至少一个第一文本向量的关联向量,确定候选文本;
40、处理模块,用于将候选文本和待回答问题输入至问答模型,使问答模型输出待回答问题的答案。
41、第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器;存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如上第一方面以及第一方面任意一种可能的设计中的问答处理方法。
42、第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上第一方面以及第一方面任意一种可能的设计中的问答处理方法。
43、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时,实现如上第一方面以及第一方面任意一种可能的设计中的问答处理方法。
44、本申请提供的问答处理方法、装置、设备及存储介质,通过获取待回答问题并根据待回答问题生成问题向量;确定与问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及至少一个第一文本向量的关联向量,其中,关联向量表示与至少一个第一文本向量存在关联关系的向量,关联关系包括上下位关系、引用关系、补充关系和限制关系中的至少一个;根据问题向量、至少一个第一文本向量和至少一个第一文本向量的关联向量,确定候选文本;将候选文本和待回答问题输入至问答模型,使问答模型输出待回答问题的答案。由于是根据问题向量、至少一个第一文本向量和至少一个第一文本向量的关联向量来确定候选文本,其中考虑到关联向量以及关联关系对问答模型回答问题的本文档来自技高网...
【技术保护点】
1.一种问答处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述问题向量、所述至少一个第一文本向量和所述至少一个第一文本向量的关联向量,确定候选文本,包括:
3.根据权利要求2所述的方法,其特征在于,所述计算所述关联向量与所述问题向量的第二相似度,包括:
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述确定与所述问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及所述至少一个第一文本向量的关联向量,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定与所述问题向量的第一相似度大于第一预设阈值的多个第二文本向量之后,还包括:
6.根据权利要求1-3中任意一项所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述将预设文件拆分为多个文本并确定所述多个文本之间的关联关系之后,还包括:
8.根据权利要求7所述的方法,其特征在于,所述将所述多个文本向量存储至向量数据库之后,还包括:
9.一种问答处理装置
10.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-8中任一项所述的方法。
12.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法。
...【技术特征摘要】
1.一种问答处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述问题向量、所述至少一个第一文本向量和所述至少一个第一文本向量的关联向量,确定候选文本,包括:
3.根据权利要求2所述的方法,其特征在于,所述计算所述关联向量与所述问题向量的第二相似度,包括:
4.根据权利要求1-3中任意一项所述的方法,其特征在于,所述确定与所述问题向量的第一相似度大于第一预设阈值的至少一个第一文本向量以及所述至少一个第一文本向量的关联向量,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定与所述问题向量的第一相似度大于第一预设阈值的多个第二文本向量之后,还包括:
6.根据权利要求1-3中任意一项所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:戴菀庭,罗奕康,聂砂,郑江,丁苏苏,张士存,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。