System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及数据处理,具体地涉及一种智能问答方法及其装置与电子设备。
技术介绍
1、随着互联网技术的发展,智能问答被应用于越来越多的场景中。
2、然而,针对用户问题,相关技术中仅在将数据以三元组(实体、属性、关系)形式进行存储的数据库或仅将数据以向量的形式进行存储的数据库中查找结果,并将所查找到的结果输入大模型中生成用户问题的答案。由于三元组形式的数据信息明确,因此查找准确率高,但由于三元组形式的数据信息简洁明确,但自然语言通常复杂多变,因此三元组形式的数据信息对自然语言理解有局限性,基于三元组形式的信息查找结果的召回率低,如此导致有时无法生成答案或所生成的答案无法全面的回答用户问题。而向量数据库对数据内容保存全面,但容易查找到多个与用户问题无关的结果,准确率较低,如此导致所生成的答案不准确。
技术实现思路
1、有鉴于此,本申请提供一种智能问答方法及其装置与电子设备,以解决相关技术中针对用户问题,仅在存储三元组形式的数据信息的数据库或仅在向量数据库中查找结果,并将所查找到的结果输入大模型中生成用户问题的答案,导致所查找的结果召回率较低或准确率较低,进而导致无法生成答案、答案不全面、答案不准确等问题。
2、第一方面,本申请实施例提供了一种智能问答方法,包括如下步骤:
3、获取用户问题,并根据用户问题获取待查询信息;
4、根据待查询信息在第一数据库中查询,第一数据库是将数据按照三元组形式进行存储;三元组用于表征出数据的实体与属性信息;
>5、若在第一数据库中未查询到结果,且在第二数据库中存在待查询信息对应的数据,则基于用户问题和待查询信息在第二数据库中查询,获取用户问题的答案,第二数据库是基于向量存储的,且第二数据库存储有目标数据,目标数据为与第一数据库存储的数据内容相同的数据。
6、在一种可能的实现方式中,基于用户问题和待查询信息在第二数据库中查询包括:
7、基于待查询信息查询预设对应关系;
8、根据预设对应关系确定第二数据库中数据的查询范围,预设对应关系包括待查询信息和第二数据库中存储的数据间的对应关系;
9、根据第二数据库中数据的查询范围在第二数据库中查询。
10、在一种可能的实现方式中,基于用户问题和待查询信息在第二数据库中查询,获取用户问题的答案包括:
11、基于用户问题和待查询信息在第二数据库中查询,获取用户问题的相似句;相似句是第二数据库中存储的用户问题和待查询信息相关的向量对应的语句数据;
12、若用户问题的相似句与用户问题的匹配度超过预设阈值,则基于用户问题的相似句获取用户问题的答案。
13、在一种可能的实现方式中,方法还包括:
14、若用户问题的相似句与用户问题的匹配度不超过预设阈值,则将预设拒绝回答信息作为用户问题的答案。
15、在一种可能的实现方式中,基于用户问题的相似句获取用户问题的答案包括:
16、根据用户问题的相似句获取段落数据;段落数据为第二数据库中存储的,相似句所在的段落数据;
17、对段落数据进行去重及排序处理,根据去重及排序处理后的段落数据获取用户问题的答案。
18、在一种可能的实现方式中,根据去重及排序处理后的段落数据获取用户问题的答案包括:
19、将去重及排序处理后的段落数据输入大模型,
20、得到大模型输出结果;
21、若大模型输出结果与用户问题的匹配度超过预设阈值,则将大模型输出结果作为用户问题的答案。
22、在一种可能的实现方式中,方法还包括:
23、若大模型输出结果与用户问题的匹配度不超过预设阈值,则将预设拒绝回答信息作为用户问题的答案。
24、在一种可能的实现方式中,方法还包括:若在第一数据库中查询到结果,则基于查询到的结果生成用户问题的答案。
25、在一种可能的实现方式中,基于查询到的结果生成用户问题的答案包括:
26、将查询到的结果输入大模型,得到大模型输出结果;
27、若大模型输出结果与用户问题的匹配度超过预设阈值,则将大模型输出结果作为用户问题的答案。
28、在一种可能的实现方式中,方法还包括:
29、若大模型输出结果与用户问题的匹配度未超过预设阈值,则基于用户问题在第二数据库中查询,获取用户问题的答案。
30、在一种可能的实现方式中,方法还包括:
31、若在第一数据库中未查询到结果,且在第二数据库中不存在待查询信息对应的数据,则基于用户问题在第二数据库中查询,获取用户问题的答案。
32、第二方面,本申请实施例提供了一种数据存储装置,包括:
33、获取单元,用于获取用户问题,并根据用户问题获取待查询信息;
34、处理单元,用于根据待查询信息在第一数据库中查询,第一数据库将数据按照三元组形式进行存储;三元组用于表征出数据的实体与属性信息;;若在第一数据库中未查询到结果,且在第二数据库中存在待查询信息对应的数据,则基于用户问题和待查询信息在第二数据库中查询,获取用户问题的答案,第二数据库是基于向量存储的,且第二数据库存储有目标数据,目标数据为第一数据库存储的数据。
35、第三方面,本申请实施例提供了一种电子设备,电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被处理器执行时,触发电子设备执行本申请实施例第一方面提供的方法。
36、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行本申请实施例第一方面提供的方法。
37、采用本申请实施例所提供的方案,先根据与所述用户问题相关的信息在第一数据库中查询结果,若在第一数据库中未查询到结果,且在第二数据库中存在待查询信息对应的数据,则基于用户问题和待查询信息在第二数据库中查询,获取用户问题的答案;第二数据库是基于向量存储的且存储有第一数据库存储的数据。如此将第一数据库与第二数据库结合查找,减小了因很多数据的三元组形式的数据信息难以抽取,导致答案召回率低的风险,减小了因第二数据库中向量数据库容易查找到多个与问题无关的数据,导致答案输出准确率较低的风险,充分利用了第一数据库查找准确率高及第二数据库查找内容全的特点,在尽可能得到答案的同时提高答案全面回答问题的概率及答案的准确率。
本文档来自技高网...【技术保护点】
1.一种智能问答方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于用户问题和待查询信息在第二数据库中查询包括:
3.根据权利要求1或2所述的方法,其特征在于,所述基于用户问题和待查询信息在第二数据库中查询,获取所述用户问题的答案包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,所述基于所述用户问题的相似句获取用户问题的答案包括:
6.根据权利要求5所述的方法,其特征在于,所述根据去重及排序处理后的段落数据获取用户问题的答案包括:
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:若在第一数据库中查询到结果,则基于查询到的结果生成用户问题的答案。
9.根据权利要求8所述的方法,其特征在于,所述基于查询到的结果生成用户问题的答案包括:
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
11.根据
12.一种数据存储装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被所述处理器执行时,触发所述电子设备执行权利要求1-11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1-11中任一项所述的方法。
...【技术特征摘要】
1.一种智能问答方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,所述基于用户问题和待查询信息在第二数据库中查询包括:
3.根据权利要求1或2所述的方法,其特征在于,所述基于用户问题和待查询信息在第二数据库中查询,获取所述用户问题的答案包括:
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求3所述的方法,其特征在于,所述基于所述用户问题的相似句获取用户问题的答案包括:
6.根据权利要求5所述的方法,其特征在于,所述根据去重及排序处理后的段落数据获取用户问题的答案包括:
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:若在第一数据库中查...
【专利技术属性】
技术研发人员:刘翠翠,袁斌,安旭,杨晓阳,岳保军,
申请(专利权)人:联通智网科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。