问答方法技术

技术编号:39804385 阅读:8 留言:0更新日期:2023-12-22 02:35
本申请提供了一种问答方法

【技术实现步骤摘要】
问答方法、装置、存储介质及计算机设备


[0001]本申请涉及智能问答
,尤其涉及一种问答方法

装置

存储介质及计算机设备


技术介绍

[0002]随着人工智能的不断发展,一些大语言模型可以在大多数通用场景下具备较好的问答表现,但在面对一些专业领域或面对较新的知识时,由于大语言模型的训练数据针对专业领域或特定行业的覆盖度不够全面,因此现有技术容易出现问题理解不准确

知识过时或知识获取困难等问题,进而无法高效准确地回答问题


技术实现思路

[0003]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法高效准确地回答问题的技术缺陷

[0004]第一方面,本申请实施例提供了一种问答方法,所述方法包括:接收涉及目标专业领域的问题文本,并将所述问题文本转换为问题向量;若所述问题文本满足预设问题筛选规则,则确定目标知识库的数据量;其中,所述目标知识库包括多个涉及所述目标专业领域的专家知识向量,每个所述专家知识向量是根据预先获取的专家知识文本生成的;采用对应于所述数据量的快速匹配算法,从所述目标知识库中筛选出与所述问题向量语义相似度最高的
N
个所述专家知识向量作为目标知识向量;分别获取每个所述目标知识向量对应的目标专家知识文本,并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中,以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本
r/>[0005]第二方面,本申请实施例提供了一种问答装置,所述装置包括:问题接收模块,用于接收涉及目标专业领域的问题文本,并将所述问题文本转换为问题向量;数据量确定模块,用于若所述问题文本满足预设问题筛选规则,则确定目标知识库的数据量;其中,所述目标知识库包括多个涉及所述目标专业领域的专家知识向量,每个所述专家知识向量是根据预先获取的专家知识文本生成的;向量筛选模块,用于采用对应于所述数据量的快速匹配算法,从所述目标知识库中筛选出与所述问题向量语义相似度最高的
N
个所述专家知识向量作为目标知识向量;答案文本获取模块,用于分别获取每个所述目标知识向量对应的目标专家知识文本,并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中,以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本

[0006]第三方面,本申请实施例提供了一种存储介质,该存储介质中存储有计算机可读指令,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任
一实施例所述问答方法的步骤

[0007]第四方面,本申请实施例提供了一种计算机设备,该计算机设备包括:一个或多个处理器,以及存储器;所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行上述任一实施例所述问答方法的步骤

[0008]在本申请一些实施例提供的问答方法

装置

存储介质及计算机设备中,一方面,在接收到涉及目标专业领域的问题文本时,可以根据目标专业领域对应的目标知识库的数据量,采用与数据量相对应的快速匹配算法,对问题向量和目标知识库中的多条专家知识向量进行语义相似度匹配,从而可从目标知识库中快速筛选出与问题向量语义相似度最高的
N
条专家知识向量作为目标知识向量

另一方面,本申请通过将问题文本和每个目标知识向量对应的专家知识文本输入到大语言模型中,使得大语言模型可以学习目标专业领域中与问题文本关联度最高的专家知识文本,有助于通用的大语言模型成为目标专业领域相关的大语言模型,并可准确回答涉及目标专业领域的问题

由此可见,本申请可以高效准确地回答目标专业领域的相关问题,实现高效性与准确性的兼顾

附图说明
[0009]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图

[0010]图1为一个实施例中,问答方法的流程示意图之一;图2为一个实施例中,采用对应于数据量的快速匹配算法,从目标知识库中筛选出与问题向量语义相似度最高的
N
个专家知识向量作为目标知识向量步骤的流程示意图;图3为一个实施例中,向量生成的示意图;图4为一个实施例中,问答方法的流程示意图之二;图5为一个实施例中,问答方法的流程示意图之三;图6为一个实施例中,问答装置的示意性结构框图;图7为一个实施例中,计算机设备的内部结构图

具体实施方式
[0011]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例

基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围

[0012]在一个实施例中,本申请提供了一种问答方法

下述实施例以该方法应用于计算机设备为例进行说明,可以理解,本文的计算机设备可以是具备数据处理功能的设备,可以但不限于是电子终端

笔记本电脑

台式电脑

服务器等

[0013]如图1所示,本申请提供的问答方法可以包括如下步骤:
S102
:接收涉及目标专业领域的问题文本,并将问题文本转换为问题向量

[0014]其中,目标专业领域可以是任意专业领域,本文对此不作具体限制

为便于描述,本文一些实施例以目标专业领域为工业互联网领域作为示例进行说明,进一步地,工业互联网领域可以包括空压领域

中央空调云智控领域

知识问答领域等多个细分领域

问题文本可以是涉及目标专业领域的文本信息,问题向量可用于表示问题文本的语义内容特征

[0015]本步骤中,计算机设备可以接收问题文本并将该问题文本转换为问题向量,如此,可通过向量的形式来表示问题文本的语义内容,以便于计算机设备准确理解问题文本

可以理解,本申请可采用任意方式来实现文本与向量的转换,在一个示例中,计算机设备可以采用
embedding
模型将问题文本转换为问题向量

[0016]S104
:若问题文本满足预设问题筛选规则,则确定目标知识库的数据量;其中,目标知识库包括多个涉及目标专业领域的专家知识向量,每个专家知识向量是根据预先获取的专家知识文本生成的
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种问答方法,其特征在于,所述方法包括:接收涉及目标专业领域的问题文本,并将所述问题文本转换为问题向量;若所述问题文本满足预设问题筛选规则,则确定目标知识库的数据量;其中,所述目标知识库包括多个涉及所述目标专业领域的专家知识向量,每个所述专家知识向量是根据预先获取的专家知识文本生成的;采用对应于所述数据量的快速匹配算法,从所述目标知识库中筛选出与所述问题向量语义相似度最高的
N
个所述专家知识向量作为目标知识向量;分别获取每个所述目标知识向量对应的目标专家知识文本,并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中,以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本
。2.
根据权利要求1所述的问答方法,其特征在于,所述采用对应于所述数据量的快速匹配算法,从所述目标知识库中筛选出与所述问题向量语义相似度最高的
N
个所述专家知识向量作为目标知识向量,包括:在所述目标知识库中选取
m
个专家知识向量作为待匹配向量;其中,
m
不大于所述目标知识库的向量总数量;若所述数据量大于第一预设数据量阈值,则将
m
个1×
n
维的所述待匹配向量组合为
m
×
n
维的第一中间向量,并根据预设的分段数量
M
,将所述第一中间向量划分为
M
段第二中间向量;根据所述分段数量
M
,将所述问题向量划分为
M
段第三中间向量;基于
M
段所述第二中间向量
、M
段所述第三中间向量

每段所述第二中间向量在所述第一中间向量中的列位置和每段所述第三中间向量在所述问题向量中的列位置,分别确定所述问题向量与每个所述待匹配向量之间的待匹配向量距离;根据各个所述待匹配向量距离,筛选出与所述问题向量语义相似度最高的
N
个所述待匹配向量作为
N 个所述目标知识向量
。3.
根据权利要求2所述的问答方法,其特征在于,所述基于
M
段所述第二中间向量
、M
段所述第三中间向量

每段所述第二中间向量在所述第一中间向量中的列位置和每段所述第三中间向量在所述问题向量中的列位置,分别确定所述问题向量与每个所述待匹配向量之间的待匹配向量距离,包括:针对每段第二中间向量,根据预设的第一聚类类别数量
P
,对该第二中间向量中
m
个1×
k
维的子向量进行聚类,并得到
P
个第一聚类中心向量,且分别确定每个所述第一聚类中心向量的向量标识;
k

n/M
;针对每段第二中间向量,分别确定该第二中间向量中每个1×
k
维的子向量对应的目标标识,并基于每个子向量在该第二中间向量中的行列位置和每个子向量对应的目标标识,生成
m
×1维的第四中间向量,其中,每个子向量对应的目标标识为在该段第二中间向量对应的
P
个第一聚类中心向量中,与该子向量距离最近的第一聚类中心向量的向量标识;根据每段所述第二中间向量在所述第一中间向量中的列位置,将
M
个所述第四中间向量组合为
m
×
M
维的第五中间向量;针对每段第三中间向量,根据该第三中间向量在所述问题向量中的列位置确定目标第二中间向量,并分别...

【专利技术属性】
技术研发人员:雷翔周子叶张开元白皓郭媛
申请(专利权)人:广东蘑菇物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1