问答模型的确定方法、问答方法、装置、介质、设备制造方法及图纸

技术编号:34280250 阅读:75 留言:0更新日期:2022-07-24 18:09
本公开涉及人工智能技术领域,提供了一种问答模型的确定方法及装置、问答方法及装置、计算机可读存储介质和电子设备。其中,上述问答模型的确定方法包括:基于第一样本对候选语言表征模型进行训练,确定出目标语言表征模型;获取第二样本和所述第二样本对应的样本标签,基于目标语言表征模型分别得到第二样本对应的第一文本编码向量和样本标签对应的第二文本编码向量;根据第一文本编码向量和每个预设子模块的样本标签对应的第二文本编码向量,分别对每个预设子模块对应的初始子预测模型进行训练,以得到每个预设子模块对应的目标子预测模型;根据目标语言表征模型和每个目标子预测模型,确定医疗知识的问答模型。本方案能提高问答的准确性。提高问答的准确性。提高问答的准确性。

Determination method, question and answer method, device, medium and equipment of question and answer model

【技术实现步骤摘要】
问答模型的确定方法、问答方法、装置、介质、设备


[0001]本公开涉及人工智能
,具体而言,涉及一种问答模型的确定方法、问答模型的确定装置、问答方法、问答装置、计算机可读存储介质、以及电子设备。

技术介绍

[0002]在信息化时代,通过智能问答系统可以辅助人们快速的获取到自己想要了解的信息。
[0003]相关技术中,智能问答都是基于规则配置的,会预先配置好一些关键词和其关联的答案,当输入的问题和预先配置的关键词相近时,就会输出与预先配置的关键词关联的答案。
[0004]然而,这种方式由于问答数量有限,不够灵活,所以会降低对问答的准确性,且需要人为预先去配置相关的问题和答案,效率低下。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种问答模型的确定方法及装置、问答方法及装置、计算机可读存储介质及电子设备,进而至少在一定程度上改善智能问答的准确性低且效率低下的的问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008]根据本公开的第一方面,提供了一种问答模型的确定方法,所述问答模型用于对医疗知识的问答,包括:基于第一样本对多个候选语言表征模型进行训练,根据训练结果从所述候选语言表征模型中确定出目标语言表征模型,所述第一样本包括含有数据表的实体标识的文本和/或含有所述实体标识的同义词的文本,所述实体标识包括所述数据表的表标识和/或列标识,所述数据表用于结构化存储医疗知识;获取第二样本和所述第二样本在结构化查询语言的预设子模块中对应的样本标签,基于所述目标语言表征模型分别得到所述第二样本对应的第一文本编码向量和所述样本标签对应的第二文本编码向量,所述第二样本包括与医疗知识相关的问题描述文本,所述样本标签包括所述问题描述文本在结构化查询语言的预设子模块中对应的信息;根据所述第一文本编码向量和每个预设子模块的样本标签对应的第二文本编码向量,分别对结构化查询语言的每个预设子模块对应的初始子预测模型进行有监督学习训练,以得到结构化查询语言的每个预设子模块对应的目标子预测模型;根据所述目标语言表征模型和每个目标子预测模型,确定出用于对医疗知识进行问答的问答模型。
[0009]在本公开的一种示例性实施例中,基于前述方案,所述结构化查询语言的预设子模块包括数据来源模块、查询条件模块、查询结果聚合模块中的一种或多种,所述样本标签
包括第一标签、第二标签和第三标签中的一种或多种;在所述样本标签包括第一标签时,所述第一标签包括所述问题描述文本在所述数据来源模块对应的实体信息,所述实体信息包括所述数据表的表标识和/或列标识;在所述样本标签包括第二标签时,所述第二标签包括所述问题描述文本在所述查询条件模块对应的查询条件;在所述样本标签包括第三标签时,所述第三标签包括所述问题描述文本在所述查询结果聚合模块对应的查询结果聚合方式。
[0010]在本公开的一种示例性实施例中,基于前述方案,所述根据训练结果从所述候选语言表征模型中确定出目标语言表征模型,包括:对每个候选语言表征模型进行测试,以确定出每个候选语言表征模型在预设模型评价指标中的目标测试值;从所述候选表征语言表征模型中,确定出所述目标测试值最大的候选语言表征为所述目标语言表征模型;其中,针对每个候选语言表征模型,通过以下方式确定所述候选语言表征模型在预设模型评价指标中的目标测试值:对多每个候选语言表征模型进行多次训练,在每次训练结束后,对所述候选语言表征模型进行测试,以确定出所述候选语言表征模型在预设模型评价指标中的候选测试值的变化曲线;根据所述变化曲线的最大峰值对应的测试值,确定出所述候选语言表征模型的目标测试值。
[0011]在本公开的一种示例性实施例中,基于前述方案,所述候选语言表征模型包括基于转换器的双向编码语言表征模型BERT、基于全词掩码的双向语言表征模型BERT

wwm

ext、深层语境化的词表征模型ELMO、广义自回归的语言模型XLNET中的一种或多种。
[0012]在本公开的一种示例性实施例中,基于前述方案,所述方法还包括:基于第一样本对多个候选语言表征模型进行训练,以对所述第一样本中的实体标识进行预测;在预测出的实体标识与第一样本的实体标识标签之间的相似度大于第一预设值时,确定预测出的实体标识为所述第一样本的实体标识标签的候选同义词;根据所述候选同义词更新所述第一样本,以根据更新后的所述第一样本对多个候选语言表征模型进行训练。
[0013]在本公开的一种示例性实施例中,基于前述方案,所述根据所述目标语言表征模型和每个目标子预测模型,确定出用于对医疗知识进行问答的问答模型,包括:对所述目标语言表征模型和每个目标子预测模型,以及预设的生成式预训练模型GPT进行拼接,以确定出用于对医疗知识进行问答的问答模型;其中,所述生成式预训练模型GPT用于生成与结构化查询结果对应的文本描述,所述结构化查询结果根据所述结构化查询语言对应的每个目标子预测模型的预测结果确定。
[0014]根据本公开的第三方面,提供了一种问答方法,包括:获取与医疗知识相关的待处理问题,将所述待处理问题的描述文本输入到目标语言表征模型中,以得到所述待处理问题的描述文本对应的文本编码向量;将所述文本编码向量分别输入到结构化查询语言对应的每个目标子预测模型中,以得到对结构化查询语言的每个子模块的预测结果;根据每个子模块的预测结果,查询数据表,得到所述待处理问题的描述文本对应的结构化查询结果,以根据所述结构化查询结果生成所述待处理问题对应的回答信息;
[0015]其中,所述数据表包括用于结构化存储医疗知识的数据表,所述目标语言表征模型和所述目标子预测模型根据上述第一方面所述的方法确定。
[0016]在本公开的一种示例性实施例中,基于前述方案,所述以根据所述结构化查询结果生成所述待处理问题的描述文本对应的回答信息,包括:将所述结构化查询结果输入到
预设的生成式预训练模型GPT中,以得到所述结构化查询结果对应的回答信息。
[0017]根据本公开的第三方面,提供了一种问答模型的确定装置,所述问答模型用于对医疗知识的问答,所述装置包括:目标语言表征模型确定模块,被配置为基于第一样本对多个候选语言表征模型进行训练,根据训练结果从所述候选语言表征模型中确定出目标语言表征模型,所述第一样本包括含有数据表的实体标识的文本和/或含有所述实体标识的同义词的文本,所述实体标识包括所述数据表的表标识和/或列标识,所述数据表用于结构化存储医疗知识;文本编码向量生成模块,被配置为获取第二样本和所述第二样本在结构化查询语言的预设子模块中对应的样本标签,基于所述目标语言表征模型分别得到所述第二样本对应的第一文本编码向量和所述样本标签对应的第二文本编码向量,所述第二样本包括与医疗知识相关的问题描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答模型的确定方法,所述问答模型用于对医疗知识的问答,其特征在于,所述方法包括:基于第一样本对多个候选语言表征模型进行训练,根据训练结果从所述候选语言表征模型中确定出目标语言表征模型,所述第一样本包括含有数据表的实体标识的文本和/或含有所述实体标识的同义词的文本,所述实体标识包括所述数据表的表标识和/或列标识,所述数据表用于结构化存储医疗知识;获取第二样本和所述第二样本在结构化查询语言的预设子模块中对应的样本标签,基于所述目标语言表征模型分别得到所述第二样本对应的第一文本编码向量和所述样本标签对应的第二文本编码向量,所述第二样本包括与医疗知识相关的问题描述文本,所述样本标签包括所述问题描述文本在结构化查询语言的预设子模块中对应的信息;根据所述第一文本编码向量和每个预设子模块的样本标签对应的第二文本编码向量,分别对结构化查询语言的每个预设子模块对应的初始子预测模型进行有监督学习训练,以得到结构化查询语言的每个预设子模块对应的目标子预测模型;根据所述目标语言表征模型和每个目标子预测模型,确定出用于对医疗知识进行问答的问答模型。2.根据权利要求1所述的问答模型的确定方法,其特征在于,所述结构化查询语言的预设子模块包括数据来源模块、查询条件模块、查询结果聚合模块中的一种或多种,所述样本标签包括第一标签、第二标签和第三标签中的一种或多种;在所述样本标签包括第一标签时,所述第一标签包括所述问题描述文本在所述数据来源模块对应的实体信息,所述实体信息包括所述数据表的表标识和/或列标识;在所述样本标签包括第二标签时,所述第二标签包括所述问题描述文本在所述查询条件模块对应的查询条件;在所述样本标签包括第三标签时,所述第三标签包括所述问题描述文本在所述查询结果聚合模块对应的查询结果聚合方式。3.根据权利要求1所述的问答模型的确定方法,其特征在于,所述根据训练结果从所述候选语言表征模型中确定出目标语言表征模型,包括:对每个候选语言表征模型进行测试,以确定出每个候选语言表征模型在预设模型评价指标中的目标测试值;从所述候选表征语言表征模型中,确定出所述目标测试值最大的候选语言表征为所述目标语言表征模型;其中,针对每个候选语言表征模型,通过以下方式确定所述候选语言表征模型在预设模型评价指标中的目标测试值:对多每个候选语言表征模型进行多次训练,在每次训练结束后,对所述候选语言表征模型进行测试,以确定出所述候选语言表征模型在预设模型评价指标中的候选测试值的变化曲线;根据所述变化曲线的最大峰值对应的测试值,确定出所述候选语言表征模型的目标测试值。4.根据权利要求1所述的问答模型的确定方法,其特征在于,所述候选语言表征模型包括基于转换器的双向编码语言表征模型BERT、基于全词掩码的双向语言表征模型BERT

wwm

ext、深层语境化的词表征模型ELMO、广义自回归的语言模型XLNET中的一种或多种。5.根据权利要求1所述的问答模型的确定方法,所述方法还包括:基于第一样本对多个候选语言表征模型进行训练,以对所述第一样本中的实体标识进行预测;在预测出的实体标识与第一样本的实体标识标签之间的相似度大于第一预设值时,确定预测出的实体标识为所述第一样本的实体标识标签的候选同义词;根据所述候选同义词更新所述第一样本,以根据更新后的所述第一样本对多个候选语言表征模型进行训练。6.根据权利要求1所述的问答模型的确定方法,其特征在于,所述根据所述目标语言表征模型和每个目标子预测模型,确定出用于对医疗知识进行问答的问答模型,包括:对所述目标语言表征模型和每个目标子预测模型,以及预设的生成式预训练模型G...

【专利技术属性】
技术研发人员:王伟
申请(专利权)人:天津开心生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1