问答模型的确定方法、问答方法、装置、介质、设备制造方法及图纸

技术编号：34280250 阅读：75 留言：0更新日期：2022-07-24 18:09

本公开涉及人工智能技术领域，提供了一种问答模型的确定方法及装置、问答方法及装置、计算机可读存储介质和电子设备。其中，上述问答模型的确定方法包括：基于第一样本对候选语言表征模型进行训练，确定出目标语言表征模型；获取第二样本和所述第二样本对应的样本标签，基于目标语言表征模型分别得到第二样本对应的第一文本编码向量和样本标签对应的第二文本编码向量；根据第一文本编码向量和每个预设子模块的样本标签对应的第二文本编码向量，分别对每个预设子模块对应的初始子预测模型进行训练，以得到每个预设子模块对应的目标子预测模型；根据目标语言表征模型和每个目标子预测模型，确定医疗知识的问答模型。本方案能提高问答的准确性。提高问答的准确性。提高问答的准确性。

Determination method, question and answer method, device, medium and equipment of question and answer model

全部详细技术资料下载

【技术实现步骤摘要】
问答模型的确定方法、问答方法、装置、介质、设备

[0001]本公开涉及人工智能
，具体而言，涉及一种问答模型的确定方法、问答模型的确定装置、问答方法、问答装置、计算机可读存储介质、以及电子设备。

技术介绍

[0002]在信息化时代，通过智能问答系统可以辅助人们快速的获取到自己想要了解的信息。
[0003]相关技术中，智能问答都是基于规则配置的，会预先配置好一些关键词和其关联的答案，当输入的问题和预先配置的关键词相近时，就会输出与预先配置的关键词关联的答案。
[0004]然而，这种方式由于问答数量有限，不够灵活，所以会降低对问答的准确性，且需要人为预先去配置相关的问题和答案，效率低下。
[0005]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种问答模型的确定方法及装置、问答方法及装置、计算机可读存储介质及电子设备，进而至少在一定程度上改善智能问答的准确性低且效率低下的的问题。
[0007]本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。
[0008]根据本公开的第一方面，提供了一种问答模型的确定方法，所述问答模型用于对医疗知识的问答，包括：基于第一样本对多个候选语言表征模型进行训练，根据训练结果从所述候选语言表征模型中确定出目标语言表征模型，所述第一样本包括含有数据表的实体标识的文本和...

【技术保护点】

【技术特征摘要】
1.一种问答模型的确定方法，所述问答模型用于对医疗知识的问答，其特征在于，所述方法包括：基于第一样本对多个候选语言表征模型进行训练，根据训练结果从所述候选语言表征模型中确定出目标语言表征模型，所述第一样本包括含有数据表的实体标识的文本和/或含有所述实体标识的同义词的文本，所述实体标识包括所述数据表的表标识和/或列标识，所述数据表用于结构化存储医疗知识；获取第二样本和所述第二样本在结构化查询语言的预设子模块中对应的样本标签，基于所述目标语言表征模型分别得到所述第二样本对应的第一文本编码向量和所述样本标签对应的第二文本编码向量，所述第二样本包括与医疗知识相关的问题描述文本，所述样本标签包括所述问题描述文本在结构化查询语言的预设子模块中对应的信息；根据所述第一文本编码向量和每个预设子模块的样本标签对应的第二文本编码向量，分别对结构化查询语言的每个预设子模块对应的初始子预测模型进行有监督学习训练，以得到结构化查询语言的每个预设子模块对应的目标子预测模型；根据所述目标语言表征模型和每个目标子预测模型，确定出用于对医疗知识进行问答的问答模型。2.根据权利要求1所述的问答模型的确定方法，其特征在于，所述结构化查询语言的预设子模块包括数据来源模块、查询条件模块、查询结果聚合模块中的一种或多种，所述样本标签包括第一标签、第二标签和第三标签中的一种或多种；在所述样本标签包括第一标签时，所述第一标签包括所述问题描述文本在所述数据来源模块对应的实体信息，所述实体信息包括所述数据表的表标识和/或列标识；在所述样本标签包括第二标签时，所述第二标签包括所述问题描述文本在所述查询条件模块对应的查询条件；在所述样本标签包括第三标签时，所述第三标签包括所述问题描述文本在所述查询结果聚合模块对应的查询结果聚合方式。3.根据权利要求1所述的问答模型的确定方法，其特征在于，所述根据训练结果从所述候选语言表征模型中确定出目标语言表征模型，包括：对每个候选语言表征模型进行测试，以确定出每个候选语言表征模型在预设模型评价指标中的目标测试值；从所述候选表征语言表征模型中，确定出所述目标测试值最大的候选语言表征为所述目标语言表征模型；其中，针对每个候选语言表征模型，通过以下方式确定所述候选语言表征模型在预设模型评价指标中的目标测试值：对多每个候选语言表征模型进行多次训练，在每次训练结束后，对所述候选语言表征模型进行测试，以确定出所述候选语言表征模型在预设模型评价指标中的候选测试值的变化曲线；根据所述变化曲线的最大峰值对应的测试值，确定出所述候选语言表征模型的目标测试值。4.根据权利要求1所述的问答模型的确定方法，其特征在于，所述候选语言表征模型包括基于转换器的双向编码语言表征模型BERT、基于全词掩码的双向语言表征模型BERT
‑
wwm
‑
ext、深层语境化的词表征模型ELMO、广义自回归的语言模型XLNET中的一种或多种。5.根据权利要求1所述的问答模型的确定方法，所述方法还包括：基于第一样本对多个候选语言表征模型进行训练，以对所述第一样本中的实体标识进行预测；在预测出的实体标识与第一样本的实体标识标签之间的相似度大于第一预设值时，确定预测出的实体标识为所述第一样本的实体标识标签的候选同义词；根据所述候选同义词更新所述第一样本，以根据更新后的所述第一样本对多个候选语言表征模型进行训练。6.根据权利要求1所述的问答模型的确定方法，其特征在于，所述根据所述目标语言表征模型和每个目标子预测模型，确定出用于对医疗知识进行问答的问答模型，包括：对所述目标语言表征模型和每个目标子预测模型，以及预设的生成式预训练模型G...

【专利技术属性】
技术研发人员：王伟，
申请(专利权)人：天津开心生活科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人