【技术实现步骤摘要】
问题答案确定方法、装置、设备、存储介质及程序产品
[0001]本公开涉及数据
,具体涉及深度学习、自然语言处理、语义识别等人工智能
,可应用于知识问答、智慧城市场景,尤其涉及一种问题答案确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]机器阅读理解是一个经典的自然语言处理任务,通常被用来检验一个系统的智能水平,受益于大规模预训练语言模型等技术的发展,智能系统在通用领域上的问答能力已经超过了人类平均水平。
[0003]相比于问答能力在通用领域下的能力提升,在更进一步的专业领域(例如物理学研究、医疗知识等)下,基于预训练语言模型提供的问答能力仍明显弱于人类平均水平。
[0004]因此,如何使预训练语言模型在专业领域下对更复杂问题提供更高的问答能力,是本领域技术人员亟待解决的问题。
技术实现思路
[0005]本公开实施例提出了一种问题答案确定方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
[0006]第一方面,本公开实施例提出了一种 ...
【技术保护点】
【技术特征摘要】
1.一种问题答案确定方法,包括:将获取到的待查询问题与各条候选答案拼接为各问题答案对;基于循环神经网络的循环特性,对各所述问题答案对的不同粒度特征在水平方向上进行预设步数的特征组合参数的推理操作;在每步水平方向上的推理操作下,利用多个预设的垂直推理层分别在不同的推理侧重点下确定所述不同粒度特征的特征组合权重;其中,各所述垂直推理层之间串行连接;通过最后一步的推理操作得到分别与每个所述问题答案对对应的候选答案特征;根据所述待查询问题的问题特征与各所述候选答案特征之间的特征相似度,确定与所述待查询问题匹配的目标候选答案。2.根据权利要求1所述的方法,其中,所述不同粒度特征包括:词级别特征、句子级别特征、完整内容级别特征,所述句子级别特征由各所述词级别特征按照词构成句子的顺序拼接得到,所述完整内容级别由各所述句子级别特征按照句子构成完整的问题答案内容的顺序拼接得到。3.根据权利要求1所述的方法,还包括:预先构建预设数量的垂直推理层,其中,所述预先构建预设数量的垂直推理层,包括:确定所述待查询问题的第一语料长度和所属领域的领域复杂度;确定所述待查询问题对应领域的候选答案库中各候选答案的第二语料长度;基于所述领域复杂度、所述第一语料长度和所述第二语料长度,确定推理侧重点的实际数量;分别为每个所述推理侧重点生成一个所述垂直推理层。4.根据权利要求1所述的方法,其中,所述根据所述待查询问题的问题特征与各所述候选答案特征之间的特征相似度,确定与所述待查询问题匹配的目标候选答案,包括:分别计算所述问题特征与每条所述候选答案特征间的实际特征相似度;将具有大于预设相似度的实际特征相似度的候选答案特征确定为目标候选答案特征;将与所述目标候选答案特征所对应的候选答案,确定为与所述待查询问题匹配的目标候选答案。5.根据权利要求2所述的方法,还包括:为所述候选答案生成词级别特征,其中,所述为所述候选答案生成词级别特征,包括:将多条所述候选答案以附加拼接位置标记的方式,拼接为长候选答案;将所述长候选答案通过预设的特征提取模块,生成词级别的长答案特征;在所述长答案特征中确定所述拼接位置标记经所述特征提取模块处理后表现为的标记特征;根据所述标记特征将所述长答案特征拆分为与所述候选答案拼接数量一致的短答案特征;根据与每条所述候选答案对应的短答案特征,得到与每条所述候选答案对应的词级别特征。6.根据权利要求1
‑
5任一项所述的方法,其中,响应于所述待查询问题属于医疗知识领域,所述待查询问题包括:待查询医疗问题与候选选项的组合,所述候选答案包括:医疗知识证据。
7.根据权利要求1
‑
5任一项所述的方法,其中,所述基于循环神经网络的循环特性,对各所述问题答案对的不同粒度特征在水平方向上进行预设步数的特征组合参数的推理操作,包括:利用预设的特征提取模块得到各所述问题答案对的不同粒度特征;利用预设的水平推理模块对所述不同粒度特征在水平方向上进行预设步数的特征组合参数的推理操作;其中,所述水平推理模块提供的推理操作基于所述循环神经网络的循环特性构建得到;对应的,所述在每步水平方向上的推理操作下,利用多个预设的垂直推理层分别在不同的推理侧重点下确定所述不同粒度特征的特征组合权重,包括:在每步水平方向上的推理操作下,利用预设的垂直推理模块在多个预设的垂直推理层上分别确定所述不同粒度特征的特征组合权重;其中,不同的垂直推理层对应不同的推理侧重点;对应的,所述通过最后一步的推理操作得到分别与每个所述问题答案对对应的候选答案特征,包括:通过所述水平推理模块输出分别与每个所述问题答案对对应的候选答案特征;对应的,所述根据所述待查询问题的问题特征与各所述候选答案特征之间的特征相似度,确定与所述待查询问题匹配的目标候选答案,包括:利用预设的特征提取模块得到所述待查询问题的问题特征;根据预设的特征匹配模块计算所述问题特征与各所述候选答案特征之间的特征相似度,并根据所述特征相似度输出与所述待查询问题匹配的目标候选答案;其中,所述特征提取模块、所述水平推理模块、所述垂直推理模块、所述特征匹配模块均作为构成预设的答案查询模型的一部分。8.一种问题答案确定装置,包括:问题答案拼接单元,被配置成将获取到的待查询问题与各条候选答案拼接为各问题答案对;水平推理单元,被配置成基于循环神经网络的循环特性,对各所述问题答案对的不同粒度特征在水平方向上进行预设步数...
【专利技术属性】
技术研发人员:张记袁,毛建国,曾增烽,彭卫华,姜文斌,吕雅娟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。