【技术实现步骤摘要】
基于语义理解的问题推理方法和装置
[0001]本申请涉及自然语言处理领域,特别涉及基于语义理解的问题推理方法和装置、计算设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]自然语言处理是计算机科学与人工智能领域中的一个重要方向。机器阅读理解是自然语言处理领域中的一项重要任务,通过给定问题和相关文本,利用机器模型来理解文本内容,最终得到问题对应的答案。机器阅读理解按照获取答案的方式可分为抽取式和生成式,抽取式直接从给定文本中抽取片段,作为答案;生成式则利用生成模型直接生成答案。
[0003]在诸如金融研报数据分析之类的许多领域中,针对待解决问题(尤其是涉及逻辑分析或数值分析的问题),可能不仅仅需要通过机器阅读理解得到一个答案,而是更需要知道答案背后的(用于将问题、条件和答案串联起来的)逻辑推理或数值推理过程。然而,在相关技术中,无论是抽取式还是生成式机器阅读理解模型,都是基于问题及相关文本或条件直接预测问题的答案,而无法解释如何基于问题和条件得出答案。换言之,相关技术的阅读理解模型或算法只能得到给定问题的 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义理解的问题推理方法,包括:基于深度神经网络构建问题推理模型,所述问题推理模型包括用于语义编码的编码器以及用于向量解码的解码器;获取待处理文本,所述待处理文本包括指示待处理问题的第一文本和与所述待处理问题相关的第二文本;将所述待处理文本输入到所述问题推理模型的编码器,以编码输出所述待处理文本对应的语义向量序列;将所述语义向量序列输入到所述问题推理模型的解码器,以按时间顺序解码输出解码文本序列,所述解码文本序列中每一个解码文本属于预设的推理过程相关文本集合,所述预设的推理过程相关文本集合是与第二文本相关的;根据所述解码文本序列,确定指示所述待处理问题的推理过程的目标文本。2.根据权利要求1所述的方法,其中,所述预设的推理过程相关文本集合中各个文本分别指示各种预设推理树父子关系构造过程,每一种预设推理树父子关系构造过程包括从作为父节点的非叶节点文本到作为子节点的叶节点文本序列或非叶节点文本序列的生成过程;并且其中,所述根据所述解码文本序列,确定指示所述待处理问题的推理过程的目标文本,包括:按照解码文本序列各个解码文本对应的解码时刻顺序,依次执行各个解码文本所指示的预设推理树父子关系构造过程,以构建待处理问题对应的推理树;按照深度优先遍历顺序,将所述推理树的所有叶节点文本拼接在一起以形成指示待处理问题的推理过程的目标文本。3.根据权利要求2所述的方法,其中,所述按照解码文本序列各个解码文本对应的解码时刻顺序,依次执行各个解码文本所指示的预设推理树父子关系构造过程,以构建待处理问题对应的推理树,包括:将初始解码时刻的解码文本所指示的预设推理树父子关系构造过程中作为父节点的非叶节点文本确定为推理树的根节点;按照所述解码文本序列各个解码文本对应的解码时刻顺序,针对每一个解码文本,依次执行下述步骤:按照深度优先遍历顺序,从推理树的已确定为非叶节点文本的节点中选择尚未确定子节点的当前非叶节点;将当前解码文本所指示的预设推理树父子关系构造过程中作为子节点的节点文本序列中的各节点文本按照从左到右的顺序确定为当前非叶节点的子节点;响应于推理树中所有确定为非叶节点文本的节点都确定了子节点,结束推理树构建过程。4.根据权利要求1
‑
3中任一项所述的方法,其中,所述待处理问题包括数值推理问题,所述目标文本包括与所述数值推理问题对应的数值运算逻辑式,其中所述数值运算包括针对实数域的加、减、乘、除、乘方、开方中至少一个。5.根据权利要求2所述的方法,其中,所述问题推理模型通过下述步骤训练得到:获取文本数据集,所述文本数据集中每一个文本数据包括问题文本和与所述问题相关
的条件文本;获取所述文本数据集中每一个文本数据对应的参考推理过程文本;针对每一个文本数据,根据预设的推理树语法规则和对应的参考推理过程文本,构建该文本数据对应的参考推理树;针对每一个文本数据,通过深度优先遍历将该文本数据对应的参考推理树变换成指示节点间父子关系的参考文本序列,作为该文本数据对应的样本标签;将所述文本数据集中每一个文本数据输入到所述问题推理模型,以基于所述问题推理模型的输出结果以及每一个文本数据对应的样本标签,计算所述问题推理模型的推理损失;基于所述推理损失,对问题推理模型的参数进行迭代更新直至所述推理损失满足预设条件。6.根据权利要求1所述的方法,其中,所述将所述待处理文本输入到所述问题推理模型的编码器,以编码输出所述待处理文本对应的语义向量序列,包括:对所述待处理文本进行分词处理,以得到所待处理文本对应的词序列;对所述词序列中各个词进行语义理解,以获得所述待处理文本对应的语义向量序列,其中所述语义向量序列中各个语义向量与所述词序列中各个词一一对应。7.根据权利要求1或2所述的方法,其中,所述解码器包括循环神经网络结构的第一解码器和分类器结构的第二解码器,并且其中,所述将所述语义向量序列输入到所述问题推理模型的解码器,以按时间顺序解码输出解码文本序列,包括:将所述语义向量序列变换成所述待处理文本对应的语义特征向量序列,使得所述语义特征向量序列中的各语义特征向量与所述解码器的各个解码时刻一一对应;将所述语义特征向量序列输入到第一解码器,以按循环解码方式生成所述待处理文本对应的解码向量序列;将所述解码向量序列中各解码向量输入到第二解码器,以按分类预测方式生成所述待处理文本对应的解码文本序列。8.根据权利要求7所述的方法,其中,所述将所述语义向量序列变换成所述待处理文本对应的语义特征向量序列,使得所述语义特征向量序列中的各语义特征向量与所述解码器的各个解码时刻一一对应,包括:针对所述解码器的每一个解码时刻,按时间顺序分别执行下述步骤:响应于当前解码时刻为初始解码时刻,随机生成当前解码时刻对应的注意力权重序列,且响应于当前解码时刻不是初始解码时刻,根据所述语义向量序列和前一解码时刻的解码向量,计算当前解码时刻对应的注意力权重序列,其中所述当前时刻对应的注意力权重序列中的各注意力权重与语义向量序列中的各语义向量一一对应;基于当前时刻对应的注意力权重序列及其与所述语义向量序列的对应关系,对所述语义向量序列进行加权求和处理,以得到当前解码时刻对应的语义特征向量;按照解码器的各个解码时刻的顺序,将各个解码时刻对应的语义特征向量组合在一起以形成语义特征向量序列。9...
【专利技术属性】
技术研发人员:吕政伟,石智中,梁霄,雷涛,
申请(专利权)人:中国国际金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。