文本推理方法及装置制造方法及图纸

技术编号:33472029 阅读:41 留言:0更新日期:2022-05-19 00:49
本申请提供文本推理方法及装置,其中所述文本推理方法包括:获取待推理文本,将待推理文本输入编码器,获得待推理文本的编码向量,将编码向量和目标词组输入第一解码器,获得第一嵌入向量,将目标词组输入第二解码器,得到第二嵌入向量,对第一嵌入向量和第二嵌入向量进行加和,将加和结果经输出层获得当前推理的输出词,基于当前推理的输出词,更新目标词组,返回执行将编码向量和目标词组输入第一解码器,获得第一嵌入向量,将目标词组输入第二解码器,得到第二嵌入向量,在当前推理的输出词携带结束标签的情况下,确定目标词组中的输出词组成待推理文本的推理结果,提高了当前推理的输出词的准确性,进而提高了文本推理结果的准确性。准确性。准确性。

【技术实现步骤摘要】
文本推理方法及装置


[0001]本申请涉及计算机技术的人工智能领域,特别涉及一种文本推理方法。本申请同时涉及一种文本推理装置、一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]人工智能(artificial intelligence;AI)是指已工程化(即设计并制造)的系统感知环境的能力,以及获取、处理、应用和表示知识的能力。自然语言处理、机器人、计算机视觉成为了人工智能最为热门的三个产业方向。人工智能领域关键技术的发展状况,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等。机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语言的翻译过程。
[0003]随着互联网技术的发展,文本推理越来越依赖于互联网进行,文本推理是对文本进行分析、理解、提取等处理的过程,文本推理能够帮助人们本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本推理方法,其特征在于,包括:获取待推理文本,将所述待推理文本输入编码器,获得所述待推理文本的编码向量;将所述编码向量和目标词组输入第一解码器,获得第一嵌入向量,将所述目标词组输入第二解码器,得到第二嵌入向量,其中,所述目标词组包括已经推理得到的输出词;对所述第一嵌入向量和所述第二嵌入向量进行加和,将加和结果经输出层获得当前推理的输出词;基于所述当前推理的输出词,更新所述目标词组,返回执行所述将所述编码向量和目标词组输入第一解码器,获得第一嵌入向量,将所述目标词组输入第二解码器,得到第二嵌入向量;在所述当前推理的输出词携带结束标签的情况下,确定所述目标词组中的输出词组成所述待推理文本的推理结果。2.根据权利要求1所述的方法,其特征在于,所述第二解码器为预训练语言模型。3.根据权利要求1所述的方法,其特征在于,所述目标词组中的首位字符为开始标签;在初始情况下,所述将所述编码向量和目标词组输入第一解码器,获得第一嵌入向量,将所述目标词组输入第二解码器,得到第二嵌入向量的步骤,包括:将所述编码向量和所述开始标签输入所述第一解码器,获得第一嵌入向量,将所述开始标签输入第二解码器,获得第二嵌入向量;所述基于所述当前推理的输出词,更新所述目标词组的步骤,包括:将所述当前推理的输出词作为新增字符,增加至所述目标词组中;所述确定所述目标词组中的输出词组成所述待推理文本的推理结果的步骤,包括:将所述目标词组中的输出词,按照被推理出的先后顺序进行合并,得到所述待推理文本的推理结果。4.根据权利要求1

3任一项所述的方法,其特征在于,所述对所述第一嵌入向量和所述第二嵌入向量进行加和,将加和结果经输出层获得当前推理的输出词的步骤,包括:获取针对所述第一解码器预先设置的第一权重系数,以及针对所述第二解码器预先设置的第二权重系数;利用所述第一权重系数和所述第二权重系数,对所述第一嵌入向量和所述第二嵌入向量进行加权,将加权结果经输出层获得当前推理的输出词。5.根据权利要求1

3任一项所述的方法,其特征在于,所述编码器、所述第一解码器和所述第二解码器的训练方式,包括:获取样本集,所述样本集中包括多个样本文本以及各样本文本分别对应的目标文本;提取第一样本文本,将所述第一样本文本输入所述编码器,得到所述第一样本文本的第一样本编码向量;将所述第一样本编码向量和第一目标词组输入第一解码器,获得第一样本嵌入向量,将所述第一目标词组输入第二解码器,获得第二样本嵌入向量,其中,所述第一目标词组包括针对所述第一样本文本已经推理得到的输出词;对所述第一样本嵌入向量和所述第二样本嵌入向量进行加和,将加和结果经输出层获得第一当前输出词;基于所述第一当前输出词,更新所述第一目标词组,返回执行所述将所述第一样本编
码向量和第一目标词组输入第一解码器,获得第一样本嵌入向量,将所述第一目标词组输入第二解码器,获得第二样本嵌入向量;在所述第一当前输出词携带结束标签的情况下,确定所述第一目标词组中的输出词组成所述第一样本文本的第一推理结果;根据所述第一推理结果和所述第一样本文本对应的第一目标文本,对编码器、第一解码器和第二解码器进行训练,获得训练后的所述编码器、所述第一解码器和所述第二解码器。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一推理结果和所述第一样本文本对应的第一目标文本,对编码器、第一解码器和第二解码器进行训练,获得训练后的所述编码器、所述第一解码器和所述第二解码器的步骤,包括:计算所述第一推理结果...

【专利技术属性】
技术研发人员:黄继豪李长亮
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1