System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 表格生成文本模型的训练方法、表格生成文本方法和装置制造方法及图纸_技高网

表格生成文本模型的训练方法、表格生成文本方法和装置制造方法及图纸

技术编号:41091331 阅读:49 留言:0更新日期:2024-04-25 13:51
本说明书的实施例提供了一种用于训练表格生成文本模型的方法和装置。在该用于训练表格生成文本模型的方法中,在每个模型训练过程:利用表格编码模型根据当前训练样本的表格得到表格特征表示;根据该表格以及基于表格中各个数值和预定数值操作进行组合得到的数值操作结果集,生成对应的衍生数值推理图;利用路径生成模型根据表格特征表示和该衍生数值推理图得到衍生值生成路径特征表示;再利用文本解码模型结合表格特征表示、衍生值生成路径特征表示以及衍生词表得到该表格的描述文本;最后根据该描述文本和该表格的文本标签之间的差异确定当前训练过程的损失函数值,进而调整表格编码模型、路径生成模型和文本解码模型当前的模型参数。

【技术实现步骤摘要】

本说明书实施例通常涉及计算机,尤其涉及用于训练表格生成文本模型的方法、基于数值推理的表格生成文本方法和装置。


技术介绍

1、随着深度学习技术的发展,各种深度学习模型能够在许多nlp(natural languageprocessing,自然语言处理)任务上取得良好的效果。但在诸如nlg(natural languagegeneration,自然语言生成)等各类生成任务上,由于需要直接从非连续自然语言的文本(例如表格、词条等给定结构的数据)中提取语言信息,生成连续的语言文本,直接应用的效果并不是很好。尤其在涉及数值的表格生成文本(table2text)任务中,对模型针对数值的逻辑处理能力提出了更高要求。因而需要一种能够具备数值推理能力的表格生成文本方法,以得到更准确、丰富、逻辑更加严谨的表格描述文本。


技术实现思路

1、鉴于上述,本说明书实施例提供了一种用于训练表格生成文本模型的方法、基于数值推理的表格生成文本方法和装置,可以训练得到具备数据推理逻辑的表格生成文本模型,进而提升针对表格所生成的描述文本的质量。

2、根据本说明书的实施例的一个方面,提供一种用于训练表格生成文本模型的方法,其中,所述表格生成文本模型包括表格编码模型、路径生成模型和文本解码模型,所述方法包括:利用训练样本集循环执行下述模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括表格和对应的文本标签,所述表格中包括数值单元和非数值单元:根据当前训练样本的表格提供给当前表格编码模型,得到各个表格单元对应的特征表示;根据当前训练样本的表格以及基于各个数值单元和预定数值操作进行组合得到的数值操作结果集,生成该表格对应的衍生数值推理图,其中,所述衍生数值推理图中包括与所述数值单元对应的数字节点、与所述非数值单元对应的非数值节点和与数值操作结果对应的衍生节点;将所得到的各个表格单元对应的特征表示和该衍生数值推理图提供给当前路径生成模型,得到衍生数值生成路径对应的特征表示;以及将所得到的各个表格单元对应的特征表示、衍生数值生成路径对应的特征表示以及衍生词表提供给当前文本解码模型,得到与该表格对应的描述文本,其中,所述衍生词表基于所述数值操作结果集得到;根据所得到的描述文本和对应的文本标签之间的差异确定当前训练过程的损失函数值;响应于不满足训练结束条件,根据所确定的损失函数值调整当前表格编码模型、当前路径生成模型和当前文本解码模型的参数,其中,经过模型参数调整后的表格编码模型、路径生成模型和文本解码模型充当下一模型训练过程的当前表格编码模型、当前路径生成模型和当前文本解码模型。

3、根据本说明书的实施例的另一个方面,提供一种基于数值推理的表格生成文本方法,包括:将所获取的表格提供给表格编码模型,得到各个表格单元对应的特征表示,其中,表格单元包括数值单元和非数值单元;根据所述表格以及基于各个数值单元和预定数值操作进行组合得到的数值操作结果集,生成所述表格对应的衍生数值推理图,其中,所述衍生数值推理图中包括与所述数值单元对应的数字节点、与所述非数值单元对应的非数值节点和与数值操作结果对应的衍生节点;将所得到的各个表格单元对应的特征表示和所述衍生数值推理图提供给路径生成模型,得到衍生数值生成路径对应的特征表示;以及将所得到的各个表格单元对应的特征表示、衍生数值生成路径对应的特征表示以及衍生词表提供给文本解码模型,得到与所述表格对应的描述文本,其中,所述衍生词表基于所述数值操作结果集得到。

4、根据本说明书的实施例的又一个方面,提供一种用于训练表格生成文本模型的装置,其中,所述表格生成文本模型包括表格编码模型、路径生成模型和文本解码模型,所述装置被配置为由训练单元利用训练样本集循环执行模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括表格和对应的文本标签,所述表格中包括数值单元和非数值单元,所述训练单元包括:编码模块,被配置为根据当前训练样本的表格提供给当前表格编码模型,得到各个表格单元对应的特征表示;图生成模块,被配置为根据当前训练样本的表格以及基于各个数值单元和预定数值操作进行组合得到的数值操作结果集,生成该表格对应的衍生数值推理图,其中,所述衍生数值推理图中包括与所述数值单元对应的数字节点、与所述非数值单元对应的非数值节点和与数值操作结果对应的衍生节点;路径表示模块,被配置为将所得到的各个表格单元对应的特征表示和该衍生数值推理图提供给当前路径生成模型,得到衍生数值生成路径对应的特征表示;解码模块,被配置为将所得到的各个表格单元对应的特征表示、衍生数值生成路径对应的特征表示以及衍生词表提供给当前文本解码模型,得到与该表格对应的描述文本,其中,所述衍生词表基于所述数值操作结果集得到;损失值确定模块,被配置为根据所得到的描述文本和对应的文本标签之间的差异确定当前训练过程的损失函数值;以及所述装置还包括:参数调整单元,被配置为响应于不满足训练结束条件,根据所确定的损失函数值调整当前表格编码模型、当前路径生成模型和当前文本解码模型的参数,其中,经过模型参数调整后的表格编码模型、路径生成模型和文本解码模型充当下一模型训练过程的当前表格编码模型、当前路径生成模型和当前文本解码模型。

5、根据本说明书的实施例的再一个方面,提供一种基于数值推理的表格生成文本装置,包括:编码单元,被配置为将所获取的表格提供给表格编码模型,得到各个表格单元对应的特征表示,其中,表格单元包括数值单元和非数值单元;图生成单元,被配置为根据所述表格以及基于各个数值单元和预定数值操作进行组合得到的数值操作结果集,生成所述表格对应的衍生数值推理图,其中,所述衍生数值推理图中包括与所述数值单元对应的数字节点、与所述非数值单元对应的非数值节点和与数值操作结果对应的衍生节点;路径表示单元,被配置为将所得到的各个表格单元对应的特征表示和所述衍生数值推理图提供给路径生成模型,得到衍生数值生成路径对应的特征表示;以及解码单元,被配置为将所得到的各个表格单元对应的特征表示、衍生数值生成路径对应的特征表示以及衍生词表提供给文本解码模型,得到与所述表格对应的描述文本,其中,所述衍生词表基于所述数值操作结果集得到。

6、根据本说明书的实施例的另一方面,提供一种用于训练表格生成文本模型的装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的用于训练表格生成文本模型的方法。

7、根据本说明书的实施例的另一方面,提供一种用于侵权判定的装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的基于数值推理的表格生成文本方法。

8、根据本说明书的实施例的另一方面,提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用于训练表格生成文本模型的方法和/或基于数值推理的表格生成文本本文档来自技高网...

【技术保护点】

1.一种用于训练表格生成文本模型的方法,其中,所述表格生成文本模型包括表格编码模型、路径生成模型和文本解码模型,所述方法包括:

2.如权利要求1所述的方法,其中,所述表格编码模型包括非数值编码模型和数值编码模型,

3.如权利要求2所述的方法,其中,所述根据当前数值编码模型以及数值单元和对应的排序编号、域编码,得到各个数值单元对应的特征表示包括:

4.如权利要求1所述的方法,其中,所述将所得到的各个表格单元对应的特征表示和该衍生数值推理图提供给当前路径生成模型,得到衍生数值生成路径对应的特征表示包括:

5.如权利要求1到4中任一所述的方法,其中,所述表格生成文本模型还包括衍生数值编码模型,所述衍生词表中包括根据当前衍生数值编码模型对数值操作结果进行编码而得到的数值操作结果对应的特征表示,

6.一种基于数值推理的表格生成文本方法,包括:

7.如权利要求6所述的方法,其中,所述表格编码模型包括非数值编码模型和数值编码模型,

8.如权利要求7所述的方法,其中,所述根据所述数值编码模型以及数值单元和对应的排序编号、域编码,得到各个数值单元对应的特征表示包括:

9.一种用于训练表格生成文本模型的装置,其中,所述表格生成文本模型包括表格编码模型、路径生成模型和文本解码模型,所述装置被配置为由训练单元利用训练样本集循环执行模型训练过程,直到满足训练结束条件,所述训练样本集中的每个训练样本包括表格和对应的文本标签,所述表格中包括数值单元和非数值单元,所述训练单元包括:

10.一种基于数值推理的表格生成文本装置,包括:

11.一种用于训练表格生成文本模型的装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1至5中任一所述的用于训练表格生成文本模型的方法。

12.一种基于数值推理的表格生成文本装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求6-8中任一所述的基于数值推理的表格生成文本方法。

...

【技术特征摘要】

1.一种用于训练表格生成文本模型的方法,其中,所述表格生成文本模型包括表格编码模型、路径生成模型和文本解码模型,所述方法包括:

2.如权利要求1所述的方法,其中,所述表格编码模型包括非数值编码模型和数值编码模型,

3.如权利要求2所述的方法,其中,所述根据当前数值编码模型以及数值单元和对应的排序编号、域编码,得到各个数值单元对应的特征表示包括:

4.如权利要求1所述的方法,其中,所述将所得到的各个表格单元对应的特征表示和该衍生数值推理图提供给当前路径生成模型,得到衍生数值生成路径对应的特征表示包括:

5.如权利要求1到4中任一所述的方法,其中,所述表格生成文本模型还包括衍生数值编码模型,所述衍生词表中包括根据当前衍生数值编码模型对数值操作结果进行编码而得到的数值操作结果对应的特征表示,

6.一种基于数值推理的表格生成文本方法,包括:

7.如权利要求6所述的方法,其中,所述表格编码模型包括非数值编码模型和数值编码模型,

8.如权利要求7所述的方法,其中,所述根据所述数值...

【专利技术属性】
技术研发人员:林谢雄褚崴
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1