【技术实现步骤摘要】
一种基于混合分组排序和动态实体记忆规划的文本生成方法
[0001]本专利技术属于自然语言处理领域,具体涉及的是一种文本生成方法,适用于将输入的结构化数据转化为描述这些数据的可读性文本问题。
技术介绍
[0002]文本生成任务是自然语言处理领域中的一个重要课题。生活中数据在不同的情况下会以不同的形式出现,甚至某些形式对于非专业领域人员难以理解,例如:知识图谱。并且这些数据转化为可读性文本提供给人们需要耗费大量的时间和精力。而Data
‑
to
‑
text任务旨在将输入的结构化数据自动转化为描述这些数据的可读性文本。
[0003]Reiter
[1]对文本生成系统进行了归纳总结,认为可以分为三个较为独立的模块:(1)内容规划(Content planning),即选择描述哪些数据记录或数据域;(2)句子规划(Sentence planning),即决定所选择的数据记录或数据域在句子中的顺序;(3)句子实现(Surface realization),即基于句子规划的结果生成实际的文本。从直觉上讲,内容规划主要是解决“说什么”,句子规划主要解决“说话顺序”,而句子实现主要是解决“怎么说”。这基本上成为了文本生成系统的范式,近年来越来越多的端到端模型开始增加内容选择和内容规划模块以提升性能。Puduppully等人
[2]提出了一个神经网络架构,将生成任务分为内容选择与规划阶段与句子实现阶段。给定一组数据记录,首先生成一个内容计划,突出显示应该提及哪些信息以及以何种顺序 ...
【技术保护点】
【技术特征摘要】
1.一种基于混合分组排序和动态实体记忆规划的文本生成方法,其特征在于:包括以下步骤:步骤1)以需要生成对应文本的结构化数据集合作为模型输入,所述数据以表格或知识图谱的形式表示,将得到的数据转化为二分图,利用图注意力机制进行嵌入表示;步骤2)将步骤1)得到的数据向量通过分组阶段进行分组排序;分组阶段包含两个模块:长度控制模块和子图观察模块;长度控制模块作用于每一个生成步,结合已生成子图序列的信息映射为概率分布,根据概率分布选择下一时间步生成子图中包含三元组数目LC,则该时间步仅能选择三元组数目为LC的子图,若LC选择为
‑
1,则分组阶段结束,进入步骤5);步骤3)以步骤2)得出的生成子图长度LC控制子图的选择空间,子图观察机制根据对子图中所有结点进行自注意力机制获得子图的表示,并与之前已生成子图序列中子图与结点信息进行注意力机制,生成当前各子图被选择的概率;步骤4)根据步骤3)得出的概率分布选择某一个子图,后利用循环神经网络当前步的隐藏状态更新所有子图中的结点表示,即更新所有子图的表示,返回步骤2);若步骤2)LC选择为
‑
1,得到最终的子图序列,每一个子图中即为所输入结构化数据集合的子集;步骤5)静态内容规划阶段选择生成实体序列SP,以全局节点表示V
global
作为循环神经网络的初始化状态,每一步的选择空间即为步骤4)序列中的对应子图;当生成特殊子图结束标记<EOG>时,循环神经网络下一步的输入为当前子图的表示,下一步的选择空间按步骤4)得出的子图序列顺序获得;当遍历子图序列,则得到最终的静态内容规划SP实体序列;步骤6)将步骤5)得出的SP实体序列通过双向门控循环网络进行编码得到SP序列实体隐藏表示e1‑
n
,n表示SP序列中实体总数;将SP序列隐藏表示传至生成阶段和实体记忆模块;步骤7)实体记忆模块以SP序列实体隐藏表示作为初始内容进行记忆存储;利用生成阶段循环神经网络隐藏状态d
t
‑1更新实体记忆u
t,k
,将实体记忆u
t,k
与d
t
‑1相乘得记忆权重Ψ
t,k
,其中t表示第t个时间步,k表示第k个实体;步骤8)根据生成阶段循环神经网络的隐藏状态d
t
‑1与e1‑
n
做注意力机制得到注意力得分a1‑
n
,将注意力得分a
t,k
与对应实体记忆u
t,k
相乘得实体上下文向量S
t,k
;步骤9)将记忆权重Ψ
t,k
与对应实体上下文向量S
t,k
权重求和得上下文向量q
t
,作为指针生成解码器的输入,采用图结构增强机制对指针解码器进行增强以生成结构化数据对应的转译文本;步骤10)采用三级重构使解码器完整获取编码器所蕴含的信息,分别为根据转译文本重构静态内容规划SP,根据静态内容规划序列去重构分组阶段的子图序列,根据指针生成解码器解码结果恢复为二分图表示。2.根据权利要求1所述的文本生成方法,其特征在于:步骤1)所述数据以表格或知识图谱的形式表示,在表格中结构化数据以记录的形式存在,在知识图谱中结构化数据以三元组的形式存在;以知识图谱作为结构化输入数据,三元组由<头实体,关系,尾实体>构成;将得到的数据转化为二分图,即将三元组中的关系也表示为节点,同时加入全局节点以观察整体图结构系信息;利用图注意力机制对所有结点进行嵌入表示。3.根据权利要求2所述的文本生成方法,其特征在于:SP实体序列通过双向门控循环网
络Bi
‑
GRU得到SP序列实体隐藏表示e1‑
n
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。