一种基于条件变分自编码器的问题扩展方法技术

技术编号：33035507 阅读：9 留言：0更新日期：2022-04-15 09:13

本发明专利技术公开了一种基于条件变分自编码器的问题扩展方法，包括以下步骤：CVAE的编码端使用了BERT获取均值μ和方差σ2；使用得到的均值μ和方差σ2构造掩码z；CVAE的解码端使用了Transformer，用Transformer的解码器来进行预测输出，将标准问题传入Transformer编码器获得输出；将一个扩展问题嵌入表示与掩码z合并，传入Transformer的解码器，进行自注意力计算，然后与Transformer编码器的输出做普通注意力计算；对Transformer解码器生成的问题句子进行扩展，生成任意数量的k个问题句子。本发明专利技术可以针对原标准问题进行复述或扩展。明可以针对原标准问题进行复述或扩展。明可以针对原标准问题进行复述或扩展。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于条件变分自编码器的问题扩展方法

[0001]本专利技术涉及计算机领域中的自然语言处理技术，特别是一种基于条件变分自编码器的问题扩展方法。

技术介绍

[0002]对于自然语言处理中的生成任务，如智能问题回答，神经机器翻译，句子复述等任务，通常面临训练样本少以及生成的多样性较差的问题。问题在智能问题回答中占有重要地位，因为在开放式的智能问答系统中，问题的分析和复述扩展是关键的第一步，通常在这一步中，为了提高召回率，给定的标准问题会扩展其各种释义来重组。但是扩展的问题效果并不好。通常作为训练样本的问题一般会数量很少，如果采用传统的人工方式进行问题扩展，效率低下、强度大、周期长，显然不能满足问题扩展的需求。因此，需要研究问题扩展技术，通过已有的标准问题，对其进行扩展，生成多个相似的扩展问题，从而可以进行数据增强，增加训练样本的数量，对之后模型的训练与效果的提升打下坚实的基础。
[0003]问题扩展是自然语言处理中的一个关键问题，传统的解决方法是：
[0004]采用端到端模型即Seq2seq进行生成，如采用变分自编码器(VAE)来实现。
[0005]采用集束搜索(Beam Search)来增加多样性。
[0006]传统的变分自编码器(VAE)模型是一种深层生成的潜变量模型，允许学习高维输入的非线性表示，通过学习输入x的潜在表示或隐码z来实现，使得可以从隐码z中很好的重构原始输入x。VAE的编码器通过确定性编码函数来学习隐码z，它实际上是隐码z上的一个后验分布，后验分布通常被认为是高斯分布...

【技术保护点】

【技术特征摘要】
1.一种基于条件变分自编码器的问题扩展方法，其特征在于：包括以下步骤：步骤1)：CVAE的编码端使用了BERT获取均值μ和方差σ2；步骤2)：使用得到的均值μ和方差σ2构造掩码z；步骤3)：CVAE的解码端使用了Transformer，用Transformer的解码器来进行预测输出，将标准问题传入Transformer编码器获得输出；步骤4)：将一个扩展问题的嵌入表示与掩码z合并，传入Transformer的解码器，进行自注意力计算，然后与Transformer编码器的输出做普通注意力计算；步骤5)：对Transformer解码器生成的问题句子进行扩展，生成任意数量的k个问题句子。2.根据权利要求1所述的一种基于条件变分自编码器的问题扩展方法，其特征在于：所述的步骤1)实现的具体步骤包括：步骤11)输入为一个标准问题与该问题的一个扩展问，通过嵌入查找来获得输入的词嵌入表示，位置嵌入表示，以及句子嵌入表示；步骤12)将获得的所有嵌入表示一起输入BERT，即通过12层编码器，在每一层编码器都采用了自注意力机制来学习信息，然后通过一个全连接层将之前学习到的信息处理后传递给下一层编码器；BERT会在句子前加一个[CLS]标志，最后一层的[CLS]作为整个序列或整句话的语义信息；[CLS]的信息经线性变换后得到均值μ和方差σ2。3.根据权利要求1所述的一种基于条件变分自编码器的问题扩展方法，其特征在于：所述的步骤2)实现的具体步骤包括：步骤21)由步骤1)获得了均值μ和方差σ2，从N(μ，σ2)中采样一个z，相当于从N(0，1)中随机采样一个β，然后使用重参数技巧让z＝μ+β*σ，这样就得到掩码z；步骤22)...

【专利技术属性】
技术研发人员：李敬鑫，
申请(专利权)人：中科国力镇江智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人