文本摘要的生成方法、装置及计算机设备制造方法及图纸

技术编号:32119260 阅读:21 留言:0更新日期:2022-01-29 19:05
本申请实施例属于人工智能和自然语言处理领域,应用于文本处理领域中,涉及一种文本摘要的生成方法、装置、计算机设备及存储介质,方法包括获取样本文本序列进行编码,得到所述样本文本序列的文本输入向量;从所述样本文本序列的随机位置开始进行掩码,得到掩码文本序列,所述掩码的长度为等差变化;对所述掩码文本序列进行位置编码,生成位置向量;基于所述位置向量与所述文本输入向量,对文本摘要模型进行训练,得到预训练的文本摘要模型;将目标文本输入到所述预训练的文本摘要模型,生成目标文本的摘要内容。该方法使得文本摘要模型能够捕捉长距离的依赖信息,进一步捕捉原始文本内蕴含的信息,解决长距离依赖带来的信息丢失问题。问题。问题。

【技术实现步骤摘要】
文本摘要的生成方法、装置及计算机设备


[0001]本申请涉及人工智能
和自然语言处理领域,尤其涉及一种文本摘要的生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]人们日常生活工作中积累产生了大量的文本信息,以往需要耗费大量精力阅读这些文本,从而获得真正的有用信息。通过文本摘要技术能够将原来冗长的文本内容压缩为较短的内容,同时保留被压缩前文本的核心观点,从而在很大程度上为人们减轻了工作负担。
[0003]早期文本摘要主要是采用抽取式摘要的思路,通过各种方法直接选择被压缩文本中的句子,形成摘要,但这种思想最大的缺点在于缺乏对整个文档内容更高语义层面的概括,无法建立段落中的完整语义信息。而生成式摘要则是通过神经网络模型捕捉语义信息,直接生成文本序列作为最后的摘要,近年来在不少公开测试集上已经超越了最好的抽取式模型。但现有生成式摘要技术多采用seq2seq架构,即通过编码器将原文本编码为包含上下文语义信息的向量,再通过解码器从该向量中得到文本序列,即将该文本序列视为最后生成的文本摘要。但缺点是当文本序列长度过长时,由于众所周知本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本摘要的生成方法,其特征在于,包括下述步骤:获取样本文本序列进行编码,得到所述样本文本序列的文本输入向量;从所述样本文本序列的随机位置开始进行掩码,得到掩码文本序列,所述掩码的长度为等差变化;对所述掩码文本序列进行位置编码,生成位置向量;基于所述位置向量与所述文本输入向量,对文本摘要模型进行训练,得到预训练的文本摘要模型;将目标文本输入到所述预训练的文本摘要模型,生成目标文本的摘要内容。2.根据权利要求1所述的文本摘要的生成方法,其特征在于,获取样本文本序列进行编码,得到所述样本文本序列的文本输入向量的步骤具体包括:通过词嵌入算法将所述样本文本序列中每个字符转换为固定维度的字符向量,以得到所述样本文本序列的文本输入向量。3.根据权利要求2所述的文本摘要的生成方法,其特征在于,所述从所述样本文本序列的随机位置开始进行掩码,得到掩码文本序列的步骤包括:根据所述样本文本序列的长度,确定最大掩码长度;在所述样本文本序列中的随机确定掩码起始位置;从所述掩码起始位置开始,以等差数列的形式对所述样本文本序列进行掩码,得到掩码文本序列。4.根据权利要求3所述的文本摘要的生成方法,其特征在于,所述从所述掩码起始位置开始,以等差数列的形式对所述样本文本序列进行掩码的步骤包括:从所述掩码起始位置开始,间隔第一等差数列,通过第二等差数列对所述样本文本序列进行掩码。5.根据权利要求4所述的文本摘要的生成方法,其特征在于,所述对所述掩码文本序列进行位置编码,生成位置向量的步骤包括:确定各个被掩码部分在所述掩码文本序列的第一序列位置,所述被掩码部分中包括至少一个被掩码字符;确定各个被掩码部分对应的文本内容,根据文本内容确定对应被掩码部分的加权位置;确定各个被掩码字符在所述被...

【专利技术属性】
技术研发人员:王伟黄勇其于翠翠张黔
申请(专利权)人:润联智慧科技西安有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1