【技术实现步骤摘要】
一种优化的文本摘要生成方法
:本专利技术属于自然语言生成领域,尤其涉及序列到序列文本摘要生成的相关方法。
技术介绍
:随着信息技术的快速发展,信息爆炸正在冲击着人们的生活。一方面,现在互联网存在大量网页与文本,但是其中内容相关的文本之间存在大量多余的内容,人们阅读和获取这些重复内容耗费了大量的时间与精力。另一方面,社会发展加快人们的生活节奏,越来越碎片化的时间驱使人们通过互联网获取内容,而不是通过传统的书籍等纸质资料。因此为了解决如何从大量的文本信息中提取其中的主要内容,已经成为当今学术研究的热点。有关文本摘要的问题,众多国内外学者对这一领域有着很深的见解,提出过很多可用性的文本摘要技术。最早有学者提出抽取式文本摘要(ExtractiveTextSummarization,ETS)方法,这类方法主要使用传统的统计学方法抽取出能概括内容主旨的片段。虽然这种方法一定程度的可以获取主要内容,但是有一个主要问题是,获取的摘要可能有语义不连贯的问题。随后,有学者提出生成式文本摘要(AbstractiveTextSummariz ...
【技术保护点】
1.一种优化文本摘要生成的方法,其特征在于,包括以下步骤:/n步骤1、获取相关需要生成摘要的文本数据,并进行文本数据的处理;/n步骤2、对处理好的文本,构建相关字典,每个词对应一个唯一id,设置词向量维度,随机初始化所有词向量;/n步骤3、将文章输入的向量输入模型Encoder端的AS-CNN进行特征提取;/n步骤4、AS-CNN提取的特征向量送入Transformer的Decoder端进行解码,生成文章的摘要。/n
【技术特征摘要】
1.一种优化文本摘要生成的方法,其特征在于,包括以下步骤:
步骤1、获取相关需要生成摘要的文本数据,并进行文本数据的处理;
步骤2、对处理好的文本,构建相关字典,每个词对应一个唯一id,设置词向量维度,随机初始化所有词向量;
步骤3、将文章输入的向量输入模型Encoder端的AS-CNN进行特征提取;
步骤4、AS-CNN提取的特征向量送入Transformer的Decoder端进行解码,生成文章的摘要。
2.根据权利要求1所述的方法,其特征在于,步骤3具体包括以下步骤:
步骤3.1、根据文章的长度设置卷积核的大小,以及每个卷积核的数量;
步骤3.2、不同卷积核提取出的特征提取出不同长度的句子特征;
步骤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。