一种文本摘要的生成方法、存储介质和服务器技术

技术编号：20588952 阅读：13 留言：0更新日期：2019-03-16 07:11

本发明专利技术涉及计算机技术领域，提出一种文本摘要的生成方法、存储介质和服务器。所述文本摘要的生成方法包括：获取待处理的文本集合，所述文本集合包含多个内容相互关联的文本；分别提取所述文本集合中每个文本的关键词；将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要。本发明专利技术预先构建一个带有注意力机制的seq2seq模型，通过提取多个内容相互关联的文本中的关键词，并将提取到的关键词输入该模型，然后将该模型的输出结果作为所述多个文本共同的文本摘要输出，从而解决了现有技术无法生成多篇文章共同的文本摘要的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本摘要的生成方法、存储介质和服务器
本专利技术涉及计算机
，尤其涉及一种文本摘要的生成方法、存储介质和服务器。
技术介绍
摘要是能够反映文章中心内容的一段文本，能够帮助人们在阅读长篇的文章时缩短阅读时间。文本摘要生成技术是知识管理系统核心功能之一，近年来得到了迅速的发展。然而，现有的文本摘要生成技术局限于生成某一篇文章的摘要，而在实际需求中，有时候需要针对多篇相同主题的文章生成它们的共同摘要，目前尚无有效的方法能够实现该需求。
技术实现思路
有鉴于此，本专利技术实施例提供了一种文本摘要的生成方法、存储介质和服务器，旨在解决现有技术无法生成多篇文章共同的文本摘要的问题。本专利技术实施例的第一方面，提供了一种文本摘要的生成方法，包括：获取待处理的文本集合，所述文本集合包含多个内容相互关联的文本；分别提取所述文本集合中每个文本的关键词；将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要，所述第一神经网络模型为带有注意力机制的seq2seq模型，用于根据输入的词汇或字符生成相应的文本摘要。本专利技术实施例的第二方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如本专利技术实施例的第一方面提出的文本摘要的生成方法的步骤。本专利技术实施例的第三方面，提供了一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：获取待处理的文本集合，所述文本集合包含多个内容相互关联的文本；分别提取所述文...

【技术保护点】
1.一种文本摘要的生成方法，其特征在于，包括：获取待处理的文本集合，所述文本集合包含多个内容相互关联的文本；分别提取所述文本集合中每个文本的关键词；将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要，所述第一神经网络模型为带有注意力机制的seq2seq模型，用于根据输入的词汇或字符生成相应的文本摘要。

【技术特征摘要】
1.一种文本摘要的生成方法，其特征在于，包括：获取待处理的文本集合，所述文本集合包含多个内容相互关联的文本；分别提取所述文本集合中每个文本的关键词；将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要，所述第一神经网络模型为带有注意力机制的seq2seq模型，用于根据输入的词汇或字符生成相应的文本摘要。2.根据权利要求1所述的文本摘要的生成方法，其特征在于，所述分别提取所述文本集合中每个文本的关键词包括：分别对所述每个文本进行预处理，所述预处理包括文本分段、文本分句、文本分词、去除停用词以及根据词向量模型将文本转换为词向量；将预处理后的所述每个文本分别输入所述第一神经网络模型，输出所述每个文本独立的文本摘要；对所述独立的文本摘要中的每个词汇进行词性标注；将词性标注为动词或名词的词汇从所述独立的文本摘要中提取出来，作为关键词。3.根据权利要求2所述的文本摘要的生成方法，其特征在于，所述将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要包括：分别统计各个所述关键词在所述独立的文本摘要中的出现次数；将各个所述关键词按照所述出现次数由高至低的顺序依次输入所述第一神经网络模型，输出所述文本集合的文本摘要。4.根据权利要求1所述的文本摘要的生成方法，其特征在于，所述分别提取所述文本集合中每个文本的关键词包括：分别对所述每个文本进行文本分词操作，得到初始词汇集；去除所述初始词汇集中的停用词；将去除停用词后的所述初始词汇集转换为TF-IDF词频矩阵；将所述词频矩阵中词频最高的预设数量的词汇提取出来，作为关键词。5.根据权利要求4所述的文本摘要的生成方法，其特征在于，所述将提取到的关键词输入预先训练完成的第一神经网络模型，输出所述文本集合的文本摘要包括：将各个所述关键词按照所述词频由高至低的顺序依次输入所述第一神经网络模型，输出所述文本集合的文本摘要。6.根据权利要求1至5中任一项所述的文本摘要的生成方法，其特征在于，在输出所述文本集合的文本摘要之后，还包括：分别获取所述每个文本的标题；从所述每...

【专利技术属性】
技术研发人员：吴壮伟，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人