当前位置: 首页 > 专利查询>清华大学专利>正文

基于编码-解码深度神经网络的文本摘要生成系统及方法技术方案

技术编号:13680188 阅读:44 留言:0更新日期:2016-09-08 08:08
本发明专利技术公开了一种基于编码‑解码深度神经网络的文本摘要生成系统及方法,系统包括:互联网文本获取模块,用于获取互联网上的文本信息;数据预处理模块,用于对所述文本信息进行预处理;摘要模型训练模块,用于对进行预处理后的文本信息抽取定量文本信息根据编码‑解码深度神经网络模型进行训练,得到摘要训练模型;摘要生成模块,用于根据所述编码‑解码深度神经网络模型对预处理后的文本信息作于出入,输出预设长度的摘要信息。本发明专利技术具有如下优点:利用计算机自动分析并提取或生成文本所表述的中心内容,将文本信息压缩为一个简介连贯的摘要文本,方便用户了解文本内容,从而快速阅读和选择感兴趣的信息;摘要能压缩文本,减少用户的浏览负担。

【技术实现步骤摘要】

本专利技术涉及计算机应用技术与文本挖掘领域,具体涉及一种基于编码-解码深度神经网络的文本摘要生成系统及方法
技术介绍
目前计算机技术正以前所未有的速度飞速发展,尤其随着互联网技术的成熟和普及,计算机网络深刻改变着人们的生活。同时,一些问题也随之产生,特别是网络资源呈现出爆炸式增长,给信息获取带来了极大的困扰。我们正处于一个“信息爆炸”的时代。一方面,互联网存储的海量信息远远超出人们想象;另一方面,面对信息的汪洋大海,人们往往感到束手无策,导致“信息过载”现象。于是,一个极富挑战而又充满实际意义的技术:如何帮助人们快速有效地选择和利用感兴趣的信息,即信息处理技术,成为学术界和工业界所关注的焦点。近年来,网络文本的日益增加,包括新闻、电子杂志、电子邮件、博客、微博等,如此众多的信息,仅仅依靠人工来收集和整理显然是不现实的。所以如何自动收集和整理所需要的各类信息成为了信息处理领域面临的新挑战。传统的网络服务为上网用户提供了一种基于目录的浏览方式,但是随着网络的扩张,网络的组织形式也千变万化,从早期的BBS到新闻站点,从论坛到博客,不同的网站呈现方式、不同的信息发布渠道,使得普通用户很难在短
时间内获取到所需要的信息。后来出现的搜索引擎技术,改变了传统网络提供的浏览模式,引入了搜索手段来帮助用户获取信息。搜索引擎根据特定的算法通过程序从互联网上搜集信息,在对其进行存储和处理后,为用户提供即时的结果展现服务。搜索引擎技术比传统网络服务更容易获取有效信息,是当前最常见的信息获取工具,但是由于搜索引擎大多是基于全网络的搜索,用户仍然无法及时获取单一文本内的信息。面对日益增长的互联网文本信息,人们无法通过一一阅读来了解信息。如何能够信息进行压缩,从而帮助人们快速阅读并选择感兴趣的信息成为一个亟待解决的问题。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的一个目的在于提出一种基于编码-解码深度神经网络的文本摘要生成系统。为了实现上述目的,本专利技术的实施例公开了一种基于编码-解码深度神经网络的文本摘要生成系统,包括:互联网文本获取模块,用于获取互联网上的文本信息;数据预处理模块,用于对所述文本信息进行预处理;摘要模型训练模块,用于对进行预处理后的文本信息抽取定量文本信息根据编码-解码深度神经网络模型进行训练,得到摘要训练模型;摘要生成模块,用于根据所述编码-解码深度神经网络模型对预处理后的文本信息作于出入,输出预设长度的摘要信息;其中,所述编码-解码深度神经网络模型包括:编码模型,用于对输入序列x进行向量化,得到固定长度的隐含状态h,其中,入
序列x=(x1,x2,…,xT),ht=f(xt,ht-1),f()是非线性激活函数,t为时间状态;解码模型,用于对所述固定长度的向量进行解码,得到整个模型输出。根据本专利技术实施例的基于编码-解码深度神经网络的文本摘要生成系统,利用计算机自动分析并提取或生成文本所表述的中心内容,将文本信息压缩为一个简介连贯的摘要文本,人们可以通过阅读摘要来了解文本内容,从而快速阅读和选择感兴趣的信息;摘要不仅能压缩文本,减少用户的浏览负担,又可以为其他文本处理技术提供支持。另外,根据本专利技术上述实施例的基于编码-解码深度神经网络的文本摘要生成系统,还可以具有如下附加的技术特征:进一步地,所述编码模型进一步根据第一循环神经网络和第二循环神经网络分别以两个互为相反的方向对一个句子进行编码得到第一隐含状态h1和第二隐含状态h2,所述将编码模型还用于将所述第一隐含状态h1和所述第二隐含状态h2进行拼接作为所述隐含状态h。进一步地,所述数据预处理模块对所述文本信息进行预处理包括对所述文本信息进行分词处理、去除低词频词语和停用词中的一种或多种。进一步地,所述f()为逻辑斯蒂函数或长短期记忆单元。为了实现上述目的,本专利技术的实施例公开了一种基于编码-解码深度神经网络的文本摘要生成方法,包括以下步骤:S1:获取互联网上的文本信息;S2:对所述文本信息进行预处理;S3:对进行预处理后的文本信息抽取定量文本信息根据编码-解码深度神经网络模型进行训练,得到摘要训练模型;S4:根据所述编码-解码深度神经网络模型对预处理后的文本信息作于输入,输出预设长度的摘要信息;其中,所述编码-解码深度神经网络模型包括:编码模型,用于对输入序列x进行向量化,得到固定长度的隐含状态h,
其中,输入序列x=(x1,x2,…,xT),ht=f(xt,ht-1),f()是非线性激活函数,t为时间状态;解码模型,用于对所述固定长度的向量进行解码,得到整个模型输出。根据本专利技术实施例的基于编码-解码深度神经网络的文本摘要生成方法,利用计算机自动分析并提取或生成文本所表述的中心内容,将文本信息压缩为一个简介连贯的摘要文本,人们可以通过阅读摘要来了解文本内容,从而快速阅读和选择感兴趣的信息;摘要不仅能压缩文本,减少用户的浏览负担,又可以为其他文本处理技术提供支持。另外,根据本专利技术上述实施例的基于编码-解码深度神经网络的文本摘要生成方法,还可以具有如下附加的技术特征:进一步地,所述编码模型进一步根据第一循环神经网络和第二循环神经网络分别以两个互为相反的方向对一个句子进行编码得到第一隐含状态h1和第二隐含状态h2,所述将编码模型还用于将所述第一隐含状态h1和所述第二隐含状态h2进行拼接作为所述隐含状态h。进一步地,在步骤S2中,所述对所述文本信息进行预处理进一步包括对所述文本信息进行分词处理、去除低词频词语和停用词中的一种或多种。进一步地,所述f()为逻辑斯蒂函数或长短期记忆单元。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一个实施例的基于编码-解码深度神经网络的文本摘要生成
系统的结构示意图;图2是本专利技术一个实施例的基于编码-解码深度神经网络的互联网文本摘要生成方法的流程图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。参照下面的描述和附图,将清楚本专利技术的实施例的这些和其他方面。在这些描述和附图中,具体公开了本专利技术的实施例中的一些特定实施方式,来表示实施本专利技术的实施例的原理的一些方式,但是应当理解,本专利技术的实施例的范围不受此限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。以下结合附图描述根据本专利技术实施例的基于编码-解码深度神经网络的文本摘要生成系统。请参考图1,一种基于编码-解码深度神经网络的互联网文本摘要生成系统,包括互联网文本获取模块101、数据预处理模块102、摘要模型训练模块103、摘要生成模块104。其中,互联网文本获取模块101用于获取互联网上的文本信息。具体地,互联网文本获取模块101利用爬虫技术获取互联网上的文本信息。这里文本信息主要指的是各类新闻内容。本模块利用Python语言撰写本文档来自技高网
...

【技术保护点】
一种基于编码‑解码深度神经网络的文本摘要生成系统,其特征在于,包括:互联网文本获取模块,用于获取互联网上的文本信息;数据预处理模块,用于对所述文本信息进行预处理;摘要模型训练模块,用于对进行预处理后的文本信息抽取定量文本信息根据编码‑解码深度神经网络模型进行训练,得到摘要训练模型;摘要生成模块,用于根据所述编码‑解码深度神经网络模型对预处理后的文本信息作于出入,输出预设长度的摘要信息;其中,所述编码‑解码深度神经网络模型包括:编码模型,用于对输入序列x进行向量化,得到固定长度的隐含状态h,其中,输入序列x=(x1,x2,…,xT),ht=f(xt,ht‑1),f()是非线性激活函数,t为时间状态;解码模型,用于对所述固定长度的向量进行解码,得到整个模型输出。

【技术特征摘要】
1.一种基于编码-解码深度神经网络的文本摘要生成系统,其特征在于,包括:互联网文本获取模块,用于获取互联网上的文本信息;数据预处理模块,用于对所述文本信息进行预处理;摘要模型训练模块,用于对进行预处理后的文本信息抽取定量文本信息根据编码-解码深度神经网络模型进行训练,得到摘要训练模型;摘要生成模块,用于根据所述编码-解码深度神经网络模型对预处理后的文本信息作于出入,输出预设长度的摘要信息;其中,所述编码-解码深度神经网络模型包括:编码模型,用于对输入序列x进行向量化,得到固定长度的隐含状态h,其中,输入序列x=(x1,x2,…,xT),ht=f(xt,ht-1),f()是非线性激活函数,t为时间状态;解码模型,用于对所述固定长度的向量进行解码,得到整个模型输出。2.根据权利要求1所述的基于编码-解码深度神经网络的文本摘要生成系统,其特征在于,所述编码模型进一步根据第一循环神经网络和第二循环神经网络分别以两个互为相反的方向对一个句子进行编码得到第一隐含状态h1和第二隐含状态h2,所述将编码模型还用于将所述第一隐含状态h1和所述第二隐含状态h2进行拼接作为所述隐含状态h。3.根据权利要求1所述的基于编码-解码深度神经网络的文本摘要生成系统,其特征在于,所述数据预处理模块对所述文本信息进行预处理包括对所述文本信息进行分词处理、去除低词频词语和停用词中的一种或多种。4.根据权利要求1所述的基于编码-解码深度神经网络的文本摘要生成系统,其特征在于,所述f()为逻辑斯...

【专利技术属性】
技术研发人员:徐华李佳邓俊辉孙晓民
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1