The embodiment of the present invention discloses a text summary generation method, device, computer equipment and storage medium. The invention is applied to the field of neural networks in prediction models. The method includes: preprocessing the target text and transforming the preprocessed target text by word vector tool to get the word vector; constructing a text summary model based on encoding and decoding, taking word vector as input of the text summary model and training the text summary model to output the sentences to be extracted in a cyclic iteration manner; preprocessing the text. The word vector of the text to be processed is input into the training text summary model to output multiple sentences to be extracted. According to the preset scoring function model, the sentences to be extracted are scored, and the text summary is generated according to the scoring of the sentences to be extracted. The method of implementing the embodiment of the present invention can quickly generate a text summary and effectively improve the accuracy of the text summary.
【技术实现步骤摘要】
文本摘要生成方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种文本摘要生成方法、装置、计算机设备及存储介质。
技术介绍
随着科技的进步与发展,人工智能时代已悄然而至,人们的日常生活中已开始逐渐涉及人工智能。在如今信息爆炸的时代,无时无刻都在产生巨量的信息,如网页新闻、微博、微信文章以及邮件等等。为了实现用户能够快速高效地获取到所需要的信息,需要对文本信息进行收集整理成文本摘要以供用户快速浏览。现有的文本摘要生成方法主要是抽取式,通过从目标文本中提取句子来生成文本摘要,但是该方法生成文本摘要的耗时较长,且文本摘要的精度不高,用户的阅读体验差。
技术实现思路
本专利技术实施例提供了一种文本摘要生成方法、装置、计算机设备及存储介质,旨在解决文本摘要生成耗时长、精度低以及用户阅读体验差的问题。第一方面,本专利技术实施例提供了一种文本摘要生成方法,其包括:对目标文本进行预处理并通过词向量工具对预处理后的目标文本进行转换以得到词向量;构建以编码解码为框架的文本摘要模型,将所述词向量作为所述文本摘要模型的输入并以循环迭代的方式对所述文本摘要模型进行训练输 ...
【技术保护点】
1.一种文本摘要生成方法,其特征在于,包括:对目标文本进行预处理并通过词向量工具对预处理后的目标文本进行转换以得到词向量;构建以编码解码为框架的文本摘要模型,将所述词向量作为所述文本摘要模型的输入并以循环迭代的方式对所述文本摘要模型进行训练输出待抽取的句子;对待处理文本进行预处理并转换为词向量,将所述待处理文本的词向量输入到训练后的文本摘要模型中输出多个待抽取的句子;根据预设评分函数模型对所述多个待抽取的句子进行评分,并根据所述待抽取的句子的评分生成文本摘要。
【技术特征摘要】
1.一种文本摘要生成方法,其特征在于,包括:对目标文本进行预处理并通过词向量工具对预处理后的目标文本进行转换以得到词向量;构建以编码解码为框架的文本摘要模型,将所述词向量作为所述文本摘要模型的输入并以循环迭代的方式对所述文本摘要模型进行训练输出待抽取的句子;对待处理文本进行预处理并转换为词向量,将所述待处理文本的词向量输入到训练后的文本摘要模型中输出多个待抽取的句子;根据预设评分函数模型对所述多个待抽取的句子进行评分,并根据所述待抽取的句子的评分生成文本摘要。2.根据权利要求1所述的文本摘要生成方法,其特征在于,所述对目标文本进行预处理并通过词向量工具对预处理后的目标文本进行转换以得到词向量,包括:获取目标文本进行分词并根据所述分词进行编码得到初始词向量;通过词向量工具将所述初始词向量进行转换得到词向量。3.根据权利要求1所述的文本摘要生成方法,其特征在于,所述构建以编码解码为框架的文本摘要模型,将所述词向量作为所述文本摘要模型的输入并以循环迭代的方式对所述文本摘要模型进行训练输出待抽取的句子,包括:将双向门控循环单元神经网络作为编码器以及解码器并在所述解码器的解码阶段引入注意力机制构建文本摘要模型;将所述词向量作为所述文本摘要模型的输入并根据循环迭代的方式对所述文本摘要模型进行训练。4.根据权利要求3所述的文本摘要生成方法,其特征在于,所述将所述词向量作为所述文本摘要模型的输入并根据循环迭代的方式对所述文本摘要模型进行训练,包括:将所述词向量输入至双向门控循环单元神经网络编码器进行编码得到句子的编码向量;将所述句子的编码向量输入至双向门控循环单元神经网络解码器进行解码得到待抽取的句子;通过注意力机制将所述待抽取的句子反馈至所述解码器作为下一次解码的输入并以循环迭代的方式进行训练。5.根据权利要求1所述的文本摘要生成方法,其特征在于,所述根据预设评分函数模型对所述多个待抽取的句子进行...
【专利技术属性】
技术研发人员:金戈,徐亮,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。