文本摘要生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21089790 阅读:35 留言:0更新日期:2019-05-11 10:02
本发明专利技术公开了一种文本摘要生成方法,应用于计算机技术领域,该方法包括:对待处理文本进行预处理,得到句子集合,计算句子集合内每两个句子间的相似度,根据预置模型和每两个句子间的相似度,计算句子集合中各句子的得分并迭代至预置模型收敛,基于各句子的得分,提取候选文摘句,并按照候选文摘句在待处理文本中的先后顺序进行排序,生成待处理文本的文本摘要,本发明专利技术还公开了一种文本摘要生成装置、电子设备及存储介质,提高生成的文本摘要的准确性,使用户可通过阅读生成文本摘要判断该文本是否为误报或者漏报。

【技术实现步骤摘要】
文本摘要生成方法、装置、电子设备及存储介质
本专利技术涉及计算机
,尤其涉及一种文本摘要生成方法、装置、电子设备及存储介质。
技术介绍
文本摘要是对一个或多个给定的文本自动创建一个压缩版文本的过程,该压缩版文本能够为用户提供简洁精炼的有用信息。因此借助计算机生成文本摘要的技术应运而生,人们可通过阅读简洁精炼的文本摘要而非整篇文本来把握主要内容,进而处理该文本。借助计算机生成文本摘要的方式主要有两种,分别是Extractivesummarization和Abstractivesummarization。Extractivesummarization是提取式自动文本摘要方法,通过提取原始文本中的一组最重要的句子形成文摘。Abstractivesummarization是生成式自动文本摘要方法,通过自然语言生成技术创建抽象的语义表示形成文摘。现有技术中,通常采用提取式自动文本摘要方法来生成文本摘要,但是生成的文本摘要的准确性差。
技术实现思路
本专利技术的主要目的在于提供一种文本摘要生成方法、装置、电子设备及存储介质,提高生成的文本摘要的准确性。为实现上述目的,本专利技术实施例第一方面提本文档来自技高网...

【技术保护点】
1.一种文本摘要生成方法,其特征在于,包括:对待处理文本进行预处理,得到句子集合;计算所述句子集合内每两个句子间的相似度;根据预置模型和所述每两个句子间的相似度,计算所述句子集合中各句子的得分并迭代至所述预置模型收敛;基于所述各句子的得分,提取候选文摘句,并按照所述候选文摘句在所述待处理文本中的先后顺序进行排序,生成所述待处理文本的文本摘要。

【技术特征摘要】
1.一种文本摘要生成方法,其特征在于,包括:对待处理文本进行预处理,得到句子集合;计算所述句子集合内每两个句子间的相似度;根据预置模型和所述每两个句子间的相似度,计算所述句子集合中各句子的得分并迭代至所述预置模型收敛;基于所述各句子的得分,提取候选文摘句,并按照所述候选文摘句在所述待处理文本中的先后顺序进行排序,生成所述待处理文本的文本摘要。2.根据权利要求1所述的方法,其特征在于,所述对待处理文本进行预处理包括:将所述待处理文本切分成多个句子,并过滤所述多个句子中不能成为文本摘要的句子,其中,令待处理文本为T,Si为第i个句子,所述过滤所述多个句子中不能成为文本摘要的句子后剩余句子的数量为m个,则T=[S1,S2,...,Sp,...,Sm];去除所述剩余各句子中的停用词、代词、量词、数词、介词、方位词、副词、时间词和标点符号,并将所述剩余句子构建成句子图,其中,令所述句子图为G,句子节点集合为V,无向有权边集合为E,单个句子中词的数量为n个,则G=(V,E),Si∈V,则Si=[ti,1,ti,2,...,ti,n],ti,j∈Si。3.根据权利要求2所述的方法,其特征在于,所述计算所述句子集合内每两个句子间的相似度包括:假设所述T=[S1,S2,...,Sm]中的每两个句子均相连,构建所述句子图G=(V,E)中的无向有权边集合E,所述无向有权边集合E中各无向有权边的权重值为组成所述无向有权边的两个句子节点的相似度值;其中,令句子Si和Sj组成的无向有权边的权重值为wji,令句子Si和Sj之间的相似度为Similarity(Si,Sj),则wji=Similarity(Si,Sj)。4.根据权利要求1所述的方法,其特征在于,所述根据预置模型,计算所述句子集合中各句子的得分包括:所述预置模型:其中,阻尼系数为d,第i个句子节点为Vi,第j个句子节点为Vj,句子节点Vi的得分为S(Vi),链入句子节点Vi的句子节点集合为In(Vi),In(Vi)中句子节点集合中句子节点Vj的链出句子节点集合为Out(Vj),句子节点Vj和句子节点Vi的相似度为wji,句子节点Vj和句子节点Vk的相似度为wjk,In(Vi)中句子节点集合中句子节点Vj的得分为S(Vj)。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述迭代至所述预置模型收敛包括:根据预...

【专利技术属性】
技术研发人员:朱细智
申请(专利权)人:北京奇安信科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1