一种摘要抽取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37153933 阅读:22 留言:0更新日期:2023-04-06 22:13


【技术实现步骤摘要】
一种摘要抽取方法、装置、电子设备及存储介质


[0001]本专利技术实施例涉及自然语言处理领域,尤其涉及一种摘要抽取方法、装置、电子设备及存储介质。

技术介绍

[0002]摘要抽取是自然语言处理领域中最重要的研究方向之一,其用于从文档中抽取出能够覆盖文档信息的重要句子。
[0003]目前采用的摘要抽取方案,主要基于传统机器学习或是Seq2Seq框架实现。但是,基于这些方案抽取出的摘要的准确度不高,有待改进。

技术实现思路

[0004]本专利技术实施例提供了一种摘要抽取方法、装置、电子设备及存储介质,以提要摘要抽取的准确度。
[0005]根据本专利技术的一方面,提供了一种摘要抽取方法,可以包括:
[0006]获取目标文档以及已训练完成的摘要抽取模型,其中,摘要抽取模型包括依次连接的异构超图构建层、异构超图更新层和句子分类层;
[0007]将目标文档输入到异构超图构建层,以通过异构超图构建层为目标文档构建出包含词超边、句子节点和摘要标签节点的摘要

文档异构超图,其中,摘要标签节点所表本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种摘要抽取方法,其特征在于,包括:获取目标文档以及已训练完成的摘要抽取模型,其中,所述摘要抽取模型包括依次连接的异构超图构建层、异构超图更新层和句子分类层;将所述目标文档输入到所述异构超图构建层,以通过所述异构超图构建层为所述目标文档构建出包含词超边、句子节点和摘要标签节点的摘要

文档异构超图,其中,所述摘要标签节点所表征的摘要标签虚构得到;将所述摘要

文档异构超图输入到所述异构超图更新层,以通过所述异构超图更新层更新所述词超边、句子节点和摘要标签节点,得到更新异构超图;将所述更新异构超图输入到所述句子分类层,得到从所述目标文档中抽取出的至少一个摘要句子,基于所述至少一个摘要句子得到所述目标文档的摘要。2.根据权利要求1所述的方法,其特征在于,所述异构超图更新层通过如下步骤实现所述词超边的更新过程:获取与多头注意力网络配合的词超边更新函数,并且基于所述词超边更新函数对所述词超边进行更新,得到更新后超边;获取聚合函数,并且基于所述聚合函数对所述更新后超边的表示信息进行更新,以完成所述词超边的更新过程。3.根据权利要求1所述的方法,其特征在于,所述异构超图更新层通过如下步骤实现所述句子节点的更新过程:获取与词频

逆文本频率指数有关的句子节点更新函数,并且基于所述句子节点更新函数对所述句子节点进行更新,以完成所述句子节点的更新过程。4.根据权利要求1所述的方法,其特征在于,所述异构超图更新层通过如下步骤实现所述摘要标签节点的更新过程:获取与Transformer网络和句子位置信息有关的摘要标签节点更新函数,并且基于所述摘要标签节点更新函数对所述摘要标签节点进行更新,以完成所述摘要标签节点的更新过程。5.根据权利要求1所述的方法,其特征在于,所述句子分类层通过如下步骤实现所述摘要句子的抽取过程:将所述更新异构超图中的更新后的所述句子节点作为更新后节点;针对所述更新异构超图中的每个所述更新后节点对应的句子表示,将所述句子表示与所述摘要标签对应的标签表示进行语义匹配,并根据语义匹配结果确定是否将所述目标文档中与所述句子表示对应的文档句子作为摘要句子。6.根据权利要求1所述的方法,其特征在于,所述异构超图更新层,用于在更新所述词超边和所述句子节点之前,将所述目标...

【专利技术属性】
技术研发人员:蒋胜臣郭林海张琛万化
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1