文本摘要抽取方法、装置、存储介质、电子设备及产品制造方法及图纸

技术编号:41010408 阅读:20 留言:0更新日期:2024-04-18 21:46
本申请公开了一种文本摘要抽取方法、装置、存储介质、电子设备及产品,涉及人工智能技术领域,本申请可以应用于区块链、云技术及地图车联网等领域,该方法包括:获取文本中的词、多元分词及句子;构建异构图,所述异构图中包括所述词、多元分词及句子对应的节点,其中,具有归属关系的词、多元分词及句子对应的节点之间通过边连接;基于所述异构图进行近邻节点联合特征提取处理,得到所述异构图中节点的节点特征;基于所述异构图中节点的节点特征,抽取所述文本中文本元素生成摘要,文本元素包括词、多元分词及句子中至少一种。本申请可以有效提升文本摘要抽取效果且抽取成本低。

【技术实现步骤摘要】

本申请涉及人工智能,具体涉及一种文本摘要抽取方法、装置、存储介质、电子设备及产品


技术介绍

1、文本摘要抽取即抽取式形成文本摘要,即从文本中抽取一些句子来形成文本的摘要。文本摘要抽取通常可以分为无监督抽取和有监督抽取。

2、有监督抽取的方式往往需要大规模的带标签数据作为模型的训练数据,数据的标注成本较高,导致文本摘要抽取成本较高。无监督抽取的相关技术中,通过词频-逆文本频率指数(tf-idf)统计和预训练模型等常规特征提取方式计算句子的句子特征,并根据句子特征抽取文本中句子形成摘要的方式;词频-逆文本频率指数统计的方式较为粗糙简单;预训练模型计算的方式对句子的长度有要求,存在长依赖问题,可扩展性不佳,需要大规模、高质量的句子样本微调,且模型的优化目标较为单一;这些常规特征提取方式下通常句子特征对句子的表征能力不足,导致句子的抽取效果较差,文本摘要抽取效果较差。

3、因此,目前存在文本摘要抽取成本较高以及文本摘要抽取效果较差的问题。


技术实现思路

1、本申请实施例提供一种文本摘要抽取方本文档来自技高网...

【技术保护点】

1.一种文本摘要抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述异构图进行近邻节点联合特征提取处理,得到所述异构图中节点的节点特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述异构图中进行节点搜索,得到至少一个节点序列,包括:

4.根据权利要求3所述的方法,其特征在于,所述节点元路径为词、多元分词、句子、多元分词及词对应的节点依次串联所形成的路径;

5.根据权利要求1所述的方法,其特征在于,所述基于所述异构图中节点的节点特征,抽取所述文本中文本元素生成摘要,包括:>

6.根据权利...

【技术特征摘要】

1.一种文本摘要抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述异构图进行近邻节点联合特征提取处理,得到所述异构图中节点的节点特征,包括:

3.根据权利要求2所述的方法,其特征在于,所述从所述异构图中进行节点搜索,得到至少一个节点序列,包括:

4.根据权利要求3所述的方法,其特征在于,所述节点元路径为词、多元分词、句子、多元分词及词对应的节点依次串联所形成的路径;

5.根据权利要求1所述的方法,其特征在于,所述基于所述异构图中节点的节点特征,抽取所述文本中文本元素生成摘要,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述异构图中节点的节点特征,生成所述...

【专利技术属性】
技术研发人员:林晨
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1