一种摘要生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:42521840 阅读:19 留言:0更新日期:2024-08-27 19:33
本发明专利技术提供一种摘要生成方法、装置、电子设备及存储介质,应用于数据处理技术领域。该方法包括:获取待处理的文本数据,所述文本数据包括多个词汇;将所述文本数据和模型提示模版输入第一网络模型,得到标注文本,所述模型提示模版用于提示所述第一网络模型识别输入文本中的命名实体与事件,所述标注文本包括对所述多个词汇中部分词汇的标注信息;将所述文本数据和所述标注文本输入第二网络模型,得到所述文本数据的摘要信息;其中,所述第一网络模型用于对文本数据中的命名实体与事件进行标注,所述第二网络模型用于根据标注文本生成文本数据的摘要信息。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种摘要生成方法、装置、电子设备及存储介质


技术介绍

1、随着多源事件信息的日益增长,事件形式与事件内容不断多样化,海量文本信息让事件分析任务变的愈加困难。为辅助事件文本的高效分析,需要自动化地识别文本中的关键实体与事件,并重写信息简报。

2、现有技术中,能通过预训练的语言模型来实现长事件文本与多文档事件文本的信息压缩与摘要生成,主流事件文本信息处理技术主要基于语言模型在具体下游数据集上进行领域微调学习,高质量的模型输出结果通常要求用大量人为标注监督数据进行训练,然而人工标注不仅成本较高,而且难以大量获取。


技术实现思路

1、本专利技术提供一种摘要生成方法、装置、电子设备及存储介质,用以解决现有技术中人工标注不仅成本较高,而且难以大量获取的问题。

2、本专利技术提供一种摘要生成方法,包括:获取待处理的文本数据,所述文本数据包括多个词汇;将所述文本数据和模型提示模版输入第一网络模型,得到标注文本,所述模型提示模版用于提示所述第一网络模型识别输入文本中的命本文档来自技高网...

【技术保护点】

1.一种摘要生成方法,其特征在于,包括:

2.根据权利要求1所述的摘要生成方法,其特征在于,所述获取待处理的文本数据之前,所述方法还包括:

3.根据权利要求2所述的摘要生成方法,其特征在于,所述基于所述第一输出信息和所述人工标注的命名实体与事件更新所述第一网络模型的模型参数,包括:

4.根据权利要求2所述的摘要生成方法,其特征在于,所述事件文本训练集还包括人工撰写的摘要;所述获取事件文本训练集之后,所述方法还包括:

5.根据权利要求4所述的摘要生成方法,其特征在于,所述基于所述第二输出信息和所述人工撰写的摘要更新所述第二网络模型的模型参数之...

【技术特征摘要】

1.一种摘要生成方法,其特征在于,包括:

2.根据权利要求1所述的摘要生成方法,其特征在于,所述获取待处理的文本数据之前,所述方法还包括:

3.根据权利要求2所述的摘要生成方法,其特征在于,所述基于所述第一输出信息和所述人工标注的命名实体与事件更新所述第一网络模型的模型参数,包括:

4.根据权利要求2所述的摘要生成方法,其特征在于,所述事件文本训练集还包括人工撰写的摘要;所述获取事件文本训练集之后,所述方法还包括:

5.根据权利要求4所述的摘要生成方法,其特征在于,所述基于所述第二输出信息和所述人工撰写的摘要更新所述第二网络模型的模型参数之后,所述方法还包括:

6.一种摘要生成装置,其特征在于,包...

【专利技术属性】
技术研发人员:章路朱运琪杨阳白江波张文生
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1