信息抽取方法、装置、设备、介质和程序产品制造方法及图纸

技术编号:40547904 阅读:16 留言:0更新日期:2024-03-05 19:06
本公开提供了一种信息抽取方法,可以应用于大数据技术领域及金融科技领域。该方法包括:获取待抽取的自然语言文本,和与自然语言文本对应的任务描述;获取多个结构相同但初始化参数不同的大语言模型,其中,每个大语言模型被预先根据自然语言文本在任务描述作为指令的监督下训练而成;分别利用初始化参数不同的大语言模型,抽取出自然语言文本中的命名实体、命名实体之间的语义关系以及自然语言文本中的事件;融合命名实体、语义关系和事件,得到抽取结果。本公开还提供了一种信息抽取装置、设备、介质和程序产品。

【技术实现步骤摘要】

本公开涉及大数据,更具体地涉及一种信息抽取方法、装置、设备、介质和程序产品


技术介绍

1、大数据时代背景下,用户来电信息不断涌现,其中蕴含了丰富的用户需求和问题,对用户信息进行挖掘、抽取、分析和聚合,是开展用户研究重要技术手段。

2、信息抽取是从海量信息资源中抽取出任务所需的特定信息,帮助我们将海量内容进行自动分类、提取和重构的一种技术,现有的信息提取方法依赖于训练深度神经模型,而深度神经模型在信息抽取过程中很容易过拟合噪声标签,导致信息抽取的结果不准确。


技术实现思路

1、鉴于上述问题,本公开提供了能够在信息抽取过程中避免被过拟合噪声标签的信息抽取方法、装置、设备、介质和程序产品。

2、根据本公开的第一个方面,提供了一种信息抽取方法,包括:获取待抽取的自然语言文本,和与自然语言文本对应的任务描述;获取多个结构相同但初始化参数不同的大语言模型,其中,每个大语言模型被预先根据自然语言文本在任务描述作为指令的监督下训练而成;分别利用初始化参数不同的大语言模型,抽取出自然语言文本中的命名实本文档来自技高网...

【技术保护点】

1.一种信息抽取方法,包括:

2.根据权利要求1所述的信息抽取方法,所述分别利用初始化参数不同的大语言模型,抽取出所述自然语言文本中的命名实体、所述命名实体之间的语义关系以及所述自然语言文本中的事件之前,包括:

3.根据权利要求2所述的信息抽取方法,所述对分句和分词处理后的自然语言文本进行标注,包括:

4.根据权利要求1所述的信息抽取方法,所述每个大语言模型被预先根据所述自然语言文本在所述任务描述作为指令的监督下训练而成,包括:

5.根据权利要求1所述的信息抽取方法,所述融合所述命名实体、所述语义关系和所述事件,得到抽取结果,包括:

...

【技术特征摘要】

1.一种信息抽取方法,包括:

2.根据权利要求1所述的信息抽取方法,所述分别利用初始化参数不同的大语言模型,抽取出所述自然语言文本中的命名实体、所述命名实体之间的语义关系以及所述自然语言文本中的事件之前,包括:

3.根据权利要求2所述的信息抽取方法,所述对分句和分词处理后的自然语言文本进行标注,包括:

4.根据权利要求1所述的信息抽取方法,所述每个大语言模型被预先根据所述自然语言文本在所述任务描述作为指令的监督下训练而成,包括:

5.根据权利要求1所述的信息抽取方法,所述融合所述命名实体、所述语义关系和所述事件,得到抽取结果,包括:

6.根据权利要求1所述的信息抽取方法,所述指令的类别包括:默认值类型、基数类型、抽象类型、描述类型、重要性类型、数字类型、数字类型+基数类型或数字类型+...

【专利技术属性】
技术研发人员:冯如
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1