基于问答模型的文档信息提取方法、装置、设备及介质制造方法及图纸

技术编号:41595708 阅读:29 留言:0更新日期:2024-06-07 00:06
本发明专利技术涉及计算机技术领域,公开了一种基于问答模型的文档信息提取方法、装置、设备及介质。该方法包括:获取待提取文档,并根据待提取文档和预设维度,生成提示信息;将提示信息作为提问输入至预训练的问答模型,并获取问答模型输出的回答;根据提示信息和回答,获取待提取文档对应的信息提取结果。本实施例的技术方案,通过生成待提取文档对应的提示信息,以规范问答模型的回答形式,可以在无需或者仅需少量的标注样本情况下完成特定领域所需信息提取,可以提升文档信息提取的适用性,并可以降低信息提取成本。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种基于问答模型的文档信息提取方法、装置、设备及介质


技术介绍

1、大量文档以电子文档的形式存在,人们往往需要从这些电子文档中提取关键信息以更好的使用它们,然而文档与待被提取信息的多样性使得提取这些信息变得越来越困难。

2、目前,现有的文档信息的提取方法,通常依赖于特定的模版、规则或者信息检索技术进行信息提取,但这样的方法无法处理丰富多样的信息表述方式与所需的信息点。随着自然语言处理技术的发展,虽然一些基于神经网络的方法为文档信息提取带来了新的发展,但是因为过于依赖数据,在没有足够的标注数据或者相关领域知识的情况下,其信息提取的准确度较差。


技术实现思路

1、本专利技术提供了一种基于问答模型的文档信息提取方法、装置、设备及介质,可以在无需或者仅需少量的标注样本情况下完成特定领域所需信息提取,可以提升文档信息提取的适用性,并可以降低信息提取成本。

2、根据本专利技术的一方面,提供了一种基于问答模型的文档信息提取方法,包括:

3、获取待提取文档,本文档来自技高网...

【技术保护点】

1.一种基于问答模型的文档信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:

3.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:

4.根据权利要求3所述的方法,其特征在于,根据所述字段信息、所述待提取文档和预设提示信息模板,生成所述提示信息,包括:

5.根据权利要求4所述的方法,其特征在于,获取所述维度特征对应的样例信息,包括:

6.根据权利要求5所述的方法,其特征在于,根据预处理的所述标注文档和对应的多个信息点...

【技术特征摘要】

1.一种基于问答模型的文档信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:

3.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:

4.根据权利要求3所述的方法,其特征在于,根据所述字段信息、所述待提取文档和预设提示信息模板,生成所述提示信息,包括:

5.根据权利要求4所述的方法,其特征在于,获取所述维度特征对应的样例信息,包括:

6.根据权利要求5所述的方法,其特征在于,根据预处理的所述...

【专利技术属性】
技术研发人员:章逸骋纪传俊岳小龙胡嘉杰李宽
申请(专利权)人:达观数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1