【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种基于问答模型的文档信息提取方法、装置、设备及介质。
技术介绍
1、大量文档以电子文档的形式存在,人们往往需要从这些电子文档中提取关键信息以更好的使用它们,然而文档与待被提取信息的多样性使得提取这些信息变得越来越困难。
2、目前,现有的文档信息的提取方法,通常依赖于特定的模版、规则或者信息检索技术进行信息提取,但这样的方法无法处理丰富多样的信息表述方式与所需的信息点。随着自然语言处理技术的发展,虽然一些基于神经网络的方法为文档信息提取带来了新的发展,但是因为过于依赖数据,在没有足够的标注数据或者相关领域知识的情况下,其信息提取的准确度较差。
技术实现思路
1、本专利技术提供了一种基于问答模型的文档信息提取方法、装置、设备及介质,可以在无需或者仅需少量的标注样本情况下完成特定领域所需信息提取,可以提升文档信息提取的适用性,并可以降低信息提取成本。
2、根据本专利技术的一方面,提供了一种基于问答模型的文档信息提取方法,包括:
...
【技术保护点】
1.一种基于问答模型的文档信息提取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:
4.根据权利要求3所述的方法,其特征在于,根据所述字段信息、所述待提取文档和预设提示信息模板,生成所述提示信息,包括:
5.根据权利要求4所述的方法,其特征在于,获取所述维度特征对应的样例信息,包括:
6.根据权利要求5所述的方法,其特征在于,根据预处理的所述标注文
...【技术特征摘要】
1.一种基于问答模型的文档信息提取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述待提取文档和预设维度,生成提示信息,包括:
4.根据权利要求3所述的方法,其特征在于,根据所述字段信息、所述待提取文档和预设提示信息模板,生成所述提示信息,包括:
5.根据权利要求4所述的方法,其特征在于,获取所述维度特征对应的样例信息,包括:
6.根据权利要求5所述的方法,其特征在于,根据预处理的所述...
【专利技术属性】
技术研发人员:章逸骋,纪传俊,岳小龙,胡嘉杰,李宽,
申请(专利权)人:达观数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。