一种服务器无感知的信息抽取方法技术

技术编号:42305851 阅读:30 留言:0更新日期:2024-08-14 15:52
本申请提供了一种服务器无感知的信息抽取方法,涉及信息抽取技术领域,该方法包括:获取原始数据文件和信息抽取模板名称;对原始数据文件进行标准化预处理,转换为标准格式文件;根据信息抽取模板名称,在数据库中检索得到目标模板,目标模板至少包括:字段、每个字段的解释性文本、每个字段的备注信息;针对目标模板中的每个字段,获取一个或多个匹配的候选信息抽取函数;从候选信息抽取函数中,确定目标信息抽取函数;根据每个字段的目标信息抽取函数,生成信息抽取任务;利用标准格式文件,执行信息抽取任务,得到信息抽取结果。

【技术实现步骤摘要】

本申请涉及信息抽取,特别是一种服务器无感知的信息抽取方法


技术介绍

1、通用信息抽取(universal information extraction)的目标是从非结构化文本中自动提取结构化信息,即通用信息抽取的输入是特定的抽取需求和待抽取的文本,输出是结构化的知识结构,包括但不限于文本实体结构、实体之间关系结构和多元情感结构等。通用信息抽取是知识图谱构建和自然语言理解中的关键任务。

2、然而,现有的针对信息抽取的研究工作,主要是针对每个专门领域提出了一套特有的信息抽取算法,以一事一议的方式来实现信息抽取,这导致通用性较差,无法达到更好地抽取信息的目的。

3、因此,亟需提出一种服务器无感知的信息抽取方法,实现对多模态信息抽取任务的通用性。


技术实现思路

1、鉴于上述问题,本申请实施例提供了一种服务器无感知的信息抽取方法,以便克服上述问题或者至少部分地解决上述问题。

2、本申请实施例的第一方面,提供了一种服务器无感知的信息抽取方法,应用于服务器无感知的信息抽取装置,所述方法本文档来自技高网...

【技术保护点】

1.一种服务器无感知的信息抽取方法,其特征在于,应用于服务器无感知的信息抽取装置,所述方法包括:

2.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述针对所述目标模板中的每个字段,获取一个或多个匹配的候选信息抽取函数,包括:

3.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述信息抽取装置包括显示模块,所述从所述候选信息抽取函数中,确定目标信息抽取函数,包括:

4.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述从所述候选信息抽取函数中,确定目标信息抽取函数,包括:

5.根据权利要求1所述的服...

【技术特征摘要】

1.一种服务器无感知的信息抽取方法,其特征在于,应用于服务器无感知的信息抽取装置,所述方法包括:

2.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述针对所述目标模板中的每个字段,获取一个或多个匹配的候选信息抽取函数,包括:

3.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述信息抽取装置包括显示模块,所述从所述候选信息抽取函数中,确定目标信息抽取函数,包括:

4.根据权利要求1所述的服务器无感知的信息抽取方法,其特征在于,所述从所述候选信息抽取函数中,确定目标信息抽取函数,包括:

5.根据权利要求1所述的服务器无感知的信息抽取方法,其特...

【专利技术属性】
技术研发人员:杨婧如孙逸文柳熠姜海鸥黄罡
申请(专利权)人:北京大数据先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1