投资监督其他要素文本抽取方法、装置、设备以及介质制造方法及图纸

技术编号:40936359 阅读:22 留言:0更新日期:2024-04-18 14:55
本发明专利技术公开了一种投资监督其他要素文本抽取方法、装置、设备以及介质。该方法包括:获取待识别合同长文本中的投资监督条款,采用文本分类模型对所述投资监督条款进行字段抽取,生成第一类别其他要素字段;采用语义模式抽取模型对所述投资监督条款进行字段抽取,生成第二类别其他要素字段;根据各第一类别其他要素字段以及各第二类别其他要素字段所属的要素类型,以及不同要素类型之间的关联关系,对第一类别其他要素字段和/或第二类别其他要素字段进行字段修正。本发明专利技术实施例通过利用文本分类模型和语义模式抽取模型不仅实现了文本的自动化抽取,还新增了字段修正以及结果比对环节,提高了抽取效率以及抽取准确性的同时也降低了投资监督风险。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种投资监督其他要素文本抽取方法、装置、设备以及介质


技术介绍

1、投资监督其他要素是投资监督领域相关合同长文本中的投资监督条款,形式为对业务约定的投资监督合同中相关条款进行解析提取出的相关规则字段。

2、现有技术中,对于投资监督其他要素的解析提取工作往往由专业人员解读后人工摘取而成。但投资监督涉及到资管产品投资的合法性,仅仅依靠人工录入不仅时效性差且存在遗漏风险。同时,投资监督条款的数据量大,其他要素字段多,人工核对过程漫长,存在尺度不一的情况。


技术实现思路

1、基于此,本专利技术提供了一种投资监督其他要素文本抽取方法、装置、设备以及介质,以解决人工解析提取投资监督其他要素工作效率低的问题。

2、第一方面,本专利技术实施例提供了一种投资监督其他要素文本抽取方法,该方法包括:

3、获取待识别合同长文本中的投资监督条款,采用文本分类模型对所述投资监督条款进行字段抽取,生成第一类别其他要素字段;

4、采用语义模式抽取模型对所述本文档来自技高网...

【技术保护点】

1.一种投资监督其他要素文本抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据各第一类别其他要素字段以及各第二类别其他要素字段所属的要素类型,以及不同要素类型之间的关联关系,对第一类别其他要素字段和/或第二类别其他要素字段进行字段修正,包括:

3.根据权利要求2所述的方法,其特征在于,根据与每个目标要素类型关联关系分别对应的其他要素字段关联关系,对每个目标其他要素字段组中的第一类别其他要素字段和/或第二类别其他要素字段进行字段修正,包括:

4.根据权利要求3所述的方法,其特征在于,在所述当前处理其他要素字段组中识别基准其他要素...

【技术特征摘要】

1.一种投资监督其他要素文本抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据各第一类别其他要素字段以及各第二类别其他要素字段所属的要素类型,以及不同要素类型之间的关联关系,对第一类别其他要素字段和/或第二类别其他要素字段进行字段修正,包括:

3.根据权利要求2所述的方法,其特征在于,根据与每个目标要素类型关联关系分别对应的其他要素字段关联关系,对每个目标其他要素字段组中的第一类别其他要素字段和/或第二类别其他要素字段进行字段修正,包括:

4.根据权利要求3所述的方法,其特征在于,在所述当前处理其他要素字段组中识别基准其他要素字段,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,在采用文本分类模...

【专利技术属性】
技术研发人员:居政希郭焕阳彭锃丁波刘超高翔纪达麒陈运文
申请(专利权)人:达而观智能深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1