合同相对方信息的结构化方法及装置制造方法及图纸

技术编号:23288098 阅读:22 留言:0更新日期:2020-02-08 18:09
本申请公开了合同相对方信息的结构化方法及装置,首先从合同文本中抽取至少一个包括相对方信息的内容区块,由于内容区块中包括每个相对方主体的属性信息,不便于区分属性信息与相对方主体的所属关系,进而不便于审核,因此该方法再按照属性信息,将每一内容区块切分成若干目标行,使每一目标行与一条属性信息对应,进而以每一条属性信息为归类对象,方便对每个相对方主体的属性信息进行归类,即,从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。将该方法应用于合同的机器辅助审核方法中,使机器可以根据相对方信息的结构化处理结果来审核相对方信息,提高审核效率和审核的准确性。

Structure method and device of information of opposite party of contract

【技术实现步骤摘要】
合同相对方信息的结构化方法及装置
本申请涉及自然语言处理领域,尤其涉及一种合同相对方信息的结构化方法及装置。
技术介绍
合同,又称为契约、协议,是平等的当事人之间设立、变更、终止民事权利义务关系的协议。在合同文本中,当事人又称为相对方或相对方主体,例如,甲方、乙方等。一份合同文本至少包括两个相对方主体,即甲方和乙方,有时则包括多个相对方,如甲方、乙方、丙方、丁方等。由于合同与公民个人的生活、社会经济的运行息息相关,例如公民购房需要签订购房合同、企业之间经济往来需要签订买卖合同等,尤其是对于企业来说,其在运行过程中将产生大量的合同,因此为了规避合同履行过程中的法律风险,随之产生了合同审核需求。近年来,为了节约人力资源并提高合同审核的准确性,基于机器学习技术的机器辅助审核方式逐渐取代人工审核。其中,由于相对方主体的属性信息是广泛存在于不同类型的合同文本中的重要信息,因此对相对方主体的属性信息的审核,对完成一份完整合同文本的审核尤为重要。进而,如何实现合同文本中相对方信息的抽取及结构化处理,是机器辅助审核过程中亟待解决的问题。
技术实现思路
本申请提供一种合同相对方信息的结构化方法及装置,以解决如何实现合同文本中相对方信息的抽取及结构化处理的问题。第一方面,本申请提供一种合同相对方信息的结构化方法,所述方法包括:利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。第二方面,本申请还提供一种合同相对方信息的结构化处理装置,所述装置包括:抽取模块,用于利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;切分模块,用于按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;归类模块,用于从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。由以上技术方案可知,本申请实施例提供的合同相对方信息的结构化方法及装置,首先从合同文本中抽取至少一个包括相对方信息的内容区块,由于内容区块中包括每个相对方主体的属性信息,不便于区分属性信息与相对方主体的所属关系,进而不便于审核,因此该方法再按照属性信息,将每一内容区块切分成若干目标行,使每一目标行与一条属性信息对应,进而以每一条属性信息为归类对象,方便对每个相对方主体的属性信息进行归类,即,从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。将该方法应用于合同的机器辅助审核方法中,使机器可以根据相对方信息的结构化处理结果来审核相对方信息,提高审核效率和审核的准确性。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请根据一示例性实施例示出的合同相对方信息的结构化方法流程图;图2为本申请根据一示例性实施例示出的合同相对方信息的结构化方法的另一流程图;图3为本申请根据一示例性实施例示出的合同相对方信息的结构化装置框图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。本申请实施例提供一种合同相对方信息的结构化方法,用于实现合同中相对方信息的抽取及结构化处理,应用于合同的机器辅助审核方法中,使机器根据相对方信息的结构化处理结果来审核相对方信息,提高审核效率和审核的准确性。其中,合同相对方信息即合同文本中所包括的相对方主体的属性信息。实际上,合同可以具有不同的形式,包括书面形式、口头形式和其他形式,多为书面形式。本申请方法的处理对象,为书面形式的合同,即合同文本。合同文本作为载体,记载了合同的内容。需要说明的是,在一些场景中,不乏将其他形式的合同转换成合同文本,再进行下一步处理的情况,对此,需要强调的是,经其他形式的合同转换得到的合同文本,也是本申请方法的应用对象。图1为本申请合同相对方信息的结构化方法的流程图,如图1所示,该方法可以包括:步骤101,利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息。合同文本可以以不同的版式来记载合同内容。在本实施例中,根据合同的常见版式,将各类合同文本划分成两种情形,分别为第一情形和第二情形。该两种情形的相同之处在于,均包括至少两个相对方主体,其不同之处在于,属于第一情形的合同文本中,不同相对方主体的属性信息同行,而属于第二情形的合同文本中,每个相对方主体的至少一条属性信息单独成行。示例性地,以下“专利技术专利转让合同”属于第一情形。专利技术专利转让合同甲方(转让方):_________乙方(受让方):_________职务:_________职务:_________地址:____市____路___号地址:___市____路____号代理人:_________代理人:_________鉴于转让方合法拥有一项非职务专利技术创造……双方认为,……经双方友好协商,就下述内容达成协议:转让方将_________专利技术专利申请权有偿转让给受让方。……转让方:_________(签章)受让方:_________(签章)_________年____月____日_________年____月____日上述“专利技术专利转让合同”文本中,甲方(转让方):___、职务:___、地址:____市____路___号、代理人:____等,属于甲方的属性信息,同理,乙方的属性信息也包括乙方(受让方):___、职务:___、地址:____市____路___号、代理人:____等。从该“专利技术专利转让合同”文本中,可以看出,分别属于不同相对方主体的属性信息位于同一行中。示例性地,以下“劳动合同”和“物业管理合同”属于第二情形。劳动合同甲方(名称):_____________________法定代表人或委托代理人:___________注册地址:_________________________通讯地址:_________________________邮政本文档来自技高网
...

【技术保护点】
1.一种合同相对方信息的结构化方法,其特征在于,所述方法包括:/n利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;/n按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;/n从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。/n

【技术特征摘要】
1.一种合同相对方信息的结构化方法,其特征在于,所述方法包括:
利用预设目录树从合同文本中抽取至少一个内容区块,一个所述内容区块由一行或者连续的多行内容构成,所述一行或者连续的多行内容包括至少两个相对方主体的属性信息;
按照所述属性信息,将所述内容区块切分成若干目标行,每一所述目标行与一条属性信息对应;
从切分得到的若干目标行中,分别提取出每个相对方主体的属性信息。


2.根据权利要求1所述的方法,其特征在于,所述利用预设目录树从合同文本中抽取至少一个内容区块,包括:
获取所述合同文本所属的情形,所述情形至少包括第一情形和第二情形,所述第一情形中包括至少两个相对方主体,不同相对方主体的属性信息同行,所述第二情形中包括至少两个相对方主体,每个相对方主体的至少一条属性信息单独成行;
根据所述合同文本所属的情形,选择用于从合同文本中抽取所述内容区块的目录节点,所述目录节点包括至少一个抽取表达式;
利用选择的目录节点从所述合同文本中抽取至少一个所述内容区块。


3.根据权利要求2所述的方法,其特征在于,所述按照属性信息,将所述内容区块切分成若干目标行,包括:
利用预设目录树识别所述内容区块中包含一条以上属性信息的行;
对于识别出的包含一条以上属性信息的行,在每一条属性信息的首部或者尾部设置切分点;
对于识别出的未包含一条以上属性信息的行,在所述行的首部或者尾部设置切分点;
按照设置的所述切分点,将所述内容区块切分成若干目标行。


4.根据权利要求3所述的方法,其特征在于,所述利用预设目录树识别所述内容区块中包含一条以上属性信息的行,包括:
如果所述合同文本所属的情形为第二情形,则利用预设目录树识别所述内容区块中包含一条以上属性信息的行。


5.根据权利要求2所述的方法,其特征在于,所述从若干目标行中分别提取出每个相对方主体的属性信息,包括:
按照所述属性信息在所述合同文本中的位置顺序,对所述目标行进行排序;
如果所述合同文本所属的情形为第一情形,则获取所述第一情形预设的第一提取规则;
使用所述第一提取规则从排序后的目标行中提取出与每个相对方主体的属性信息对应的目标行;
如果所述合同文本所属的情形为第二情形,则获取所述第二情形预设的第二提取规则;
使用所述第二提取规则从排序后的目标行中提取出与每个相对方主体的属性信息对应的目标行。...

【专利技术属性】
技术研发人员:任宁晋耀红李德彦
申请(专利权)人:中科鼎富北京科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1