一种不良资产经营领域的合同要素化方法技术

技术编号:21454139 阅读:39 留言:0更新日期:2019-06-26 04:50
本发明专利技术公开一种不良资产经营领域的合同要素化方法,包括如下步骤:第一步:合同要素总结;第二步:数据预处理;第三步:特征构建;第四步:模型训练及测试;第五步:要素内容抽取。本发明专利技术优点在于:(1)利用自然语言处理技术与专家经验的融合,实现了计算机对合同文本的理解,能够实现自动化合同审核,从而提高了业务效率,降低了人工成本并减少相关操作风险的发生。(2)将合同要素化后的合同管理避免了传统合同管理中存在的丢失、损坏等风险,提高了合同信息的安全性与可靠性。(3)对合同信息的要素化管理,提高了合同知识的使用效率,有助于业务的开展和决策的确定。

【技术实现步骤摘要】
一种不良资产经营领域的合同要素化方法
本专利技术涉及一种不良资产经营领域的合同要素化方法,尤其是一种基于SlotFilling(槽填充)模型的不良资产经营领域的合同要素化方法,涉及计算机信息处理与自然语言处理

技术介绍
随着业务结构的越发复杂,信息系统的快速发展,业务信息和财务信息的割裂是影响金融企业管理效率的一大难题。利用信息化技术实现对合同的要素化管理能够促进业务信息和财务信息的一体化融合,是推动业财一体化建设与提高业务效率的有力手段。在不良资产管理业务的开展过程中,由于金融产品本身的特性,存在不良资产处理结构复杂,业务模式多样,流程复杂的特点。以不良资产业务模式为例,包括了收购处置类、收购重组类两大类产品模式,每个大类的产品模式又细分为多个子产品。在各个业务开展过程中,会涉及资金方、资产方、不良资产、款项、产品结构、商业模式、法务法规等多源信息。而合同是这些业务中多源信息存在的重要载体。不论是对不良资产包的收购、委托、处置等过程,均需要使用合同来赋予双方权利和义务,并使用法律手段来保证彼此的权益,可见由于不良资产管理业务的特殊性决定了高效的合同管理方法对整个业务领域都本文档来自技高网...

【技术保护点】
1.一种不良资产经营领域的合同要素化方法,其特征在于:该方法包括如下步骤:第一步:合同要素总结基于历史积累的合同文档,提取出能够涵盖合同信息的合同要素,并分析任一类合同要素的构成,包括合同要素类别、定义、关键词;结合Slot Filling模型,梳理出合同要素的槽位和属性;第二步:数据预处理首先,需要获得有关于某一类合同要素的所有文本内容;其次,需要对合同文档的内容进行人工标注,即对于包含合同要素内容的文本标注为1,对于仅包含合同要素关键字词的文本标注为0,其中包含合同要素内容指一个句子中既含有合同要素的关键字又含有该关键字对应的内容,而合同要素关键字是指用于表征该类合同要素的字或词;然后,需...

【技术特征摘要】
1.一种不良资产经营领域的合同要素化方法,其特征在于:该方法包括如下步骤:第一步:合同要素总结基于历史积累的合同文档,提取出能够涵盖合同信息的合同要素,并分析任一类合同要素的构成,包括合同要素类别、定义、关键词;结合SlotFilling模型,梳理出合同要素的槽位和属性;第二步:数据预处理首先,需要获得有关于某一类合同要素的所有文本内容;其次,需要对合同文档的内容进行人工标注,即对于包含合同要素内容的文本标注为1,对于仅包含合同要素关键字词的文本标注为0,其中包含合同要素内容指一个句子中既含有合同要素的关键字又含有该关键字对应的内容,而合同要素关键字是指用于表征该类合同要素的字或词;然后,需要去除标注内容中的停止词及分词,并将分词结果组合成新语料;第三步:特征构建计算新语料中每个句子中词语的TF-IDF值,然后组成每个句子的句向量,作为模型的入模特征;本发明通过计算基于新语料的句子中各个词语的TF-IDF值进而组成N维向量作为入模特征,其中维度N取决于语料词袋的个数;其中TF的计算逻辑如下:某一目标字词的IDF值可以由语料库中的总文件数目除以包含该字词的文件数目,然后对商取对数,其计算逻辑如下,其中分母加1的原因是为了避免分母为0;综上,使用TF-IDF值的思想实现对合同文档中所有信息的特征转变,利用包含了词语信息的特征值作为SlotFilling模型的入模特征;第四步:模型训练及测试抽取所有文档中关于某类合同要素的所有句子,作为整体数据集,选用LogisticRegression模型进行模型构建;将整体数据集分为训练集和测试集,且二者比例为8:2;利用训练集,构建LogisticRegression分类器,识别包含合同要素信息的句子;第五步:要素内容抽取利用正则匹配技术抽取包含合同要素信息句子中的合同要素内容,形成键值对,其中“键”为合同要素名称、“值”为合同要素内容,并以表格的形式可视化要素内容。2.根据权利要求1所述的一种不良资产经营领域的合同要素化方法,其特征在于:所述的LogisticRegress...

【专利技术属性】
技术研发人员:后其林尹昌钟丽莉万谊强仵伟强蒋泽晟
申请(专利权)人:华融融通北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1