【技术实现步骤摘要】
一种基于深度学习技术和规则库的银行授信文本解析方法
本专利技术涉及一种授信文本解析方法,尤其是一种识别精度高,工作效率高的基于深度学习技术和规则库的银行授信文本解析方法。
技术介绍
目前针对银行授信系统的审批文本数据的解析还处于人工处理结合简单的规则进行解析的阶段,效率低下,同时解析效果无法保证。
技术实现思路
为解决上述问题,本专利技术提供了一种基于深度学习技术和规则库的银行授信文本解析方法,包括如下步骤:1、建立银行授信业务的关注点规则库;所述规则库的规则结构如下:一个事件由关注点、触发词、不变属性和可变属性构成,不变属性可有可无,其中rex代表的是该条语句是正则表达式;规则库包含了若干条事件,主要是针对金融领域积累的规则;通过匹配文本句子是否命中触发词,来判断该关注点是否发生,如果命中了触发词,再对关注点进行可变属性和不变属性值提取。2、银行授信文本解析,具体包括如下步骤:(1)、业务情况和贷后内容识别银行授信系统审批内容包含了业务情况的介绍和贷后管理的说明,首先我们对于给定的文本内容,先将文本内容切分成两部分,第一部分为业务情况,第二部分为贷后情况,主要通过: ...
【技术保护点】
1.一种基于深度学习技术和规则库的银行授信文本解析方法,其特征在于,包括如下步骤:(1)、建立银行授信业务的关注点规则库;所述规则库的规则结构如下:一个事件由关注点、触发词、不变属性和可变属性构成,不变属性可有可无,其中rex代表的是该条语句是正则表达式;规则库包含了若干条事件,主要是针对金融领域积累的规则;通过匹配文本句子是否命中触发词,来判断该关注点是否发生,如果命中了触发词,再对关注点进行可变属性和不变属性值提取;(2)、银行授信文本解析,具体包括如下步骤:1)、业务情况和贷后内容识别银行授信系统审批内容包含了业务情况的介绍和贷后管理的说明,首先我们对于给定的文本内容 ...
【技术特征摘要】
1.一种基于深度学习技术和规则库的银行授信文本解析方法,其特征在于,包括如下步骤:(1)、建立银行授信业务的关注点规则库;所述规则库的规则结构如下:一个事件由关注点、触发词、不变属性和可变属性构成,不变属性可有可无,其中rex代表的是该条语句是正则表达式;规则库包含了若干条事件,主要是针对金融领域积累的规则;通过匹配文本句子是否命中触发词,来判断该关注点是否发生,如果命中了触发词,再对关注点进行可变属性和不变属性值提取;(2)、银行授信文本解析,具体包括如下步骤:1)、业务情况和贷后内容识别银行授信系统审批内容包含了业务情况的介绍和贷后管理的说明,首先我们对于给定的文本内容,先将文本内容切分成两部分,第一部分为业务情况,第二部分为贷后情况,主要通过:“要求”,“管理要求”,“建议”,“提示”等字用正则方法对文本内容进行分割,分割后,若有多个部分,第一部分为业务情况介绍,其它部分合并为贷后内容;2)、实体关系抽取针对银行业务,实体关系识别总共5种:担保抵押、股东、子公司、实际控制人、隶属集团,通过上述步骤,从授信文本中分割出业务内容,用实体识别模型,我们采用的是基于双向长短时记忆模型结合条件随机场实现序列标注,对文本进行实体识别;抽取到实体后,分别提取实体在文本中的上下文信息内容,然后分别输入到卷积神经网络模型中,在最后一层的pooling层对特征进行拼接,最后输入到softmax层进行实体关系分类,总类别数为6类:5种关系类别再加上非关系类别,即该实体不属于预先定义的任何一种关系;3)、业务情况属性值提取对文本分割成两部分后,提取业务情况内容,比如说授信金额,期限,支付方式等,为了提高正则匹配的精确度和效率,我...
【专利技术属性】
技术研发人员:黄泓,
申请(专利权)人:北京海致星图科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。