一种生成风险主体识别模型的方法及装置制造方法及图纸

技术编号:35702090 阅读:19 留言:0更新日期:2022-11-23 14:56
本申请提供了一种生成风险主体识别模型的方法及装置,所述方法包括:获取第一识别模型和第一待识别语料;将所述第一待识别语料输入所述第一识别模型,得到第一识别结果;利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。通过先利用简单训练后的模型对待识别语料进行识别,再根据识别结果反向对模型进行优化,为下一次识别提供数据基础。这样,不需要对大规模的语料就可以进行训练,初始成本下降,识别过程中也不需要增加新的训练样本,可以大大减少模型的维护成本,同时,不断迭代也会导致准确率的上升。会导致准确率的上升。会导致准确率的上升。

【技术实现步骤摘要】
一种生成风险主体识别模型的方法及装置


[0001]本申请涉及信息抽取的
,特别是涉及一种生成风险主体识别模型的方法及装置。

技术介绍

[0002]信息抽取技术是近年来发展起来的新领域,其目标是从自然语言文档中找到特定的信息,是自然语言处理领域特别有用的一个子领域。所开发的信息抽取系统既能处理含有表格信息的结构化信息,又能处理自由式信息;既能处理零样本信息,又能处理有样本信息。金融领域经常需要在大规模舆论中对投资主体进行识别,即用信息抽取技术进行识别。
[0003]现有技术大多采用基于启发式规则的抽取方法进行投资风险主体识别,此方法需要提前利用大规模的语料对模型进行训练,并且每一个语料都需要人工进行标注,浪费大量的人力物力。
[0004]因此,如何提供一种成本较低的生成风险主体识别模型的方法,是本领域技术人员亟需解决的技术问题。

技术实现思路

[0005]有鉴于此,本申请实施例提供了一种生成风险主体识别模型的方法及装置,旨在降低投资风险主体识别模型的生成成本。
[0006]第一方面,本申请实施例提供了一种生成风险主体识别模型的方法,包括:
[0007]获取第一识别模型和第一待识别语料,所述第一待识别语料包括金融领域语料;
[0008]将所述第一待识别语料输入所述第一识别模型,得到第一识别结果,所述第一识别结果包括第一风险主体和第一风险事件;
[0009]利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。
[0010]可选的,所述利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,包括:
[0011]校验所述第一识别结果;
[0012]响应于所述第一识别结果的校验结果为正确,利用所述第一识别结果优化所述第一识别模型,生成第二识别模型。
[0013]可选的,在所述将所述第一识别结果输入所述第一识别模型之后,所述方法还包括:
[0014]获取第二待识别语料;
[0015]将所述第二待识别语料输入所述第二识别模型,得到第二识别结果;
[0016]利用所述第二识别结果优化所述第二识别模型,生成第三识别模型。
[0017]可选的,在获取第一识别模型和第一待识别语料之前,所述方法还包括:
[0018]获取预训练语料,所述预训练语料包括风险主体标签和风险事件标签;
[0019]将所述预训练语料输入初始模型,得到初始识别结果;
[0020]获取初始识别结果的校验结果,所述初始识别结果的校验结果是利用所述风险主体标签和所述风险事件标签,校验所述初始识别结果的结果;
[0021]响应于所述初始识别结果的校验结果为正确,利用所述初始识别结果优化所述初始模型,生成所述第一识别模型。
[0022]可选的,所述第一识别模型包括第一抽取模型和第一分类模型,所述第一识别结果包括第一抽取结果和第一分类结果,所述第一抽取模型用于识别投资主体,所述第一分类模型用于识别风险类型。
[0023]可选的,所述将所述第一待识别语料输入所述第一识别模型,得到第一识别结果,包括:
[0024]将所述第一待识别语料输入所述第一抽取模型,以便所述第一抽取模型输出第一抽取结果;所述第一抽取结果为指针结果,包括第一投资主体和所述第一投资主体判断正确的概率;
[0025]将所述第一待识别语料和所述第一投资主体输入所述第一分类模型,以便所述第一分类模型输出第一分类结果,所述第一分类结果包括所述第一投资主体发生预设风险事件的概率;
[0026]获取所述第一抽取结果和所述第一分类结果;
[0027]根据所述第一抽取结果和所述第一分类结果,生成第一识别结果。
[0028]第二方面,本申请实施例提供了一种生成风险主体识别模型的装置,包括:
[0029]第一获取模块,用于获取第一识别模型和第一待识别语料,所述第一待识别语料包括金融领域语料;
[0030]第一识别模块,用于将所述第一待识别语料输入所述第一识别模型,得到第一识别结果,所述第一识别结果包括第一风险主体和第一风险事件;
[0031]第一优化模块,用于利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。
[0032]可选的,所述装置还包括:
[0033]第二获取模块,用于获取第二待识别语料;
[0034]第二识别模块,用于将所述第二待识别语料输入所述第二识别模型,得到第二识别结果;
[0035]第二优化模块,用于利用所述第二识别结果优化所述第二识别模型,生成第三识别模型。
[0036]第三方面,本申请实施例提供了一种设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述第一方面任一项所述的生成风险主体识别模型的方法。
[0037]第四方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一项所述的生成风险主体识别模型的方法。
[0038]本申请实施例提供了一种生成风险主体识别模型的方法及装置,在执行所述方法
时,先获取第一识别模型和第一待识别语料,所述第一待识别语料包括金融领域语料,后将所述第一待识别语料输入所述第一识别模型,得到第一识别结果,所述第一识别结果包括第一风险主体和第一风险事件,然后获取所述第一识别结果的校验结果,最后利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法,以降低投资风险主体识别模型的生成成本。这样,通过先利用简单训练后的模型对待识别语料进行识别,再根据识别结果反向对模型进行优化,为下一次识别提供数据基础。这样,不需要对大规模的语料进行训练,不需要增加训练样本,可以大大减少训练成本,同时,不断迭代也会导致准确率的上升。
附图说明
[0039]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为本申请实施例提供的生成风险主体识别模型的方法的一种方法流程图;
[0041]图2为本申请实施例提供的生成风险主体识别模型的方法的另一种方法流程图;
[0042]图3为本申请实施例提供的生成风险主体识别模型的装置的一种结构示意图。
具体实施方式
[0043]现有技术大多采用基于启发式规则的抽取方法进行投资风险主体识别,此方法需要提前利用大规模的语料对模型进行训练,并且每一个语料都需本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成风险主体识别模型的方法,其特征在于,所述方法包括:获取第一识别模型和第一待识别语料,所述第一待识别语料包括金融领域语料;将所述第一待识别语料输入所述第一识别模型,得到第一识别结果,所述第一识别结果包括第一风险主体和第一风险事件;利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一识别结果优化所述第一识别模型,生成第二识别模型,包括:校验所述第一识别结果;响应于所述第一识别结果的校验结果为正确,利用所述第一识别结果优化所述第一识别模型,生成第二识别模型。3.根据权利要求1所述的方法,其特征在于,在所述将所述第一识别结果输入所述第一识别模型之后,所述方法还包括:获取第二待识别语料;将所述第二待识别语料输入所述第二识别模型,得到第二识别结果;利用所述第二识别结果优化所述第二识别模型,生成第三识别模型。4.根据权利要求1所述的方法,其特征在于,在获取第一识别模型和第一待识别语料之前,所述方法还包括:获取预训练语料,所述预训练语料包括风险主体标签和风险事件标签;将所述预训练语料输入初始模型,得到初始识别结果;获取初始识别结果的校验结果,所述初始识别结果的校验结果是利用所述风险主体标签和所述风险事件标签,校验所述初始识别结果的结果;响应于所述初始识别结果的校验结果为正确,利用所述初始识别结果优化所述初始模型,生成所述第一识别模型。5.根据权利要求1所述的方法,其特征在于,所述第一识别模型包括第一抽取模型和第一分类模型,所述第一识别结果包括第一抽取结果和第一分类结果,所述第一抽取模型用于识别投资主体,所述第一分类模型用于识别风险类型。6.根据权利要求5所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:任君翔
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1