一种生成风险主体识别模型的方法及装置制造方法及图纸

技术编号：35702090 阅读：19 留言：0更新日期：2022-11-23 14:56

本申请提供了一种生成风险主体识别模型的方法及装置，所述方法包括：获取第一识别模型和第一待识别语料；将所述第一待识别语料输入所述第一识别模型，得到第一识别结果；利用所述第一识别结果优化所述第一识别模型，生成第二识别模型，所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。通过先利用简单训练后的模型对待识别语料进行识别，再根据识别结果反向对模型进行优化，为下一次识别提供数据基础。这样，不需要对大规模的语料就可以进行训练，初始成本下降，识别过程中也不需要增加新的训练样本，可以大大减少模型的维护成本，同时，不断迭代也会导致准确率的上升。会导致准确率的上升。会导致准确率的上升。

全部详细技术资料下载

【技术实现步骤摘要】
一种生成风险主体识别模型的方法及装置

[0001]本申请涉及信息抽取的
，特别是涉及一种生成风险主体识别模型的方法及装置。

技术介绍

[0002]信息抽取技术是近年来发展起来的新领域，其目标是从自然语言文档中找到特定的信息，是自然语言处理领域特别有用的一个子领域。所开发的信息抽取系统既能处理含有表格信息的结构化信息，又能处理自由式信息；既能处理零样本信息，又能处理有样本信息。金融领域经常需要在大规模舆论中对投资主体进行识别，即用信息抽取技术进行识别。
[0003]现有技术大多采用基于启发式规则的抽取方法进行投资风险主体识别，此方法需要提前利用大规模的语料对模型进行训练，并且每一个语料都需要人工进行标注，浪费大量的人力物力。
[0004]因此，如何提供一种成本较低的生成风险主体识别模型的方法，是本领域技术人员亟需解决的技术问题。

技术实现思路

[0005]有鉴于此，本申请实施例提供了一种生成风险主体识别模型的方法及装置，旨在降低投资风险主体识别模型的生成成本。
[0006]第一方面，本申请实施例提供了一种生成风险主体识别模型的方法，包括：
[0007]获取第一识别模型和第一待识别语料，所述第一待识别语料包括金融领域语料；
[0008]将所述第一待识别语料输入所述第一识别模型，得到第一识别结果，所述第一识别结果包括第一风险主体和第一风险事件；
[0009]利用所述第一识别结果优化所述第一识别模型，生成第二识别模型，所述第二识别模型用于作为所述第一识别模...

【技术保护点】

【技术特征摘要】
1.一种生成风险主体识别模型的方法，其特征在于，所述方法包括：获取第一识别模型和第一待识别语料，所述第一待识别语料包括金融领域语料；将所述第一待识别语料输入所述第一识别模型，得到第一识别结果，所述第一识别结果包括第一风险主体和第一风险事件；利用所述第一识别结果优化所述第一识别模型，生成第二识别模型，所述第二识别模型用于作为所述第一识别模型返回执行所述风险主体识别模型生成方法。2.根据权利要求1所述的方法，其特征在于，所述利用所述第一识别结果优化所述第一识别模型，生成第二识别模型，包括：校验所述第一识别结果；响应于所述第一识别结果的校验结果为正确，利用所述第一识别结果优化所述第一识别模型，生成第二识别模型。3.根据权利要求1所述的方法，其特征在于，在所述将所述第一识别结果输入所述第一识别模型之后，所述方法还包括：获取第二待识别语料；将所述第二待识别语料输入所述第二识别模型，得到第二识别结果；利用所述第二识别结果优化所述第二识别模型，生成第三识别模型。4.根据权利要求1所述的方法，其特征在于，在获取第一识别模型和第一待识别语料之前，所述方法还包括：获取预训练语料，所述预训练语料包括风险主体标签和风险事件标签；将所述预训练语料输入初始模型，得到初始识别结果；获取初始识别结果的校验结果，所述初始识别结果的校验结果是利用所述风险主体标签和所述风险事件标签，校验所述初始识别结果的结果；响应于所述初始识别结果的校验结果为正确，利用所述初始识别结果优化所述初始模型，生成所述第一识别模型。5.根据权利要求1所述的方法，其特征在于，所述第一识别模型包括第一抽取模型和第一分类模型，所述第一识别结果包括第一抽取结果和第一分类结果，所述第一抽取模型用于识别投资主体，所述第一分类模型用于识别风险类型。6.根据权利要求5所述的方法，其特征在于，所述...

【专利技术属性】
技术研发人员：任君翔，
申请(专利权)人：太保科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人