信息审核分类模型的构建方法和信息审核方法技术

技术编号:27977196 阅读:15 留言:0更新日期:2021-04-06 14:11
本申请涉及人工智能技术领域,提供了一种信息审核分类模型的构建方法、装置、计算机设备和存储介质。方法包括:获取样本图像,对样本图像进行光学字符识别,得到文本识别结果,进行语义分析,根据对文本识别结果的语义分析结果,提取目标文本,基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签进行审核标签标注,根据携带有审核标签的目标文本进行模型训练,得到信息审核分类模型。不依赖人工进行打标签处理,不仅提高了样本的生成速度,而且能够生成适用于不同的业务方的模型训练的审核标签,实现了样本图像的复用,快速训练得到信息审核分类模型。此外,本申请还涉及区块链技术,用户的信息审核结果可存储于区块链中。

【技术实现步骤摘要】
信息审核分类模型的构建方法和信息审核方法
本申请涉及人工智能
,特别是涉及一种信息审核分类模型的构建方法、信息审核方法、装置、计算机设备和存储介质。
技术介绍
随着信息技术的发展,信息的审核在日常生活中的应用越来越广泛。以贷款审核为例,贷款人的申请信息层层审核,银行再进行人工审核,人工审核过程复杂、耗时长,人工审核难以控制审核量的按时完成,造成贷款人对银行方的服务产生质疑,使银行方利益受损。由于信息审核涉及的流程和经办人员众多,就信息审核的过程而言,请求人等待时间太长。对审核方而言,审核流程十分的复杂不说,而且人工审核是否合乎标准难以判断。随着人工智能技术的发展,通过训练神经网络模型取代人工处理在各个行业得到了应用,但在信息审核方面,由于模型的训练依赖于大量的训练样本,而样本需要基于历史审核记录通过人工进行样本标签标记,且不同的业务方由于其存在不同的审核标准,同样的样本训练得到的模型无法适用于不同的业务方,从而导致模型训练需要耗费大量时间进行样本准备工作,模型训练过程效率低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高模型训练过程效率的信息审核分类模型的构建方法、装置、计算机设备和存储介质。一种信息审核分类模型的构建方法,方法包括:获取样本图像,对样本图像进行光学字符识别,得到文本识别结果;对文本识别结果进行语义分析,根据语义分析结果,提取文本识别结果中的目标文本;基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签,对目标文本进行审核标签标注;根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。在其中一个实施例中,基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签,对目标文本进行审核标签标注包括:获取业务方对风险等级的评定配置参数;根据评定配置参数,确定审核标签生成规则;根据审核标签生成规则,遍历目标文本,对目标文本中的信息进行分类统计;根据分类统计结果和审核标签生成规则,生成审核标签;根据目标文本生成特征向量,并对特征向量进行审核标签标注。在其中一个实施例中,包含目标文本的图像为征信报告;根据评定配置参数,确定审核标签生成规则包括:根据评定配置参数中的用户类型,确定与用户类型对应各风险等级的负面信用交易阈值参数;其中,用户类型包括个人用户和企业用户;根据负面信用交易阈值参数,配置与风险等级对应的标签生成规则。在其中一个实施例中,根据负面信用交易阈值参数,配置与风险等级对应的标签生成规则包括:提取评定配置参数中对不同负面信用交易类型的权重参数;根据权重参数和负面信用交易阈值参数中的阈值数据,配置与风险等级对应的标签生成规则。在其中一个实施例中,根据负面信用交易阈值参数,配置与风险等级对应的标签生成规则包括:从负面信用交易阈值参数中提取各负面信用交易类型对应的数量阈值;根据各负面信用交易类型对应的数量阈值,配置与风险等级对应的标签生成规则。一种信息审核方法,方法包括:获取待审核用户的待审核图像,对待审核图像进行光学字符识别,得到初始识别文本;对初始识别文本进行语义分析,根据语义分析结果,提取初始识别文本中的待分析文本;将待分析文本输入上述任一项实施例中的信息审核分类模型,得到信息审核结果。在其中一个实施例中,信息审核方法还包括:获取与信息审核结果对应的实际审核结果;当审核分类结果与实际审核结果的差异大于预设阈值时,将实际审核结果作为待审核图像的标签,添加至更新样本集;基于预设的模型迭代周期,根据更新样本集,对信息审核分类模型进行迭代训练,得到更新的信息审核分类模型。一种信息审核分类模型的构建装置,装置包括:文本识别模块,用于获取样本图像,对样本图像进行光学字符识别,得到文本识别结果;语义分析模块,用于对文本识别结果进行语义分析,根据语义分析结果,提取文本识别结果中的目标文本;标签生成模块,用于基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签,对目标文本进行审核标签标注;模型训练模块,用于根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。一种信息审核装置,装置包括:待审核图像文本识别模块,用于获取待审核用户的待审核图像,对待审核图像进行光学字符识别,得到初始识别文本;待审核图像语义分析模块,用于对初始识别文本进行语义分析,根据语义分析结果,提取初始识别文本中的待分析文本;信息审核分类模块,用于将待分析文本输入上述任一项实施例中的信息审核分类模型,得到信息审核结果。一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:获取样本图像,对样本图像进行光学字符识别,得到文本识别结果;对文本识别结果进行语义分析,根据语义分析结果,提取文本识别结果中的目标文本;基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签,对目标文本进行审核标签标注;根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取样本图像,对样本图像进行光学字符识别,得到文本识别结果;对文本识别结果进行语义分析,根据语义分析结果,提取文本识别结果中的目标文本;基于与业务方对应的审核标签生成规则,生成与目标文本对应的审核标签,对目标文本进行审核标签标注;根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。上述信息审核分类模型的构建方法、装置、计算机设备和存储介质,通过获取包含目标文本的图像,通过光学字符识别对图像进行识别,通过语义分析提取出识别结果中的目标文本,实现信息的初步筛选。通过预先设定的审核标签生成规则,自动生成与目标文本对应的标签,进行标签标注,不需要依赖人工进行打标签处理,不仅提高了模型训练样本的生成速度,而且能够时使得同样的图像样本基于与业务方对应的审核标签生成规则,生成适用于不同的业务方的模型训练的审核标签,实现了样本图像的复用,能够快速便捷地对初始分类模型进行训练,提高模型训练过程效率,快速得到信息审核分类模型。附图说明图1为一个实施例中信息审核分类模型的构建方法的应用环境图;图2为一个实施例中信息审核分类模型的构建方法的流程示意图;图3为另一个实施例中信息审核分类模型的构建方法的流程示意图;图4为再一个实施例中信息审核分类模型的构建方法的流程示意图;图5为又一个实施例中信息审核分类模型的构建方法的流程示意图;图6为还一个实施例中信息审核分类模型的构建方法的流程示意图;图7为一个实施例中信息审核分类模型的构建装本文档来自技高网...

【技术保护点】
1.一种信息审核分类模型的构建方法,其特征在于,所述方法包括:/n获取样本图像,对所述样本图像进行光学字符识别,得到文本识别结果;/n对所述文本识别结果进行语义分析,根据语义分析结果,提取所述文本识别结果中的目标文本;/n基于与业务方对应的审核标签生成规则,生成与所述目标文本对应的审核标签,对所述目标文本进行审核标签标注;/n根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。/n

【技术特征摘要】
1.一种信息审核分类模型的构建方法,其特征在于,所述方法包括:
获取样本图像,对所述样本图像进行光学字符识别,得到文本识别结果;
对所述文本识别结果进行语义分析,根据语义分析结果,提取所述文本识别结果中的目标文本;
基于与业务方对应的审核标签生成规则,生成与所述目标文本对应的审核标签,对所述目标文本进行审核标签标注;
根据携带有审核标签的目标文本,对初始分类模型进行训练,得到信息审核分类模型。


2.根据权利要求1所述的方法,其特征在于,所述基于与业务方对应的审核标签生成规则,生成与所述目标文本对应的审核标签,对所述目标文本进行审核标签标注包括:
获取业务方对风险等级的评定配置参数;
根据所述评定配置参数,确定审核标签生成规则;
根据所述审核标签生成规则,遍历所述目标文本,对所述目标文本中的信息进行分类统计;
根据所述分类统计结果和所述审核标签生成规则,生成审核标签;
根据所述目标文本生成特征向量,并对所述特征向量进行审核标签标注。


3.根据权利要求2所述的方法,其特征在于,所述包含目标文本的图像为征信报告;所述根据所述评定配置参数,确定审核标签生成规则包括:
根据所述评定配置参数中的用户类型,确定与所述用户类型对应各风险等级的负面信用交易阈值参数;其中,所述用户类型包括个人用户和企业用户;
根据所述负面信用交易阈值参数,配置与风险等级对应的标签生成规则。


4.根据权利要求3所述的方法,其特征在于,所述根据所述负面信用交易阈值参数,配置与风险等级对应的标签生成规则包括:
提取所述评定配置参数中对不同负面信用交易类型的权重参数;
根据所述权重参数和所述负面信用交易阈值参数中的阈值数据,配置与风险等级对应的标签生成规则。


5.根据权利要求3所述的方法,其特征在于,所述根据所述负面信用交易阈值参数,配置与风险等级对应的标签生成规则包括:
从所述负面信用交易阈值参数...

【专利技术属性】
技术研发人员:高文
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1