【技术实现步骤摘要】
一种模型训练及基于模型训练的预测方法及装置
本专利技术涉及大数据科学
,尤其涉及一种模型训练及基于模型训练的预测方法及装置。
技术介绍
随着经济与信息化的高速发展,大数据应运而生,大数据指的是一种规模达到在获取、存储、管理、分析等方面大大超出传统数据库软件工具能力范围的数据集合,通过对大数据进行分析和预测,可以为企业的业务和决策等提供强有力的支持。面对大数据时代海量的数据,传统由人工进行的数据分析和数据价值挖掘已不适用,而人工智能技术的出现为大数据的数据分析和数据价值挖掘提供的了一种较佳的解决方案。现有的人工智能模型的应用,通常是用户选取合适的训练样本数据,其中训练样本数据中包括大量的正样本数据和负样本数据,通过模型对应的人工智能学习算法对模型进行训练,训练好的模型能够对输入的数据进行预测,预测输入的数据为正样本数据,还是负样本数据。以信用卡交易数据为例,训练集中发生交易欺诈的信用卡交易数据为正样本数据,未发生交易欺诈的信用卡交易数据为负样本数据,通过训练集中大量正样本数据和负样本数据对模型进行训练完成后,输入信用卡交易数据后,训练完成的模型能够对输入的信用 ...
【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:依次针对待训练模型的每层子模型,识别该层子模型是否为所述待训练模型的最后一层子模型,其中所述待训练模型包含至少两层子模型;如果否,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练;并基于训练完成的该层子模型输出训练集中每个样本数据对应正样本数据的置信度,采用所述训练集中对应正样本数据的置信度大于该层子模型对应的置信度阈值的样本数据,对所述训练集中的样本数据进行更新;如果是,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练。
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:依次针对待训练模型的每层子模型,识别该层子模型是否为所述待训练模型的最后一层子模型,其中所述待训练模型包含至少两层子模型;如果否,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练;并基于训练完成的该层子模型输出训练集中每个样本数据对应正样本数据的置信度,采用所述训练集中对应正样本数据的置信度大于该层子模型对应的置信度阈值的样本数据,对所述训练集中的样本数据进行更新;如果是,将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练。2.如权利要求1所述的方法,其特征在于,所述将训练集中已包含正样本或负样本标签的每个样本数据输入到该层子模型中,对该层子模型进行训练之前,所述方法还包括:判断所述训练集中样本数据的数量是否大于设定的数量阈值;如果是,进行后续步骤;如果否,发出告警信息。3.一种基于权利要求1-2任一项所述的模型训练方法的预测方法,其特征在于,所述方法包括:将待检测数据输入到训练完成的模型中;基于所述训练完成的模型,输出预测所述待检测数据是否为正样本数据的结果。4.如权利要求3所述的方法,其特征在于,如果预测所述待检测数据为正样本数据,所述方法还包括:发出告警信息。5.一种模型训练装置,其特征在于,所述装置包括:识...
【专利技术属性】
技术研发人员:曾伟雄,
申请(专利权)人:蜜小蜂智慧北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。