图像分类模型优化方法、装置及终端制造方法及图纸

技术编号:19098657 阅读:50 留言:0更新日期:2018-10-03 02:41
本发明专利技术实施例提供了一种图像分类模型优化方法、装置及终端,其中,所述方法包括:通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;按照预设规则,对第一中间数据库与第二中间数据库进行合并得到第三中间数据库;采用第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。本发明专利技术提供的图像分类模型优化方法,能够保证图像分类模型优化的时效性,避免图像分类模型的预测能力退化。

【技术实现步骤摘要】
图像分类模型优化方法、装置及终端
本专利技术涉及图像分类模型优化
,特别是涉及一种图像分类模型优化方法、装置及终端。
技术介绍
近来,深度学习在自然语言处理、文本翻译等相关内容理解领域取得了突破性的进展。然而这些发展严重依赖于训练数据的规模,所以数据在将这些技术应用到实际生产环境中最主要的瓶颈。以目前的数据分类任务为例,一般每一个标签需要的数据量是“千”这样的量级。传统的方法使用的是全监督数据训练模型,即首先需要获得足够标注数据,然后再使用这部分标注图像训练模型。但是该种基于标注数据训练模型的方式存在如下不足:第一、“千”量级的数据看似不多,但是待标注的数据量却十分巨大。一般情况下10-20左右的标注数据中才存在一个训练数据,这就意味着每个标签的训练数据都需要大量的人力标注成本。第二、互联网环境中每天都要大量的多媒体数据即噪声数据产生,随着时间的推移基于静态全监督数据的模型因无法及时跟随每天噪声数据产生进行优化,模型的预测能力将退化,最终影响预测结果的准确性。
技术实现思路
本专利技术实施例提供一种图像分类模型优化方法、装置及终端,以解决现有技术中存在的全监督数据训练的模型退化的问本文档来自技高网...

【技术保护点】
1.一种图像分类模型优化方法,其特征在于,所述方法包括:通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;其中,第一图像分类模型基于噪声数据库中存储的噪声数据训练得到;通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库;采用所述第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。

【技术特征摘要】
1.一种图像分类模型优化方法,其特征在于,所述方法包括:通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;其中,第一图像分类模型基于噪声数据库中存储的噪声数据训练得到;通过所述第二图像分类模型,对所述噪声数据库中存储的噪声数据进行筛选得到第一中间数据库;以及通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库;按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库;采用所述第三中间数据库中的噪声数据,全部替换所述噪声数据库中的噪声数据,以优化所述第一图像分类模型。2.根据权利要求1所述的方法,其特征在于,通过所述第二图像分类模型对预设时间段内用户生成的噪声数据进行筛选,得到第二中间数据库的步骤,包括:从预设时间段内用户生成的噪声数据中,提取多个噪声数据作为样本数据;对各所述样本数据进行变换处理,得到各所述样本数据的变换数据;通过所述第二图像分类模型,对各所述样本数据及各所述变换数据进行标签预测,确定各所述样本数据的目标标签和目标标签概率;根据各所述样本数据的目标标签及目标标签概率,对各所述样本数据进行筛选,得到第二中间数据库。3.根据权利要求2所述的方法,其特征在于,所述按照预设规则,对所述第一中间数据库与所述第二中间数据库进行合并得到第三中间数据库的步骤,包括:将所述第一中间数据库与所述第二中间数据库中的各噪声数据,按照目标标签进行分组;按照目标标签概率对同一分组中的噪声数据进行排序;其中,排序在前的噪声数据的目标标签概率值大;筛选得到各分组中排序在前的、预设数量的噪声数据,构成第三中间数据库;分别对所述第三中间数据库中各分组下的噪声数据,进行目标标签抽样校正。4.根据权利要求3所述的方法,其特征在于,对所述第三中间数据库中一个分组下的噪声数据,进行目标标签抽样校正的步骤,包括:从所述分组下抽取噪声数据,判断被抽取的噪声数据对应的目标标签是否准确;若否,对被抽取的所述噪声数据的目标标签进行校正。5.根据权利要求2所述的方法,其特征在于,所述对各所述样本数据进行变换处理,得到各所述样本数据的变换数据的步骤,包括:对每个样本数据按照预设变换方式进行变换,得到各所述样本数据的变换数据;其中,预设变换方法包括以下至少之一:旋转、平移以及剪切。6.一种图像分类模型优化装置,其特征在于,所述装置包括:修正模块,被配置为通过模型初始训练数据对当前第一图像分类模型进行修正,得到修正后的第二图像分类模型;其中,第一图像分类模型基于噪声数据...

【专利技术属性】
技术研发人员:张志伟杨帆
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1