基于预训练模型的场景适配学习方法及系统技术方案

技术编号:25951296 阅读:47 留言:0更新日期:2020-10-17 03:43
本发明专利技术提供了一种基于预训练模型的场景适配学习方法及系统,包括:场景接入步骤:根据场景实际的业务需求,接入场景的实际数据;场景配置步骤:通过接入的场景数据快速进行场景数据的模版配置;数据生成步骤:模版配置准备完成后,进行数据生成,完成数据增强和带标注信息的训练数据准备;模型训练步骤:根据生成的训练数据,进一步训练预训练模型,提升预训练模型的精确度。本发明专利技术通过预训练的模型和当前场景的生成数据,我们可以快速获得该场景下的高质量模型,同时,因为有预先训练好的模型,可以大大节约训练的时间。

【技术实现步骤摘要】
基于预训练模型的场景适配学习方法及系统
本专利技术涉及计算机人工智能领域,具体地,涉及基于预训练模型的场景适配学习方法及系统。尤其地,涉及算法模型在应用场景变化的情况下模型如何适配并调优的技术。
技术介绍
目前,深度学习技术在计算机图像识别、语音识别、自然语言处理等领域取得了非常显著的进展,并达到了商业可用的阶段。深度学习算法的一般学习过程是:首先,需要标注大量的训练样本;然后,通过调用训练系统对标注的数据进行训练学习,获得模型。在接下来的应用场景中使用学习到的模型进行识别和预测等机器学习任务。深度学习进行学习的一个首要条件就是必须给训练系统提供大量充分标注好的数据,以供训练系统去学习。在真实的场景下,获取到大量的标注数据往往非常挑战。有可能因为保密和安全等多种因素,我们仅仅能够获得非常少的标注数据。在这种情况下,训练一个高质量的模型就变得非常挑战,为学习场景提供高质量的机器学习模型就极为重要。本专利技术就是为了解决:在数据非常稀少的场景或者场景效果不佳的情况下,基于预训练模型和实际场景数据,利用场景配置和数据生本文档来自技高网...

【技术保护点】
1.一种基于预训练模型的场景适配学习方法,其特征在于,包括:/n场景接入步骤:根据场景实际的业务需求,接入实际场景数据;/n场景配置步骤:通过接入的实际场景数据快速进行实际场景数据的模版配置;/n数据生成步骤:模版配置准备完成后,进行数据生成,完成数据增强和带标注信息的训练数据准备;/n模型训练步骤:根据生成的训练数据,进一步训练预训练模型,提升预训练模型的精确度。/n

【技术特征摘要】
1.一种基于预训练模型的场景适配学习方法,其特征在于,包括:
场景接入步骤:根据场景实际的业务需求,接入实际场景数据;
场景配置步骤:通过接入的实际场景数据快速进行实际场景数据的模版配置;
数据生成步骤:模版配置准备完成后,进行数据生成,完成数据增强和带标注信息的训练数据准备;
模型训练步骤:根据生成的训练数据,进一步训练预训练模型,提升预训练模型的精确度。


2.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述实际场景数据指真实识别场景数据的样本,包括:证照、图片以及车牌。


3.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述场景配置步骤包括:
区域圈选:根据场景的图片,对需要识别的区域进行圈选,为在该区域生成新的数据提供一个长方形空间,同时记录这个位置空间的坐标。
数据配置:配合接下来的生产新的训练数据提供标注对象,定义圈选对象内所需生成的数据基本属性,包括数据内容、数据样式以及数据效果,同时定义模板整体施加效果及支持定义输出时的标准答案相关格式及内容。


4.根据权利要求3所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述数据配置需要完成三个维度的数据生成配置:
item:item为信息处理最小单元,一个item内可含有一个或多个标注图层;
标注图层:标注图层表现为图片区域图片所画边框;
图层信息:图层信息包括item类型、辅助标记信息定义,同时根据图层类型,对该图层属性信息进行进一步定义。


5.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述数据生成步骤包括:
素材生成:模版配置好的框中对文字、数字以及图片进行生成,构建多场景的需要识别分析的文字、数字以及图片;
特效生成:对图片进行特效处理,使得所生成数据支持多种贴合真实场景情况,保证模型训练数据样本多样性。


6.根据权利要求5所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述素材生成支持字体库、语料库以及图片库,以丰富生成的数据格式;
字体库:提供基础字体供用户根据实际数据样式进行模板内容字体调整,同时提供实时预览功能方便用户对合适字体进行选取;
语料库:提供文本基础语料供用户根据实际需要对模板内容进行填充,同时支持用户自定义上传所需语料,灵活满足更多使用场景;
图片库:提供文本基础图片素材供用户根据实际需要对模板内容进行填充,同时支持用户自定义上传所需图片,灵活满足更多使用场景;
所述特效包括:光照、3d变换、浮雕、锐化、中位数模糊以及光滑效果。


7.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征...

【专利技术属性】
技术研发人员:薛贵荣
申请(专利权)人:上海天壤智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1