一种信息处理方法及装置制造方法及图纸

技术编号:39837663 阅读:18 留言:0更新日期:2023-12-29 16:23
本申请公开了一种信息处理方法,该方法包括:获取小样本对应的目标领域的待处理数据

【技术实现步骤摘要】
一种信息处理方法及装置


[0001]本申请涉及数据处理领域,特别是涉及一种信息处理方法及装置


技术介绍

[0002]随着计算机技术的发展,可以利用机器学习算法训练得到机器学习模型,由训练得到的机器学习模型,实现对相应数据的处理

例如,在数据分类场景,可以训练分类模型对数据的进行分类

又如,在回归预测场景,可以训练回归模型来预测数据的回归值

[0003]但是,机器学习模型的数据处理效果,直接受训练该模型的训练样本的规模影响,若要训练得到数据处理效果较好的机器学习模型,需要大量的训练样本

[0004]然而,在一些场景中,例如,在小样本对应的领域中,其可用于训练机器学习模型的样本的数量较少,相应的,利用小样本对应的领域中较少的训练样本,很难获得数据处理效果较好的机器学习模型

因此,如何对小样本对应的领域中的待处理数据进行处理,以得到较好的数据处理效果,是目标尚待解决的问题


技术实现思路

[0005]为了解决或者至本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种信息处理方法,其特征在于,所述方法包括:获取小样本对应的目标领域的待处理数据;利用初始内容理解模型对所述待处理数据进行处理,得到处理结果,其中,所述初始内容理解模型包括多个子模型,所述多个子模型中的每个子模型是基于多个其它领域的样本数据得到的,所述处理结果包括:所述多个子模型中每个子模型分别对所述待处理数据进行处理的结果,所述多个其它领域中的每个领域均为大样本对应的领域;根据所述每个子模型对所述待处理数据进行处理的结果

以及所述每个子模型的权重,确定对所述待处理数据进行处理的最终结果,其中,所述每个子模型的权重是基于目标领域的训练样本数据确定的
。2.
根据权利要求1所述的方法,其特征在于,所述每个子模型的权重,通过如下方式确定:获取所述目标领域的训练样本数据,并分别基于所述多个子模型,得到所述训练样本数据的处理结果;根据所述训练样本数据的处理结果和所述训练样本数据的标签,确定所述多个子模型中各个子模型的权重
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述训练样本数据的处理结果和所述训练样本数据的标签,确定所述多个子模型中各个子模型的权重,包括:根据每个子模型对所述训练样本数据进行处理得到的处理结果和所述训练样本数据的标签,确定所述各个子模型的权重得分;对所述各个子模型的权重得分进行归一化处理,得到所述各个子模型的权重
。4.
根据权利要求3所述的方法,其特征在于,若所述初始内容理解模型用于确定所述待处理数据的类型,且,所述初始内容理解模型适用于二分类场景,则所述各个子模型的权重得分,包括:正态检测指标或者曲线下面积指标;若所述初始内容理解模型用于确定所述待处理数据的类型,且,所述初始内容理解模型适用于多分类场景,则所述各个子模型的权重得分,包括:准确率;若所述初始内容理解模型用于适用于回归预测场景,则所述各个子模型的权重得分,包括:平均绝对误差或者均方误差
。5.
根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:喻凡
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1