【技术实现步骤摘要】
基于AI模型的分类方法、装置、设备及存储介质
[0001]本申请实施例涉及AI(Artificial Intelligence,人工智能)
,特别涉及一种基于AI模型的分类方法、装置、设备及存储介质。
技术介绍
[0002]随着AI技术的发展,AI模型的应用也日益多样化。例如,AI模型可以根据样本在多个类别下的置信度,对样本进行分类。
[0003]AI模型产生的样本在多个类别下的置信度可能是不准确的,需要对样本在多个类别下的置信度进行校准。相关技术中提供了一种置信度校准方法,可以为AI模型配置一个校准温度,通过该校准温度,对AI模型产生的样本在多个类别下的置信度进行调整,基于调整后的置信度得到最终的分类结果。
[0004]然而,上述方法会导致部分子群校准效果较好,但在其他子群校准效果较差,进而导致AI模型产生的分类结果准确性较差。
技术实现思路
[0005]本申请实施例提供了一种基于AI模型的分类方法、装置、设备及存储介质。本申请实施例提供的技术方案如下。
[0006]根据本申请 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能AI模型的分类方法,其特征在于,所述方法包括:通过AI分类模型提取文本、语音或图像形式的测试样本的特征表示;根据所述测试样本的特征表示与n个样本子群分别对应的子群特征,确定所述n个样本子群分别对应的权重值;其中,所述n个样本子群中的第i个样本子群对应的子群特征,用于表征所述第i个样本子群中包含的训练样本的平均特征表征;所述第i个样本子群对应的权重值,用于表征所述测试样本属于所述第i个样本子群的可能性,n为大于1的整数,i为小于或等于n的正整数;根据所述n个样本子群分别对应的权重值以及所述n个样本子群分别对应的校准温度,确定所述测试样本的校准温度;其中,所述第i个样本子群对应的校准温度,用于对所述AI分类模型针对所述第i个样本子群的分类结果进行校准;根据所述测试样本的校准温度,对所述AI分类模型得到的所述测试样本在多个类别下的置信度进行校准,得到校准后的分类结果,所述置信度用于表征所述测试样本属于所述类别的预测概率。2.根据权利要求1所述的方法,其特征在于,所述根据所述测试样本的特征表示与n个样本子群分别对应的子群特征,确定所述n个样本子群分别对应的权重值,包括:分别计算所述测试样本的特征表示与各个所述样本子群对应的子群特征之间的距离值,得到所述n个样本子群分别对应的距离值;其中,所述第i个样本子群对应的距离值,用于表征所述测试样本的特征表示与所述第i个样本子群对应的子群特征之间的接近度;根据所述n个样本子群分别对应的距离值,确定所述n个样本子群分别对应的权重值。3.根据权利要求1所述的方法,其特征在于,所述根据所述n个样本子群分别对应的权重值以及所述n个样本子群分别对应的校准温度,确定所述测试样本的校准温度,包括:根据所述n个样本子群分别对应的权重值,对所述n个样本子群分别对应的校准温度进行加权求和,得到所述测试样本的校准温度。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:将训练样本集包含的训练样本,划分为所述n个样本子群;通过所述AI分类模型分别提取各个所述训练样本的特征表示;对于所述n个样本子群中的所述第i个样本子群,对所述第i个样本子群中包含的各个所述训练样本的特征表示进行求平均,得到所述第i个样本子群对应的子群特征。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对验证样本集包含的验证样本进行子群划分,得到n组验证样本;其中,所述n组验证样本中的第i组验证样本包括:与所述第i个样本子群中的训练样本属于同一子群的至少一个验证样本;对于所述第i组验证样本,获取使得所述AI分类模型在所述第i组验证样本上的校准误差满足条件的校准温度,作为所述第i个样本子群对应的校准温度。6.根据权利要求5所述的方法,其特征在于,所述获取使得所述AI分类模型在所述第i组验证样本上的校准误差满足条件的校准温度,作为所述第i个样本子群对应的校准温度,包括:获取初始化的校准温度;通过所述AI分类模型得到所述第i组验证样本中包含的各个验...
【专利技术属性】
技术研发人员:吴秉哲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。