【技术实现步骤摘要】
多模态数据预训练方法及系统
[0001]本申请涉及人工智能
,具体而言,涉及一种多模态数据预训练方法及系统。
技术介绍
[0002]不同的存在形式或信息来源均可被称之为一种模态,由两种或两种以上模态组成的数据称之为多模态数据(多模态用来表示不同形态的数据形式,或者同种形态不同的格式)。也即,多模态数据是指对于同一个描述对象,通过不同领域或视角获取到的数据,并且把描述这些数据的每一个领域或视角叫做一个模态,如在计算机领域中,通过件不同视角的计算机运行活动数据进行汇总从而构成多模态计算机活动数据,并将其应用于人工智能训练数据中。然而,在实际针对多模态数据的预训练过程中,需要大量的携带训练标签的有监督数据进行训练,训练成本较高,影响训练效率。
技术实现思路
[0003]有鉴于此,本申请的目的在于提供一种多模态数据预训练方法及系统,通过有监督训练数据对多个教师异常分析神经网络进行初始化配置,再通过多个初始化配置的教师异常分析神经网络,获取无监督训练数据的目标异常活动数据,最后通过无监督训练数据和无监督训练数据的 ...
【技术保护点】
【技术特征摘要】
1.一种多模态数据预训练方法,其特征在于,应用于服务器,所述方法包括:基于有监督训练数据对多个教师异常分析神经网络进行初始化配置,生成多个初始化配置的教师异常分析神经网络,所述有监督训练数据是指携带异常活动标注数据的训练用多模态计算机活动数据;基于所述多个初始化配置的教师异常分析神经网络对无监督训练数据分别进行异常分析,生成所述无监督训练数据的多个参考异常活动数据,所述无监督训练数据是指不携带异常活动标注数据的训练用多模态计算机活动数据;基于所述无监督训练数据的多个参考异常活动数据,确定所述无监督训练数据的目标异常活动数据;依据所述无监督训练数据以及所述无监督训练数据的目标异常活动数据,对学生异常分析神经网络进行初始化配置,生成初始化配置的学生异常分析神经网络,所述初始化配置的学生异常分析神经网络用于对候选多模态计算机活动数据进行分析得到所述候选多模态计算机活动数据的异常活动决策数据。2.根据权利要求1所述的多模态数据预训练方法,其特征在于,所述参考异常活动数据表征所述无监督训练数据是否命中目标异常标签;所述基于所述无监督训练数据的多个参考异常活动数据,确定所述无监督训练数据的目标异常活动数据,包括:基于所述无监督训练数据的多个参考异常活动数据分别对应的异常概率的平均化概率,确定所述无监督训练数据的目标异常活动数据;其中,所述多个参考异常活动数据中的第i个参考异常活动数据对应的异常概率,是由所述多个教师异常分析神经网络中的第i个教师异常分析神经网络得到的,用于确定所述无监督训练数据是否命中所述目标异常标签的异常概率。3.根据权利要求2所述的多模态数据预训练方法,其特征在于,所述基于所述无监督训练数据的多个参考异常活动数据分别对应的异常概率的平均化概率,确定所述无监督训练数据的目标异常活动数据,包括:在所述无监督训练数据的多个参考异常活动数据分别对应的异常概率的平均化概率大于第一设定概率时,确定所述无监督训练数据的目标异常活动数据为命中所述目标异常标签;或者,在所述无监督训练数据的多个参考异常活动数据分别对应的异常概率的平均化概率小于第一设定概率时,确定所述无监督训练数据的目标异常活动数据为不命中所述目标异常标签。4.根据权利要求1所述的多模态数据预训练方法,其特征在于,所述参考异常活动数据表征所述无监督训练数据是否命中目标异常标签;所述基于所述无监督训练数据的多个参考异常活动数据,确定所述无监督训练数据的目标异常活动数据,包括:在所述无监督训练数据的多个参考异常活动数据中,命中所述目标异常标签的映射次数大于不命中所述目标异常标签的映射次数时,确定所述无监督训练数据的目标异常活动数据为命中所述目标异常标签;或者,在所述无监督训练数据的多个参考异常活动数据中,命中所述目标异常标签的映射次数小于不命中所述目标异常标签的映射次数时,确定所述无监督训练数据的目标异
常活动数据为不命中所述目标异常标签。5.根据权利要求4所述的多模态数据预训练方法,其特征在于,所述方法还包括:在所述无监督训练数据的多个参考异常活动数据中,命中所述目标异常标签的映射次数等于不命中所述目标异常标签的映射次数时,将所述多个参考异常活动数据中的第j个参考异常活动数据,输出为所述无监督训练数据的目标异常活动数据。6.根据权利要求1所述的多模态数据预训练方法,其特征在于,所述依据所述无监督训练数据以及所述无监督训练数据的目标异常活动数据,对学生异常分析神经网络进行初始化配置,生成初始化配置的学生异常分析神经网络之后,还包括:基于所述有监督训练数据对所述初始化配置的学生异常分析神经网络进行网络权重参数更新,生成预训练生成的学生异常分析神经网络。7.根据权利要求1所述的多模态数据预训练方法,其特征在于,所述多个教师异常分析神经网络中包括第一教师异常分析神经网...
【专利技术属性】
技术研发人员:李斌,
申请(专利权)人:上海麓霏信息技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。