【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机可读存储介质
[0001]本申请涉及人工智能、自然语言处理、云技术以及区块链
,具体而言,本申请涉及一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]近年来,越来越多的领域都需要对文本进行处理,在对文本进行处理的过程中,通常会用到不同的文本处理模型。
[0003]由于文本的复杂程度,相关技术在进行文本处理模型的训练过程中,需要耗费很多时间,训练速度较慢,不能够满足实用需求。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,该方法减少了训练过程中的计算量,提高了数据处理效率,加快了模型训练速度。
[0005]根据本申请实施例的一个方面,提供了一种数据处理的方法,该方法应用于文本处理模型的训练过程中,包括:
[0006]将训练样本集输入至初始神经网络模型,该训练样本集包括多个样本文本对及对应的标注标签,每个样本文本对包括遮挡文本片段; />[0007]基于本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法应用于文本处理模型的训练过程中,包括:将训练样本集输入至初始神经网络模型,所述训练样本集包括多个样本文本对及对应的标注标签,每个样本文本对包括遮挡文本片段;基于所述初始神经网络模型的过滤层对所述训练样本集进行过滤处理,得到各个样本文本对的遮挡文本片段对应的遮挡向量;根据所述遮挡向量与预设的词典表,确定所述各个样本文本对的遮挡文本片段分别对应的预测结果;根据所述各个样本文本对的遮挡文本片段分别对应的预测结果和各个样本文本对分别对应的标注标签,确定所述训练样本集的损失,所述标注标签表征相应的样本文本对包括的遮挡文本片段的真实文本片段;基于所述训练样本集的损失对所述初始神经网络模型进行训练,以得到训练后的文本处理模型。2.根据权利要求1所述的方法,其特征在于,所述遮挡向量用于指示相应的样本文本对中遮挡文本片段在样本文本对中的位置信息以及上下文信息,所述根据所述遮挡向量与预设的词典表,确定所述各个样本文本对的遮挡文本片段对应的预测结果,包括:基于所述初始神经网络模型的卷积层,对所述遮挡向量与所述预设的词典表对应的向量进行卷积操作;根据卷积结果,确定所述各个样本文本对的遮挡文本片段对应的预测结果。3.根据权利要求2所述的方法,其特征在于,所述根据卷积结果,确定所述各个样本文本对的遮挡文本片段对应的预测结果,包括:针对每个遮挡文本片段,确定所述卷积结果的矩阵中与该遮挡文本片段对应的关联位置以及在所述关联位置中具有最大概率的目标位置,并将所述目标位置在所述词典表中对应的目标文本片段确定为该遮挡文本片段对应的预测结果。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:根据至少两个优化参数以及相应的参数值,确定优化向量表,所述优化参数是对所述初始神经网络的模型参数进行调整的依据;所述基于所述训练样本集的损失对所述初始神经网络模型进行训练,包括:确定所述优化向量表中与所述训练样本集的损失对应的目标参数值;将所述初始神经网络模型的模型参数的参数值调整至所述目标参数值。5.根据权利要求4所述的方法,其特征在于,所述优化参数包括至少一个所述初始神经网络模型的模型参数,所述确定所述优化向量表中与所述训练样本集的损失对应的目标参数值,包括:确定所述训练样本集的损失对应的梯度值,并依据预定的梯度优化参数关系,确定与所述梯度值匹配的优化参数的参数值;基于所述优化参数的参数值,在所述...
【专利技术属性】
技术研发人员:弓静,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。