【技术实现步骤摘要】
一种数据处理方法、装置、设备及存储介质
本专利技术涉及计算机
,具体涉及一种数据处理方法、装置、设备及计算机可读存储介质。
技术介绍
网格长短期记忆(GridLSTM)是一种由多个长短期记忆(LSTM)网络单元构成的网络结构。在数据处理过程中,网格长短期记忆网络采用多个循环神经网络单元进行协作,相较于采用单一循环神经网络对数据进行处理更加高效,且在不同环境下(处理不同类型数据)的泛化性更好。在实际应用中,网格长短期记忆网络中的各个LSTM又分别负责不同的功能,由于各个LSTM共享输入信息,输入信息的无差异性导致各个LSTM不能从多个角度提取出输入信息的数据特征,单一的数据特征导致后续识别结果的准确率较低。
技术实现思路
本专利技术实施例提供了一种数据处理方法、装置、设备及存储介质,能够提高人工智能模型的处理结果的准确度。一方面,本申请实施例提供了一种数据处理方法,包括:获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;/n根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;/n获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;/n根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取第t个时间步的输入数据对应的K个投影向量,以及人工智能模型包含的M个处理单元在第t-1个时间步的状态信息,所述状态信息包括所述M个处理单元在第t-1个时间步的隐藏状态,t,K,M为正整数;
根据所述M个处理单元在第t-1个时间步的隐藏状态和所述K个投影向量分别计算各个处理单元的相似度,并根据各个处理单元的相似度从所述M个处理单元中筛选出N个激活单元,N为正整数,且N小于等于M;
获取目标激活单元的第一拼接数据,所述第一拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的;所述目标激活单元是所述N个激活单元中的任一个激活单元;
根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一拼接数据,计算所述目标激活单元在第t个时间步的隐藏状态,包括:
将所述目标激活单元在第t-1个时间步的状态信息和所述第一拼接数据输入所述目标激活单元,得到中间状态数据;
获取所述目标激活单元的第二拼接数据,并根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态,所述第二拼接数据是根据所述目标激活单元在第t-1个时间步的隐藏状态,对所述K个投影向量和所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态进行筛选后拼接得到的。
3.如权利要求2所述的方法,其特征在于,所述获取目标激活单元的第一拼接数据,包括:
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述K个投影向量对应的相似度,并从所述K个投影向量中筛选出满足第一相似度筛选条件的P个投影向量,P为正整数,且P小于等于K;
根据所述目标激活单元在第t-1个时间步的隐藏状态,分别计算所述M个处理单元中除所述目标激活单元外的M-1个处理单元在第t-1个时间步的隐藏状态的相似度,并从所述M-1个处理单元在第t-1个时间步的隐藏状态中筛选出满足第二相似度筛选条件的Q个处理单元在第t-1个时间步的隐藏状态,Q为正整数,且Q小于等于M-1;
根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据。
4.如权利要求3所述的方法,其特征在于,所述根据所述P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态,生成所述目标激活单元的第一拼接数据,包括:
调整所述K个投影向量中除P个投影向量以外的K-P个投影向量;
调整所述M-1个处理单元中除所述Q个处理单元外的M-1-Q个处理单元在第t-1个时间步的隐藏状态;
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态,调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态和所述目标激活单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第一拼接数据。
5.如权利要求4所述的方法,其特征在于,所述获取所述目标激活单元的第二拼接数据,包括:
对所述P个投影向量,调整后的K-P个投影向量,所述Q个处理单元在第t-1个时间步的隐藏状态和调整后的M-1-Q个处理单元在第t-1个时间步的隐藏状态进行拼接,得到所述目标激活单元的第二拼接数据。
6.如权利要求2所述的方法,其特征在于,所述根据所述第二拼接数据和所述中间状态数据计算所述目标激活单元在第t个时间步的隐藏状态...
【专利技术属性】
技术研发人员:王子愉,姜文浩,张子瑄,唐伟,严骏驰,刘威,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。