System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据处理的方法和系统技术方案_技高网
当前位置: 首页 > 专利查询>丁琰专利>正文

一种数据处理的方法和系统技术方案

技术编号:40497762 阅读:4 留言:0更新日期:2024-02-26 19:25
本申请提供了一种数据处理的方法、装置、电子设备、系统及计算机可读存储介质,所述方法包括:将一层或多层神经网络封装成一种类或多种类的模块,每一相同种类的模块具有相同的结构并共享权值,所述模块具有低熵的输入和/或输出;将一种类或多种类的模块连接形成核心处理模块,所述核心处理模块中模块的数量多于一个;接收训练数据,将训练数据输入核心处理模块进行数据处理,并获得输出数据;根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,同时获得训练后的所述模块和所述模块的参数,优化目标包括损失函数和强化学习中的Return。

【技术实现步骤摘要】

本专利技术涉计算机技术和机器学习,尤其涉及一种基于神经网络的数据处理方法和系统。


技术介绍

1、随着机器学习技术的发展,机器学习在许多领域得到了广泛的应用,例如人脸识别,图像识别,自动驾驶,对话系统等。当前的机器学习模型通常需要给定输入数据和输出数据,模型使用神经网络作为函数拟合器,优化神经网络的参数以寻找从输入数据到输出数据的最优映射。例如在物体识别中,输入数据是人脸的图像,输出数据是图像所属的分类;在机器翻译中,输入是一种语言的文本数据,输出是对应的另一种语言的文本数据。得益于神经网络强大的拟合能力,计算力的进步和海量的数据,当前的机器学习方法可以拟合足够复杂的函数,准确的描述输入数据和输出数据之间的关系,并在多个领域中表现出良好的性能。

2、当前的机器学习方法在给定的输入数据和输出数据上学习映射,给定的输入数据和输出数据存在不够灵活和粒度较大的问题。预先给定的数据包含了一定的限制,这些数据通常是人工筛选的,例如输入和输出分别是一张图像和另一张图像或者是一段文本和另一段文本,机器学习模型学习的信息被限制在了给定的图像或者文本的数据形式中,模型只能找到给定数据之间的映射关系,从而对神经网络的能力造成了一定的限制。特别的,基于mdp的机器学习方法例如强化学习,每一步的输入和输出受限于给定的数据,而使得模型无法学习到给定数据之间可能存在的额外的步骤,另外,强化学习要求每个估计的value值近似的拟合return,使得学习的结果严格地受限于数据分布。

3、使用可学习的数据分割,使神经网络在给定数据之外寻找新的中间数据状态,从而可以在中间数据状态之间学习到映射。对于基于mdp的机器学习方法,寻找中间数据状态相当于生成额外的处理步骤,另外不要求每个模块的预估的输出rewardi准确的拟合真实的rewardtrue_i或rewardtrue,提供了一个额外的自由度,可以引导训练的方向从而使得训练的结果具有主动的倾向性。以中间数据状态作为神经网络的输入和输出,可以使神经网络在更小粒度上更加灵活的学习到数据映射,从而有效的提高现有神经网络的数据处理能力。因此,一种有效的数据分割和数据处理方法亟待提出。


技术实现思路

1、本申请的一些实施例提供了可至少部分解决现有技术中存在的上述问题的一种数据处理的方法、装置、电子设备、系统及计算机可读存储介质。

2、本申请一方面提供了一种数据处理方法,包括:

3、s1:将一层或多层神经网络封装成一种类或多种类的模块,每一相同种类的模块具有相同的结构并共享权值,所述模块具有低熵的输入和/或输出;

4、s2:将一种类或多种类的模块连接形成核心处理模块,所述核心处理模块中模块的数量多于一个;接收训练数据,将训练数据输入核心处理模块进行数据处理,并获得输出数据;

5、s3:根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,同时获得训练后的所述模块和所述模块的参数,优化目标包括损失函数和强化学习中的return。

6、在本申请的一个实施方式中,所述将训练数据输入核心处理模块进行数据处理,以及根据优化目标和输出数据进行训练,还包括:所有或部分模块输出预估的奖励值(rewardi);将所有或部分模块输出的多个奖励值(rewardi)的整体进行合并;以及使用真实的奖励值(rewardtrue)作为基准对多个奖励值(rewardi)的合并值进行约束,并将所述约束作为所述优化目标的一部分。

7、在本申请的一个实施方式中,所述模块具有低熵的输入和/或输出,包括,模块的输入变量为xin1…xini(i>1),服从联合分布pin(xin1,xin2,…xini),联合熵为ein;模块的输出变量为xout1…xouti(i>1),服从联合分布pout(xout1,xout2,…xouti),联合熵为eout;模块由k层神经网络组成,第k层的输出变量为xk1…xki(i>1),服从联合分布pk(xk1,xk2,…xki),联合熵为ek:对同一种类的所述模块进行相同的处理,使所述同一种类的所述模块的输入的熵ein和/或输出的熵eout小于所述同一种类的所述模块的熵ek中的最大值emax。

8、在本申请的一个实施方式中,所述对同一种类的所述模块进行相同的处理,包括:将模块的输入变量和/或输出变量(xin1…xini和/或xout1…xouti,i>1)表示为变量的熵小于emax的概率分布p,从分布p中采样作为模块的输入和/或输出。

9、在本申请的一个实施方式中,所述对同一种类的所述模块进行相同的处理,还包括:对模块的输入变量和/或输出变量(xin1…xini和/或xout1…xouti,i>1)进行限制,使限制后输入变量和/或输出变量的熵小于emax,将限制后的变量作为模块的输入和/或输出。

10、在本申请的一个实施方式中,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括:使同类模块之间的连接可微分,并使用基于梯度的方法进行训练,所述基于梯度的方法包括梯度下降。

11、在本申请的一个实施方式中,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括,使用进化策略进行训练:在所述模块参数的基础上进行多次的参数生成,获得生成后的参数集合;使用生成后的参数集合中的参数作为所述模块的参数处理输入数据,筛选使所述优化目标的结果较好的参数集合;以及使用所述筛选后的结果较好的参数集合更新所述模块的参数,重复以上步骤直至所述优化目标的结果满足预设值。

12、在本申请的一个实施方式中,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括:协同训练至少两个同一种类的模块;所述协同训练包括,至少有一个模块间接的通过其它的同类模块在所述优化目标下被训练,所述至少一个模块和所述其它的同类模块共同地在所述优化目标下得到优化,共同决定所述同一种类的模块的参数。

13、在本申请的一个实施方式中,获得训练后的所述模块和所述模块的参数之后,还包括:接收推理数据,将推理数据输入训练后的所述模块,执行推理,并获得推理的结果。

14、在本申请的一个实施方式中,所述获得推理的结果之后,还包括:进一步处理所述推理的结果,得到预测分类的概率,将获得的预测分类概率输出。

15、本申请的第二方面提供一种数据处理系统,包括:

16、基础模块构建子模块,用于将一层或多层神经网络封装成一种类或多种类的模块,每一相同种类的模块具有相同的结构并共享权值,所述模块具有低熵的输入和/或输出;

17、数据处理子模块,用于将一种类或多种类的模块连接形成核心处理模块,所述核心处理模块中模块的数量多于一个;接收训练数据,将训练数据输入核心处理模块进行数据处理,并获得输出数据后输出;

18、数据训练子模块,用于根据优化目标和输出数本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述将训练数据输入核心处理模块进行数据处理,以及根据优化目标和输出数据进行训练,还包括:

3.根据权利要求1或2所述的任一数据处理方法,其特征在于,所述模块具有低熵的输入和/或输出,包括,模块的输入变量为Xin1…Xini(i>1),服从联合分布pin(xin1,xin2,…xini),联合熵为Ein;模块的输出变量为Xout1…Xouti(i>1),服从联合分布pout(xout1,xout2,…xouti),联合熵为Eout;模块由k层神经网络组成,第k层的输出变量为Xk1…Xki(i>1),服从联合分布pk(xk1,xk2,…xki),联合熵为Ek:

4.根据权利要求3所述的数据处理方法,其特征在于,所述对同一种类的所述模块进行相同的处理,包括:

5.根据权利要求3所述的数据处理方法,其特征在于,所述对同一种类的所述模块进行相同的处理,还包括:

6.根据权利要求3或4或5所述的任一数据处理方法,其特征在于,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括:

7.如根据权利要求3或4或5所述的任一数据处理方法,其特征在于,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括,使用进化策略进行训练:

8.根据权利要求3或4或5所述的任一数据处理方法,其特征在于,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发生改变,包括:

9.根据权利要求6或7或8所述的任一数据处理方法,其特征在于,获得训练后的所述模块和所述模块的参数之后,还包括:

10.根据权利要求9所述的数据处理方法,其特征在于,所述获得推理的结果之后,还包括:

11.一种数据处理系统,其特征在于,所述系统包括:

12.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有指令,所述处理器用于读取所述指令并执行如权利要求1-10任一所述的方法。

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,所述指令可被处理器读取并执行如权利要求1-10任一所述的方法。

14.一种电路系统,其特征在于,包括处理电路,所述处理电路配置为执行如权利要求1至10中任一项所述的方法。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的数据处理方法,其特征在于,所述将训练数据输入核心处理模块进行数据处理,以及根据优化目标和输出数据进行训练,还包括:

3.根据权利要求1或2所述的任一数据处理方法,其特征在于,所述模块具有低熵的输入和/或输出,包括,模块的输入变量为xin1…xini(i>1),服从联合分布pin(xin1,xin2,…xini),联合熵为ein;模块的输出变量为xout1…xouti(i>1),服从联合分布pout(xout1,xout2,…xouti),联合熵为eout;模块由k层神经网络组成,第k层的输出变量为xk1…xki(i>1),服从联合分布pk(xk1,xk2,…xki),联合熵为ek:

4.根据权利要求3所述的数据处理方法,其特征在于,所述对同一种类的所述模块进行相同的处理,包括:

5.根据权利要求3所述的数据处理方法,其特征在于,所述对同一种类的所述模块进行相同的处理,还包括:

6.根据权利要求3或4或5所述的任一数据处理方法,其特征在于,根据优化目标和输出数据进行训练,使所述核心处理模块中的所述模块的参数发...

【专利技术属性】
技术研发人员:丁琰
申请(专利权)人:丁琰
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1