数据处理方法、数据处理模型及其训练方法技术

技术编号:40747007 阅读:17 留言:0更新日期:2024-03-25 20:04
本公开提供了一种数据处理方法、数据处理模型及其训练方法,涉及人工智能领域,具体涉及自然语言处理、深度学习技术、大模型技术。实现方案为:确定输入数据,所述输入数据包括多个分词;根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性,其中所述多个专家网络用于对所述多个分词进行强化;根据所述相关性以及每个专家网络的预设容量将所述多个分词以均匀的方式分配给所述多个专家网络,以对所述多个分词进行强化;根据经强化的所述多个分词确定数据处理结果。

【技术实现步骤摘要】

本公开涉及人工智能领域,具体涉及自然语言处理、深度学习技术、大模型技术,具体涉及一种数据处理方法、数据处理模型及其训练方法、数据处理装置、训练装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

2、预训练语言模型是近年来自然语言处理领域发展比较迅速的技术。在大模型技术中,通过增大预训练模型规模,一般来说可以使得模型取得更好的效果。

3、在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

...

【技术保护点】

1.一种数据处理方法,包括:

2.如权利要求1所述的数据处理方法,其中,根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性包括:

3.如权利要求1所述的数据处理方法,其中,根据所述相关性以及每个专家网络的预设容量将所述多个分词以均匀的方式分配给所述多个专家网络包括:

4.如权利要求3所述的数据处理方法,其中,所述每个专家网络的预设容量是相同的。

5.如权利要求3所述的数据处理方法,其中,根据所述相关性和所述每个专家网络的剩余容量确定第二分配方案包括:

6.如权利要求5所述的数据处理方法,其中,所述最...

【技术特征摘要】

1.一种数据处理方法,包括:

2.如权利要求1所述的数据处理方法,其中,根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性包括:

3.如权利要求1所述的数据处理方法,其中,根据所述相关性以及每个专家网络的预设容量将所述多个分词以均匀的方式分配给所述多个专家网络包括:

4.如权利要求3所述的数据处理方法,其中,所述每个专家网络的预设容量是相同的。

5.如权利要求3所述的数据处理方法,其中,根据所述相关性和所述每个专家网络的剩余容量确定第二分配方案包括:

6.如权利要求5所述的数据处理方法,其中,所述最优输运算法是sinkhorn算法。

7.如权利要求1所述的数据处理方法,其中,根据经强化的所述多个分词确定数据处理结果包括:

8.一种数据处理模型,包括:

9.如权利要求8所述的数据处理模型,其中,根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性包括:

10.如权利要求8所述的数据处理模型,其中,将所述多个分词以均匀的方式分配给所述多个专家网络包括:

11.如权利要求10所述的数据处理模型,其中,所述每个专家网络的预设容量是相同的。

12.如权利要求10所述的数据处理模型,其中,根据所述相关性和所述每个专家网络的剩余容量确定第二分配方案包括:

13.如权利要求12所述的数据处理模型,其中,所述最优输运算法是sinkhorn算法。

14.如权利要求8所述的数据处理模型,其中,所述输出层被配置成:

15.一种用于对如权利要求1至14中任一项所述的数据处理...

【专利技术属性】
技术研发人员:陈徐屹柯博李晨辉黄正杰黄世维李伟彬冯仕堃
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1