全连接层的数据处理方法及系统、电子设备及介质技术方案

技术编号：35266506 阅读：33 留言：0更新日期：2022-10-19 10:29

本发明专利技术公开了一种全连接层的数据处理方法及系统、电子设备及介质，该数据处理方法包括：获取BERT模型全连接层的输入数据；对输入数据进行K

全部详细技术资料下载

【技术实现步骤摘要】
全连接层的数据处理方法及系统、电子设备及介质

[0001]本申请涉及数据处理领域，具体涉及一种全连接层的数据处理方法及系统、电子设备及介质。

技术介绍

[0002]如何加速BERT(Bidirectional Encoder Representation from Transformers，一种预训练的语言表征模型)模型的训练及推理速度是数据处理领域一直关注的问题。现在有很多方法致力于加速BERT模型的推理速度，除了可以利用量化、剪枝及蒸馏等方法将BERT模型压缩为小模型外，还可以从BERT模型本身的算子出发。在BERT模型中的全连接层其本质是矩阵乘法操作。矩阵乘法需要大量的乘加运算，导致消耗大量内存以使得矩阵乘法耗时较大，如果能加速矩阵乘法就能加速BERT模型的推理速度。
[0003]目前已经有很多加速矩阵乘法的方法，如构建高速矩阵乘法库，利用硬件加速特定矩阵的乘法运算，矩阵稀疏化，因子化等。但以上矩阵乘法算法通常是使用线性函数对矩阵A和矩阵B进行预处理，并将问题简化为低维空间中的精确矩阵乘法。这些方法基本是孤独地考虑每个矩阵并通常应用在大矩阵上，还是需要进行矩阵乘法的计算，加速效果有限。

技术实现思路

[0004]本专利技术要解决的技术问题是为了克服现有技术中加速BERT模型全连接层的数据处理速度存在困难的缺陷，提供一种全连接层的数据处理方法及系统、电子设备及介质。
[0005]本专利技术是通过下述技术方案来解决上述技术问题：
[0006]本专利技术提供了一种全连接层的数据...

【技术保护点】

【技术特征摘要】
1.一种全连接层的数据处理方法，其特征在于，所述数据处理方法包括：获取BERT模型全连接层的输入数据；对所述输入数据进行K
‑
means聚类，得到K个目标质心；按照预设规则，依次从所述输入数据中选出一个向量作为第一目标向量，查找与所述第一目标向量最接近的目标质心，并将所述目标质心作为所述第一目标向量的近似值，所述近似值用于替代所述第一目标向量进行所述BERT模型全连接层的输出数据的计算，直到得到所述输入数据中每一个向量的近似值。2.如权利要求1所述的全连接层的数据处理方法，其特征在于，所述对所述输入数据进行K
‑
means聚类，得到K个目标质心的步骤具体包括：从所述输入数据中选取K个向量作为初始质心；按照预设规则，依次从所述输入数据中选出一个向量作为第二目标向量，分别计算所述第二目标向量和每个所述初始质心之间的相似度，并将所述第二目标向量与和所述第二目标向量之间的相似度最小的初始质心分为一类，直到将所述输入数据分类完毕；重新计算分类后的每类向量的质心，得到K个新的质心；计算损失函数的值，判断是否满足停止迭代的条件，若满足，则将所述K个新的质心作为所述K个目标质心；若不满足，则按照预设规则，依次从所述输入数据中选出一个向量作为第三目标向量，分别计算所述第三目标向量和每个所述新的质心之间的相似度，并将所述第三目标向量与和所述第三目标向量之间的相似度最小的新的质心分为一类，直到将所述输入数据分类完毕，并返回所述重新计算每类的质心，得到K个新的质心的步骤。3.如权利要求1所述的全连接层的数据处理方法，其特征在于，所述数据处理方法还包括：计算所述K个目标质心与所述BERT模型全连接层的权重的点积值，得到对应于所述K个目标质心的点积值；将对应于所述第一目标向量的近似值的点积值作为所述第一目标向量与所述BERT模型全连接层的权重的点积值，记为近似点积值；将得到的所述近似点积值相加，作为所述BERT模型全连接层的输出数据...

【专利技术属性】
技术研发人员：王嘉欣，吴鹏，李健，
申请(专利权)人：携程旅游信息技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人