【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及人工智能领域,尤其涉及一种数据处理方法及装置。
技术介绍
人工智能(artificialintelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。结构复杂的深层神经网络虽然比浅层神经网络的拟合能力更强,但在工业界很多要求效率和效果平衡的场景中,架构简洁高效的浅层神经网络是普遍被采用的一个选择。浅层网络的特点是训练和预测速度快,占用资源少。然而,现有浅层神经网络模型,其输入和中间层都是在欧式空间里构建,模型描述能力和参数分布受欧式几何性质制约。
技术实现思路
第一方面,本申请提供了一种数据处理方法,所述方法包括:获取待处理数据。本 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取待处理数据;以及,/n利用训练得到的神经网络对所述待处理数据做处理,以输出处理结果;/n其中,所述神经网络包括特征提取网络以及分类网络;所述特征提取网络被配置为提取所述待处理数据在双曲空间中表达的特征向量,所述分类网络被配置为基于双曲空间的运算规则处理所述特征向量,以得到所述处理结果。/n
【技术特征摘要】 【专利技术属性】
1.一种数据处理方法,其特征在于,所述方法包括:
获取待处理数据;以及,
利用训练得到的神经网络对所述待处理数据做处理,以输出处理结果;
其中,所述神经网络包括特征提取网络以及分类网络;所述特征提取网络被配置为提取所述待处理数据在双曲空间中表达的特征向量,所述分类网络被配置为基于双曲空间的运算规则处理所述特征向量,以得到所述处理结果。
2.根据权利要求1所述的方法,其特征在于,所述待处理数据包括如下的至少一种:
自然语言数据数据、知识图谱数据,基因数据或图像数据。
3.根据权利要求1或2所述的方法,其特征在于,所述分类网络包括多个神经单元,每个神经单元被配置为基于激活函数处理输入数据,其中,所述激活函数包括基于所述双曲空间的运算规则。
4.根据权利要求1至3任一所述的方法,其特征在于,所述特征提取网络包括:第一处理层和第二处理层;
所述第一处理层被配置为处理所述待处理数据,以得到所述待处理数据在所述双曲空间中表示的嵌入向量;
所述第二处理层被配置为计算所述嵌入向量在所述双曲空间上的几何中心,以得到所述特征向量。
5.根据权利要求4所述的方法,其特征在于,所述嵌入向量基于第一共形模型表达;
所述特征提取网络还包括:共形转换层;
所述共形转换层被配置为将所述第一处理层得到的所述嵌入向量转换为基于第二共形模型表达的向量,并将所述基于所述第二共形模型表达的向量输入到所述第二处理层;
所述第二处理层被配置为计算所述基于所述第二共形模型表达的向量的几何中心,以得到所述特征向量;
所述共形转换层还被配置为将所述所述第二处理层得到的特征向量转换为基于所述第一共形模型表达的向量,并将所述基于所述第一共形模型表达的向量输入到所述分类网络,其中,所述第一共形模型表示所述双曲空间通过第一共形映射(conformalmapping)的方式映射到欧式空间,所述第二共形模型表示所述双曲空间通过第二共形映射的方式映射到欧式空间。
6.根据权利要求4所述的方法,其特征在于,所述嵌入向量基于第二共形模型表达;
所述第二处理层被配置为计算基于所述第二共形模型表达的所述嵌入向量的几何中心,以得到所述特征向量,其中,所述第二共形模型表示所述双曲空间通过第二共形映射的方式映射到欧式空间。
7.根据权利要求1至6任一所述的方法,其特征在于,所述分类网络被配置为基于所述双曲空间的运算规则处理所述特征向量,以得到在所述双曲空间中表达的待归一化向量;
将所述待归一化向量映射到欧式空间中,并对映射到欧式空间中的待归一化向量进行归一化处理,以得到所述处理结果。
8.一种数据处理方法,其特征在于,所述方法包括:
获取训练数据以及对应的类别标注;
利用神经网络对所述训练数据做处理,以输出处理结果;
其中,所述神经网络包括特征提取网络以及分类网络;所述特征提取网络被配置为提取所述训练数据的特征向量,所述分类网络被配置为基于双曲空间的运算规则处理所述特征向量,以得到所述处理结果;
基于所述类别标注和所述处理结果,获取损失;以及,
基于所述损失,获取在所述双曲空间中表达的梯度,基于所述梯度更新所述神经网络,得到更新后的神经网络。
9.根据权利要求8所述的方法,其特征在于,所述基于所述梯度更新所述神经网络,得到更新后的神经网络,包括:
基于所述梯度更新所述神经网络中的所述特征提取网络,得到更新后的特征提取网络,所述更新后的特征提取网络被配置为提取所述训练数据在所述双曲空间中表达的特征向量。
10.根据权利要求8或9所述的方法,其特征在于,所述训练数据包括如下的至少一种:
自然语言数据、知识图谱数据,基因数据或图像数据。
11.根据权利要求8至10任一所述的方法,其特征在于,所述分类网络包括多个神经单元,每个神经单元被配置为基于激活函数处理输入数据,其中,所述激活函数包括基于所述双曲空间的运算规则。
12.根据权利要求8至11任一所述的方法,其特征在于,所述特征提取网络包括:第一处理层和第二处理层;
所述第一处理层被配置为处理所述训练数据,以得到所述训练数据对应的嵌入向量;
所述第二处理层被配置为计算所述嵌入向量在所述双曲空间上的几何中心,以得到所述特征向量。
13.根据权利要求12所述的方法,其特征在于,所述嵌入向量基于第一共形模型表达;
所述特征提取网络还包括:共形转换层;
所述共形转换层被配置为将所述第一处理层得到的所述嵌入向量转换为基于第二共形模型表达的向量,并将所述基于所述第二共形模型表达的向量输入到所述第二处理层;
相应的,所述第二处理层被配置为计算所述基于所述第二共形模型表达的向量的几何中心,以得到所述特征向量;
所述共形转换层还被配置为将所述所述第二处理层得到的特征向量转换为基于所述第一共形模型表达的向量,并将所述基于所述第一共形模型表达的向量输入到所述分类网络,其中,所述第一共形模型表示所述双曲空间通过第一共形映射(conformalmapping)的方式映射到欧式空间,所述第二共形模型表示所述双曲空间通过第二共形映射的方式映射到欧式空间。
14.根据权利要求12所述的方法,其特征在于,所述双曲空间中的数据可基于第二共形模型表达,所述第二共形模型表示双曲空间通过第二共形映射的方式映射到欧式空间;其中,所述嵌入向量基于所述第二共形模型表达;
所述第二处理层被配置为计算基于所述第二共形模型表达的所述嵌入向量的几何中心,以得到所述特征向量。
15.根据权利要求8至14任一所述的方法,其特征在于,所述分类网络被配置为基于双曲空间的运算规则处理所述特征向量,以得到在所述双曲空间中表达的待归一化向量;
将所述待归一化向量映射到欧式空间中,并对映射到欧式空间中的待归一化向量进行归一化处理,以得到所述处理结果。
16.根据权利要求15所述的方法,其特征在于,所述基于所述类别标注和所述处理结果,获取损失,包括:
基于所述类别标注、所述处理结果以及目标损失函数,获取损失,其中,所述目标损失函数为在所述欧式空间中表达的函数。
17.根据权利要求15或16所述的方法,其特征在于,所述基于所述损失更新所述神经网络,包括:
计算所述损失对应的梯度,其中,所述梯度在欧式空间中表达;
将所述梯度转换为在所述双曲空间中表达的梯度;
基于所述在双曲空间中表达的梯度更新所述神经网络。
18.一种数据分类装置,其特征在于,所述装置包括:
获取模块,被配置为获取待处理数据;以及,
处理模块,被配置为利用训练得到的神经网络对所述待处理数据做处理,以输出处理结果;
技术研发人员:朱煜东,肖镜辉,周迪,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。