【技术实现步骤摘要】
本申请涉及人工智能领域, 尤其涉及一种数据处理方法及相关设备。
技术介绍
1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能, 感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质, 并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法, 使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人, 自然语言处理,计算机视觉, 决策与推理,人机交互,推荐与搜索,ai基础理论等。知识图谱是人工智能的基础,知识图谱是一组知识的集合, 以三元组的方式存储事实知识,三元组是知识图谱最小的单位,每个三元组的形式为(头实体,关系,尾实体)。
2、目前, 实体的识别方法通常使用一个序列到序列的模型实现实体的识别。具体的,将句子输入编码器得到特征向量,再将该特征向量输入解码器输出句子的实体信息,该实体信息包括实体的边界信息
...【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于采样矩阵确定所述文本数据中的多个片段,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述采样矩阵对所述第一特征向量进行采样以得到所述多个片段,包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述采样矩阵为N×N维度的上三角矩阵,N为正整数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述确定所述多个片段的多个实体信息,包括:
6.根据权利要求1至5中任一项所述的方法,其特征
...【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于采样矩阵确定所述文本数据中的多个片段,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述采样矩阵对所述第一特征向量进行采样以得到所述多个片段,包括:
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述采样矩阵为n×n维度的上三角矩阵,n为正整数。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述确定所述多个片段的多个实体信息,包括:
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述实体边界信息包括所述第一实体的头部位置与所述第一实体的尾部位置。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述基于所述多个实体信息生成所述文本数据的多个第二实体,包括:
8.根据权利要求7所述的方法,其特征在于,所述实体生成网络包括编码器与解码器,所述将所述多个实体信息分别输入实体生成网络得到所述多个第二实体,包括:
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述方法还包括:
10.一种数据处理设备,其特征在于,所述数据处理设备包括:
11.根据权利要求10所述的数据处理设备,其特征在于,所述确定单元,具体用于提取所述文本数据的第一特征向量;
12.根据权利要求11所述的数据处理设备,其特征在于,所述确定单元,具体用于对所述第一特征向量与所述采样矩阵进行点乘处理,以得到所述多个片段。
13.根据权利要求10至12中任一项所述的...
【专利技术属性】
技术研发人员:李雪,陶建军,杨洋,关毅,乔楠,周冰剑,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。