【技术实现步骤摘要】
图数据压缩方法、装置、设备及介质
[0001]本申请涉及人工智能和云计算
,尤其涉及一种图数据压缩方法、装置、设备及介质。
技术介绍
[0002]目前,图数据一般由多个数据点构成,一般而言数据点具备较高的数据深度,图数据以结构清晰,便于数据查询的优势,具备越来越广泛的应用场景。在实际应用中,例如知识图谱、用户图谱、高光谱图像均可以属于图数据。其中,用户图谱例如可以是以用户标识作为用户节点,节点信息可以为具有较高深度的用户信息,用户之间的关系可以作为用户节点的边。知识图谱与之类似,同样是基于具有一定数据深度的节点和节点之间的连接关系生成。而高光谱图像一般是多个像素点组成,像素点的波段较多。例如,通过卫星采集的地表图像一般是2000*2000的分辨率,由400万个像素点构成,每个像素点由500个波段构成,500个波段可以理解为像素点的深度。
[0003]但是,由于数据点的结构较为复杂,数据深度较高,因而导致多个数据点构成的图数据的数据量较大,占用过多的存储空间,不利于数据的存储。因此,如何对图数据进行高精准压缩是目 ...
【技术保护点】
【技术特征摘要】
1.一种图数据压缩方法,其特征在于,包括:确定待压缩的图数据中的至少一个数据点;所述数据点的数据深度大于深度阈值;确定至少一个所述数据点中的有标签数据点和无标签数据点;利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵;基于所述图数据和所述降维矩阵的矩阵计算,获得所述图数据的目标图数据。2.根据权利要求1所述的方法,其特征在于,所述有标签数据点包括:至少一个标签类别分别对应的标签数据点;所述利用所述有标签数据点和所述无标签数据点之间的类别关联关系,提取至少一个所述数据点对应的降维矩阵,包括:以所述无标签数据点作为同一类别,结合至少一个所述标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息;根据至少一个所述标签类别分别对应的标签数据点,对不同类别的标签数据点之间的关联关系进行提取,获得类间协同信息;基于所述类内协同信息和所述类间协同信息,构造半监督协同嵌入方程;响应于针对所述半监督协同嵌入方程的求解指令,对所述半监督协同嵌入方程求解,获得所述降维矩阵。3.根据权利要求2所述的方法,其特征在于,所述以所述无标签数据点作为同一类别,结合至少一个所述标签类别分别对应的标签数据点,对同一类别的标签数据点之间的关联关系进行提取,获得类内协同信息,包括:根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在同一类别标签的相同特征关系进行提取,获得至少一个所述数据点分别对应的第一重构系数向量;将所述无标签数据点作为无标签类别,对所述数据点在所述无标签类别的相同特征关系进行提取,获得至少一个所述数据点分别对应的第二重构系数向量;将所述数据点对应的所述第一重构系数向量和所述第二重构系数向量加权,获得至少一个所述数据点分别对应的半监督权值向量;基于至少一个所述数据点分别对应的半监督权值向量,确定所述类内协同信息;所述类内协同信息用于构造至少一个所述数据点分别对应的有向重构图。4.根据权利要求3所述的方法,其特征在于,所述根据至少一个所述标签类别分别对应的标签数据点,对所述数据点在同一类别标签的相同特征关系进行提取,获得至少一个所述数据点分别对应的第一重构系数向量,包括:根据至少一个所述标签类别分别对应的标签数据点,对同一标签类别的标签数据点之间的相同特性进行关系提取,获得至少一个所述数据点分别对应的同类表征向量;根据所述数据点的同类表征向量,计算获得所述数据点的第一重构系数向量,以确定至少一个所述数据点分别对应的第一重构系数向量。5.根据权利要求4所述的方法,其特征在于,任一个所述数据点的同类表征向量通过以下方式确定:针对至少一个所述数据点中的第一数据点,将至少一个所述数据点的数量作为向量长度,为所述第一数据点建立空的第一表征向量;
遍历至少一个所述数据点,判断所述数据点与所述第一数据点是否属于同一类别,若是,则确定所述数据点在所述第一表征向量对应坐标处取值为1,若否,则确定所述数据点在所述第一表征向量对应坐标处取值为0;获得遍历结束时各坐标值已确定的所述第一表征向量为所述同类表征向量。6.根据权利要求3所述的方法,其特征在于,所述将所述无标签数据点作为无标签类别,对所述数据点在所述无标签类别的相同特征关系进行提取,获得至少一个所述数据点分别对应的第二重构系数向量,包括:将所述无标签数据点作为同一类别,对所述数据点对应的无标签特征进行提取,获得至少一个所述数据点分别对应的无标签向量;根据所述数据点对应的无标签向量,计算获得所述数据点的第二重构系数向量,以获得至少一个所述数据点分别对应的第二重构系数向量。7.根据权利要求6所述的方法,其特征在于,任一个所述数据点的无标签向量通过以下方式确定:针对至少一个所述数据点中的第二数据点,将至少一个所述数据点的数量作为向量长度,为所述第二数据点建立空的标签向量;遍历至少一个所述数据点,判断所述数据点与所述第二数据点是否均为无标签数据点,若是,则确定所述数据点在所述标签向量对应坐标取值为1,若否,则确定所述数据点在所述标签向量对应坐标值为0;获得遍历结束时,坐标值均已确定的所述标签向量为所述无标签向量。...
【专利技术属性】
技术研发人员:李熠,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。