基于统计的多维数据克隆制造技术

技术编号:24019783 阅读:82 留言:0更新日期:2020-05-02 04:51
一种用于根据所述数据样本的统计信息在数据集中克隆数据样本的方法。所述方法不使用所述数据样本中的任何数据样本执行所述克隆。所述统计信息包括从所述数据样本的数据条目基于Eckart‑Young定理形成的数据矩阵中获取的第一组统计参数,以及指示所述数据样本的所述数据条目的统计属性的第二组统计参数。所述数据样本基于Eckart‑Young定理使用所述第一组统计参数和所述第二组统计参数进行重构。

Multidimensional data cloning based on statistics

【技术实现步骤摘要】
【国外来华专利技术】基于统计的多维数据克隆本专利技术要求于2017年4月5号递交的专利技术名称为“基于统计的多维数据克隆”的第15/479,843号美国非临时专利申请案的在先申请优先权,该在先申请的内容以引入的方式并入本文中。
本专利技术大体上涉及数据克隆,在特定实施例中,涉及基于统计的多维数据克隆的技术和机制。
技术介绍
服务提供商例如蜂窝网络服务提供商、互联网服务提供商或银行服务提供商,通常在向其客户提供服务的过程中生成大量用户相关数据。在许多情况下,所述用户相关数据包括敏感信息,例如安全敏感信息或私有信息,对于这些数据,第三方不可访问或不可用。但是,这种数据通常最适用于基于所述数据或利用所述数据的应用。例如,第三方可能希望使用手机用户相关数据测试为手机用户提供在线购物服务而开发的软件应用。在这种情况下,需要开发能够克隆所述用户相关数据的数据克隆技术,以便所述第三方无需访问所述用户相关数据本身。
技术实现思路
通过本专利技术中描述基于统计的多维数据克隆的实施例,通常可以实现技术优势。根据本专利技术的一方面,提供了一种方法,所本文档来自技高网...

【技术保护点】
1.一种用于数据克隆的计算机实现方法,其特征在于,包括:/n通过一个或多个处理器获取数据集中的第一组数据样本的统计信息,其中,所述第一组数据样本中的每一个包括与不同条目类别对应的数据条目,所述统计信息包括第一组统计参数,所述第一组统计参数是从第一数据矩阵中获取的,其中,所述第一数据矩阵是所述第一组数据样本中的多个数据条目基于埃卡特-杨Eckart-Young定理形成的,并且所述统计信息包括第二组统计参数,所述第二组统计参数指示所述第一组数据样本的所述数据条目的统计属性,所述统计信息不包括所述数据集中的所述第一组数据样本;/n通过一个或多个处理器使用所述第一组统计参数和所述第二组统计参数基于Ec...

【技术特征摘要】
【国外来华专利技术】20170405 US 15/479,8431.一种用于数据克隆的计算机实现方法,其特征在于,包括:
通过一个或多个处理器获取数据集中的第一组数据样本的统计信息,其中,所述第一组数据样本中的每一个包括与不同条目类别对应的数据条目,所述统计信息包括第一组统计参数,所述第一组统计参数是从第一数据矩阵中获取的,其中,所述第一数据矩阵是所述第一组数据样本中的多个数据条目基于埃卡特-杨Eckart-Young定理形成的,并且所述统计信息包括第二组统计参数,所述第二组统计参数指示所述第一组数据样本的所述数据条目的统计属性,所述统计信息不包括所述数据集中的所述第一组数据样本;
通过一个或多个处理器使用所述第一组统计参数和所述第二组统计参数基于Eckart-Young定理重构所述第一组数据样本,从而生成第二组数据样本,所述第二组数据样本包括与所述不同条目类别对应的数据条目;
通过所述一个或多个处理器基于相应条目类别调整所述第二组数据样本的所述数据条目,使得所述第二组数据样本的所述数据条目满足所述不同条目类别的要求。


2.根据权利要求1所述的计算机实现方法,其特征在于,所述数据集是包含客户特定数据的数据库。


3.根据权利要求1所述的计算机实现方法,其特征在于,所述第一组数据样本通过替换从所述数据集中采样。


4.根据权利要求1所述的计算机实现方法,其特征在于,还包括基于所述第二组数据样本重构所述数据集的一部分或所述整个数据集。


5.根据权利要求1所述的计算机实现方法,其特征在于,所述第一组统计参数包括基于Eckart-Young定理从所述第一数据矩阵的单一值中分解获得的矩阵。


6.根据权利要求1所述的计算机实现方法,其特征在于,所述第二组统计参数包括与所述不同条目类别对应的所述第一组数据样本的所述数据条目的最大值。


7.根据权利要求1所述的计算机实现方法,其特征在于,所述第二组统计参数包括与所述不同条目类别对应的所述第一组数据样本的所述数据条目的最小值。


8.根据权利要求1所述的计算机实现方法,其特征在于,重构所述第一组数据样本包括:基于Eckart-Young定理使用所述第一组统计参数计算第二数据矩阵;
使用所述第二数据矩阵和所述第二组统计参数重构所述第一组数据样本。


9.根据权利要求8所述的计算机实现方法,其特征在于,所述第二数据矩阵是通过使用所述第二组统计参数归一化的矩阵。


10.根据权利要求8所述的计算机实现方法,其特征在于,使用所述第二数据矩阵和所述第二组统计参数重构所述第一组数据样本包括:使用计算第三矩阵,其中,Ap表示所述第二数据矩阵,所述第二数据矩阵的大小为n*d,diag(·)表示对角矩阵,vmax=(max(a1),…,max(aj),…,max(ad)),vmin=(min(a1),…,min(aj),…,min(ad)),max(·)表示最大值,min(·)表示最小值,1n为n*1的向量,且a1,…,aj,…,ad为所述第一数据矩阵的列,所述第一数据矩阵的大小为n*d,其中,所述第二组统计参数包括vmax和vmin。


11.根据权利要求1所述的计算机实现方法,其特征在于,还包...

【专利技术属性】
技术研发人员:于江生马仕俊周庆庆廷裕·克里夫·梁
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1