当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理设备、信息处理方法、程序以及信息处理系统技术方案

技术编号:9596774 阅读:77 留言:0更新日期:2014-01-23 02:16
本发明专利技术公开了一种信息处理设备、信息处理方法、程序以及信息处理系统。所述信息处理设备包括计算单元和生成单元。所述计算单元被配置成计算如下频率函数:该频率函数是与数据库的一个或更多个属性值的出现频率相关的函数,所述数据库具有预定属性和与所述属性相关的所述一个或更多个属性值。所述生成单元被配置成基于计算出的频率函数来生成根据与所述数据库相关的出现频率的样本数据,所述样本数据包括所述一个或更多个属性值的至少一部分来作为一个或更多个样本属性值。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种信息处理设备、信息处理方法、程序以及信息处理系统。所述信息处理设备包括计算单元和生成单元。所述计算单元被配置成计算如下频率函数:该频率函数是与数据库的一个或更多个属性值的出现频率相关的函数,所述数据库具有预定属性和与所述属性相关的所述一个或更多个属性值。所述生成单元被配置成基于计算出的频率函数来生成根据与所述数据库相关的出现频率的样本数据,所述样本数据包括所述一个或更多个属性值的至少一部分来作为一个或更多个样本属性值。【专利说明】信息处理设备、信息处理方法、程序以及信息处理系统
本公开内容涉及用于提供例如数据库的信息处理设备、信息处理方法、程序以及信息处理系统。
技术介绍
例如,日本专利申请公开N0.2010-93424公开了如下技术:通过统计方法仅获得统计值来作为数据的汇集结果,而隐藏了数据库中的各个数据。例如,在为了学术研究或市场分析而分发由各种组织(例如公司)拥有的消费者信息等的情况下,使用以上提及的技术。在日本专利申请公开N0.2010-93424公开的数据汇集方法中,执行了由能够定义数据的反函数的函数进行的变换操作,并且针对变换后的数据执行干扰处理。基于通过干扰处理获得的干扰后的数据,计算与所述变换后的数据相关的统计值的近似值。然后,由反函数对所述统计值执行逆变换处理,由此生成与所述数据相关的统计值的近似值。在所述数据汇集方法中,因为针对数据不仅执行了干扰处理而且执行了变换处理,所以增加了保密性。同时,在变换处理和逆变换处理中,统计值的精确度未降低,所以仅仅在干扰处理中引起了统计值的精确度的下降。作为结果,可以同时实现待生成的统计值的高精确度以及数据保密性(参见例如日本专利申请公开N0.2010-93424的段落0001至0010)。
技术实现思路
在例如如上所述提供数据时,需要一种用于数据提供者和数据用户的有用系统。鉴于上述情况,期望提供能够获得对数据提供者和数据用户有用的数据提供系统的信息处理设备、信息处理方法、程序以及信息处理系统。根据本公开内容的实施方式,提供了一种信息处理设备,所述信息处理设备包括计算单元和生成单元。计算单元被配置成计算如下频率函数:所述频率函数是与数据库的一个或更多个属性值的出现频率相关的函数,所述数据库具有预定属性和与所述属性相关的所述一个或更多个属性值。生成单元被配置成:基于计算出的频率函数来生成根据与数据库相关的出现频率的样本数据,该样本数据包括所述一个或更多个属性值的至少一部分作为一个或更多个样本属性值。在信息处理设备中,计算与由数据库所具有的一个或更多个属性值的出现频率相关的频率函数。通过使用该频率函数,生成根据出现频率的样本数据。作为结果,可以获得对数据提供者和数据用户有用的数据提供系统。 频率函数可以表达第一出现频率,第一出现频率是每个属性值的出现频率。以这种方式,可以将表达每个属性值的第一出现频率的函数用作频率函数。生成单元可以生成样本数据,使得由频率函数所表达的每个样本属性值的第一出现频率与第二出现频率彼此对应,所述第二出现频率是样本数据中的每个样本属性值的出现频率。作为结果,可以生成与数据库相关的有用样本数据。计算单元可以计算所述一个或更多个属性值的出现次数相对于各个属性值的总数的比率,并且计算将通过对出现次数的比率进行近似而获得的近似值表达为第一出现频率的频率函数。在信息处理设备中,计算出现次数相对于整体属性值的比率。然后,将出现次数的比率的近似值表达为第一出现频率。作为结果,生成根据出现次数的比率的样本数据。计算单元可以选择预定模型函数并且使所述预定模型函数与每个属性值的出现次数的比率拟合,以计算频率函数。以这种方式,可以通过拟合模型函数来计算频率函数。计算单元可以通过最大似然估计法来估计根据每个属性值的出现次数的比率的概率函数,以计算所估计的概率函数来作为频率函数。以这种方式,可以将通过最大似然估计法所估计的概率函数用作频率函数。计算单元可以计算所述一个或更多个属性值的出现次数相对于各个属性值的总数的比率,并且生成将出现次数的比率表达为第一出现频率的频率函数。以这种方式,出现次数的比率可以被表达为第一出现频率。作为结果,生成根据出现次数的比率的样本数据。信息处理设备还可以包括设置单元,该设置单元被配置成将所述一个或更多个属性值中的预定属性值设置为计算单元计算频率函数时不使用的非目标属性值。在这种情况下,计算单元可以计算与除了所设置的非目标属性值之外的所述一个或更多个属性值的出现频率相关的频率函数。另外,生成单元可以基于所计算出的频率函数、根据除了非目标属性值之外的所述一个或更多个属性值来生成样本数据。在信息处理设备中,设置不用于计算频率函数的非目标属性值。例如,将这样的意在被从样本数据中排除的特征属性值设置为非目标属性值。作为结果,可以生成有用的样本数据。计算单元可以计算所述一个或更多个属性值的出现次数相对于各个属性值的总数的比率,并且基于出现次数的比率来生成频率函数。在这种情况下,设置单元可以基于每个属性值的出现次数的比率,将出现次数的比率小于预定值的属性值设置为非目标属性值。以这种方式,可以将出现次数的比率小于预定值的属性值设置为非目标属性值。作为结果,例如,出现次数的比率小的特征值被设置为非目标属性值。计算单元可以计算所述一个或更多个属性值的出现次数相对于各个属性值的总数的比率,并且基于出现次数的比率来生成频率函数。在这种情况下,设置单元可以基于每个属性值的出现次数的比率,将出现次数的比率与由频率函数所表达的第一出现频率之间的差大于预定值的属性值设置为非目标属性值。计算单元可以再次计算与除了设置的非目标属性值之外的所述一个或更多个属性值的出现频率相关的频率函数。另外,计算单元可以基于再次计算出的频率函数,根据除了非目标属性值之外的所述一个或更多个属性值来生成样本数据。在信息处理设备中,计算由计算出的频率函数表达的第一出现频率与出现次数的比率之间的差。将具有大于预定值的差的属性值设置为非目标属性值。再次计算与除了非目标属性值之外的属性值相关的出现频率。作为结果,出现次数的比率与第一出现频率之间具有较大差的特征属性值被设置为非目标属性值。信息处理设备还可以包括接收单元和选择单元。接收单元被配置成接收对与数据库中的预定数据相关的样本数据的请求。选择单元被配置成基于所述请求从数据库中选择预定数据。在这种情况下,计算单元可以计算与所选择的预定数据相关的频率函数。另外,生成单元可以基于计算出的频率函数根据预定数据来生成样本数据。以这种方式,可以接收对与数据库中的预定数据相关的样本数据的请求。当合适时可以选择预定数据,并且当合适时可以生成与所述数据相关的样本数据。接收单元可以接收外部设备所具有的外部数据和对与数据库中的外部数据关联的关联数据相关的样本数据的请求。在这种情况下,计算单元可以使用外部数据和关联数据的组合作为所述一个或更多个属性值来计算频率函数。生成单元可以基于所计算出的频率函数来生成如下样本数据:所述样本数据包括外部数据与关联数据的组合作为所述一个或更多个样本属性值。信息处理设备从外部设备接收外部数据和对样本数据的请求。生成针对外部数据和与外部数据相关的关联数据的组合的样本数据。作为结本文档来自技高网
...

【技术保护点】
一种信息处理设备,包括:计算单元,所述计算单元被配置成计算如下频率函数:所述频率函数是与数据库的一个或更多个属性值的出现频率相关的函数,所述数据库具有预定属性和与所述属性相关的所述一个或更多个属性值;以及生成单元,所述生成单元被配置成基于所计算出的频率函数来生成根据与所述数据库相关的所述出现频率的样本数据,所述样本数据包括所述一个或更多个属性值的至少一部分作为一个或更多个样本属性值。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:川元洋平白井太三神尾一也田中雄作本纮一
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1