当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理装置、信息处理方法和程序制造方法及图纸

技术编号:8022370 阅读:175 留言:0更新日期:2012-11-29 04:36
在此公开信息处理装置、信息处理方法和程序。基于数据计算具有最高似然的概率函数。计算统计物理学中的正则分布和正则分布的温度参数作为所述数据的波动。使用具有最高似然的概率函数、计算出的波动和所述正则分布来估计概率函数。本公开可应用于估计和使用概率函数的装置。

【技术实现步骤摘要】

本技术涉及信息处理装置、信息处理方法和程序,更具体地,涉及能够在基于数据估计概率函数时,在没有设置参数等的情况下估计最佳概率函数的信息处理装置、信息处理方法和程序。
技术介绍
存在使用通过学习预先给定数据所获得的分类规则,对随后获得的数据进行分类的已知技术。在这种技术中,估计数据背后的数据产生源的真实概率分布或者与该真实概率分布接近的概率分布。为了估计概率分布,已经研究了诸如混合高斯分布、隐马尔可夫模型和贝叶斯网络之类的许多模型。
技术实现思路
在1992年东京大学出版社出版的东京大学文理学院的统计课文“ScientificStatistics”中,当基于数据估计概率函数时,根据相对频率计算出概率函数。然而,在这种方法中,当数据量小时出现过多学习。因此,根据冗余的实验已经明显的是,这种估计不是具有鲁棒性的估计。在C. P. Robert 所著的“The Bayesian Choice:From Decision-TheoreticFoundations to Computational Implementation,,,Springer-Verlag, New York, NY,第二版,2007中,公开了使用先验分布的贝叶斯(Bayesian)统计,其中将不是数据的分析者的先验信念(也称作先验频率或虚拟频率)添加至一频率。根据这种方法,可以避免过多的学习。然而,当分析者没有先验知识或需要进行客观的分析时,难以量化地设置客观的先验信念或客观的先验频率。在S. Yang 和 K. C. Chang 所著的 “Comparison of Score Metrics for BayesianNetwork Learning”,IEEE Transactions on Systems, Man, and Cybernetics PartA, Systems and Humans, Vol. 32, No. 3,页数 419 428,2002 中,公开了在多变量贝叶斯网络结构的干扰的方面推荐特定值的方法。然而,对于S. Yang和K. C. Chang所著的“Comparison of Score Metrics for Bayesian Network Learning,,,IEEE Transactionson Systems, Man, and Cybernetics Part A, Systems and Humans, Vol. 32, No. 3,页数419^428, 2002中推荐的值,不存在理论上的基础。进一步,由于没有充分地检查数据的各种集合,因此最佳性尚不清楚。在这些参数中,在多变量的情况下存在理论的不一致。为此原因,推荐称作等效样本大小(ESS)的另一参数。根据T. Silander P. Kontkane和P. Myllymaki所著的 “On sensitivity of the map Bayesian Network structure to the equivalentsample size parameter,,, Proceedings of Conference on Uncertainty in ArtificialIntelligence,页数360 367,2007,参数的最佳值对于数据的每个集合而言相当大地改变,并且优化是困难的。在H. Steck所著的“Learning the Bayesian Networkstructure:Dirichlet prior versus data,,,Proceedings of Conference on Uncertaintyin Artificial Intelligence,页数 511 518,2008 中建议了这种优化方法。H. Steck 所著的“Learning the Bayesian Network structure:Dirichlet prior versus data,,,Proceedings of Conference on Uncertainty in Artificial Intelligence,页数51 f 518,2008将称作BDeu的贝叶斯统计的方法与称作AIC的非贝叶斯统计的方法相组合,由此缺少理论的连贯性。然而,因为精度由于小的数据量而恶化,因此难以通过使用小的数据量来执行最佳估计。进一步,因为这种方法专于多变量网络结构的估计并且由此可能不能用于一般概率函数的估计,因此一般不使用这种方法。在日本待审专利申请公开No. 2008-299524以及T. I sozaki,N. Nato和M. Ueno所著的““Data Temperature” in Minimum Free Energies for Parameter Learningof Bayesian Networks^, International Journal on Artificial IntelligenceTools, Vol. 18,No. 5,页数653 671,2009中,公开了通过使用自由能量最小化原理估计概率的方法。这种方法已知为相比于诸如贝叶斯估计之类的最大似然估计更加具有鲁棒性的方法。然而,由于在假设正依赖于数据量的函数的情况下设置温度,因此没有实现最佳。进 一步,由于存在使得最佳确定困难的参数,因此这种方法类似于贝叶斯统计。期望提供这样的技术当基于数据估计概率函数时,在不设置参数等的情况下,在自由能量最小化方面估计最佳的概率函数。根据本技术的实施例,提供了一种信息处理装置,包含第一计算单元,其基于数据计算具有最高似然的概率函数;第二计算单元,其计算统计物理学中的正则分布和正则分布的参数作为所述数据的波动;以及估计单元,其使用由第一计算单元计算出的具有最高似然的概率函数、第二估计单元计算出的波动和所述正则分布来估计概率函数。所述第一计算单元可以计算经验分布函数。可以用贝叶斯后验概率函数替代具有最高似然的概率函数。所述第二计算单元计算所述数据的波动作为与正则分布的温度对应的参数。可以使用具有最高似然的概率函数、经验分布函数、贝叶斯后验概率函数和估计出的概率函数中的至少一个计算所述数据的波动。所述数据的波动可以不包括提前设置的另一参数或者针对数据的每个集合计算出的参数。所述第二计算单元可以使用库尔贝克-莱布勒信息计算所述数据的波动。当所述第二计算单元计算所述数据的波动时,可以使用n个数据条目,并且可以通过所述估计单元基于(n-1)个数据条目计算出的概率函数、以及基于n个数据条目计算出的具有最高似然的概率函数、贝叶斯后验概率函数和经验分布函数之一来计算库尔贝克-莱布勒信息。可以用同样地基于上至j (其中0彡j彡n-1)个数据条目计算出的概率函数的几何平均值替代基于(n-1)个数据条目计算出的概率函数。当j = 0时,可以使用均匀分布函数。可以用同样地基于上至j个数据条目计算出的具有最高似然的概率函数、贝叶斯后验概率函数和经验分布函数之一的几何平均值替换基于n个数据条目计算出的具有最高似然的概率函数、贝叶斯后验概率函数和经验分布函数之一,其中n-1。可以通过使用利用以基于n个数据条目计算出的本文档来自技高网...

【技术保护点】
一种信息处理装置,包含:第一计算单元,其基于数据计算具有最高似然的概率函数;第二计算单元,其计算统计物理学中的正则分布和正则分布的参数作为所述数据的波动;以及估计单元,其使用由第一计算单元计算出的具有最高似然的概率函数、由第二估计单元计算出的波动和所述正则分布来估计概率函数。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:矶崎隆司
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1