【技术实现步骤摘要】
【国外来华专利技术】PU分类装置、PU分类方法以及PU分类程序
[0001]本专利技术涉及PU分类装置、PU分类方法以及PU分类程序。
技术介绍
[0002]以往,提出了根据正事例集合和正负未知的事例集合来对分离未知事例所包括的正事例和负事例的分类器进行学习的PU分类手法(Classification of Positive and Unlabeled Examples:正事例和未标记事例的分类)。
[0003]现有技术文献
[0004]非专利文献
[0005]非专利文献1:Elkan,C.and Noto,K."Learning classifiers from only positive and unlabeled data,"in Proc.KDD08:the 14th ACM SIGKDD Int.Conf.on Knowledge Discovery and Data Mining,pp.213
‑
220(2008)
[0006]非专利文献2:Ward,G.,Hastie,T.,Bar ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种PU分类装置,具备:分类器,在给出了分类对象的事例的情况下,使用判定不等式将分类对象的事例最大似然分类为正事例或负事例,所述判定不等式对所述事例作为正事例从学习用总体分布中被抽样的第一概率与所述事例从所述学习用总体分布中被抽样的第二概率的大小关系进行判定;以及学习部,根据从所述学习用总体分布中被抽样的正事例的集合来估计所述第一概率的分布函数,根据从所述学习用总体分布中被抽样的正负未知的事例的集合来估计所述第二概率的分布函数,由此对所述分类器进行学习,其中,使用由所述学习部进行了学习的所述分类器,将分类对象的事例分类为正事例或负事例。2.根据权利要求1所述的PU分类装置,其中,所述学习部基于从所述学习用总体分布中被抽样的正事例的集合和从所述学习用总体分布中被抽样的正负未知的事例的集合双方,估计所述第一概率的分布函数。3.根据权利要求2所述的PU分类装置,其中,所述学习部通过核密度估计来估计所述第一概率的分布函数,所述核密度估计使用了核密度和针对所述核密度的权重。4.根据权利要求1至3中任一项所述的PU分类装置,其中,所述分类器在通过所述判定不等式判定为所述第一概率大于所述第二概率的情况下,将分类对象的事例分类为正事例,在通过所述判定不等式判定为所述第一概率小于所述第二概率的情况下,将分类...
【专利技术属性】
技术研发人员:鹫尾隆,谷口正辉,大城敬人,吉田刚,
申请(专利权)人:艾珀尔有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。