Information processing equipment and information processing method. An information processing apparatus includes: a unit for obtaining input data representing attributes of each object in an object; a generating unit for generating a bisection network comprising objects and attributes included in the input data as nodes, and in the bisection network, with the object. A node corresponding to each object is connected to a node corresponding to the attribute of the object via a link; and a clustering unit that performs clustering of the node groups by performing iterative computation of a random process of transfer between the nodes via a link in the sub-network.
【技术实现步骤摘要】
信息处理设备和信息处理方法
本专利技术涉及一种信息处理设备和一种信息处理方法。
技术介绍
通常的做法是从关于对象(分析目标)的原始数据机械地提取该对象的属性值,并使用一组属性值作为表示对象的特征的特征表示。例如,作为文档的特征表示,使用表示该文档中的每个词的出现频率的向量。这是一种众所周知的做法。通常使用执行从原始数据获取的对象的特征表示的聚类(clustering)的分析技术。在根据现有技术的聚类技术中,通常,将从对象的原始数据获取的特征表示视为向量,并且基于向量空间中的特征表示向量之间的距离来执行聚类。在日本特开第2013-168127号、第2016-029526号和第2016-218531号公报中,本专利技术人提出了一种用于基于“马尔可夫链的模块化分解”从网络检测重叠和分层群集(cluster)结构的方法。在基于马尔可夫链的模块化分解的聚类计算(提取社团)中,使用其中网络的每个节点的概率经由一个链路转移(随机游走)到另一个链路的模型,重复计算每个节点的概率的变化,并且基于达到稳定状态时的信息来确定每个节点所属的群集。在基于特征表示的向量之间的距离的聚类中,即使向量中包括的分量(即,属性)有关系,该关系也不反映在聚类中。因此,通过基于向量的聚类,不可能准确地执行对象的聚类。假设示例情况:将个人过去购买的食物列表用作个人的特征表示的向量以执行聚类。甚至在存在喜欢水果并购买比其它食物更多数量的水果的两个人的情况下,如果两个人中的一个人购买的水果与另一个人购买的水果完全不同,那么这两个人可能不会被归类到与水果爱好者相同的群集中,而是可能被归类到单独群集中。专 ...
【技术保护点】
1.一种信息处理设备,所述信息处理设备包括:获取输入数据的单元,所述输入数据表示对象中的每个对象的属性;生成单元,所述生成单元生成二分网络,所述二分网络包括作为节点包括在所述输入数据中的对象和属性,并且在所述二分网络中,与所述对象中的每个对象对应的节点经由链路连接到与所述对象的所述属性对应的节点;以及聚类单元,所述聚类单元通过执行在所述二分网络中经由所述链路在所述节点之间的转移的随机过程的迭代计算,来执行所述节点的组的聚类。
【技术特征摘要】
2017.02.27 JP 2017-0348881.一种信息处理设备,所述信息处理设备包括:获取输入数据的单元,所述输入数据表示对象中的每个对象的属性;生成单元,所述生成单元生成二分网络,所述二分网络包括作为节点包括在所述输入数据中的对象和属性,并且在所述二分网络中,与所述对象中的每个对象对应的节点经由链路连接到与所述对象的所述属性对应的节点;以及聚类单元,所述聚类单元通过执行在所述二分网络中经由所述链路在所述节点之间的转移的随机过程的迭代计算,来执行所述节点的组的聚类。2.根据权利要求1所述的信息处理设备,所述信息处理设备还包括:对象特征生成单元,所述对象特征生成单元通过使用由所述聚类单元执行的聚类的结果,针对所述对象中的每个对象生成表示聚类观点下的所述对象的特征的对象群集特征数据。3.根据权利要求1或2所述的信息处理设备,所述信息处理设备还包括:属性特征生成单元,所述属性特征生成单元通过使用由所述聚类单元执行的聚类的结果,针对所述属性中的每个属性生成表示聚类观点下的所述属性的特征的属性群集特征数据。4.根据权利要求3所述的信息处理设备,所...
【专利技术属性】
技术研发人员:邱旭乐,冈本洋,
申请(专利权)人:富士施乐株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。