用于对图数据流中的对象分类的方法技术

技术编号：8886470 阅读：193 留言：0更新日期：2013-07-05 03:20

一种用于分类图数据流中的对象的方法，其包括：接收图数据的训练流（210），该训练流包括多个对象连同与这些对象中的每一个相关联的类别标签；第一判定该训练流中用于所述类别标签的辨别性边集合（220），其中一辨别性边集合为指示含有这些边的具有一给定类别标签的对象的边集合；接收该图数据的传入数据流（230），其中尚未将类别标签指派给该传入数据流中的对象；基于该辨别性边集合第二判定与该传入数据流中的对象相关联的类别标签（240）；以及基于该第二判定将对象类别标签对输出至信息储存库（250）。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及大规模图流(graph stream)的分类。
技术介绍
在机器学习中，分类是将类别标签指派给输入对象。分类发生于若干领域(诸如，化学及生物数据、web及通信网路)的情境下。作为示例，web查询主题分类/归类涉及基于查询的主题将web搜寻查询(例如，输入对象)指派给一个或多个预定义的类别(例如，类别标签)。举例而言，发出web查询“苹果”的用户可能期望看到与水果苹果相关的网页，或其可能更愿意看到与该计算机公司相关的产品或新闻。可根据由一查询分类算法预测的种类来对搜寻结果页进行分组。许多数据域(诸如，化学数据、生物数据及web)被结构化为图。在化学及生物领域中，可从适度的概率库取得图的节点，且假定数据集具有适度的大小。另一方面，可在大规模的基础节点全域上定义web图、通信网络及社交网络。具有IO7以上的节点的图可含有多达IO13个边，且由此被视为大规模的。这些节点可对应于web图中的URL地址、通信网络中的IP地址或社交网络中的用户标识符。这些URL地址、IP地址及用户标识符之间的连结为边。在流传输应用中，将在某一外部环境中产生的数据异步地推送至处理此信息的服务器。流传输应用的特征为以及时及响应的方式处理高容量数据流的能力。大规模图流可包括用户在社交网络中的通信模式(pattern)、所有用户的浏览模式或通信网络上的侵入通信流(traf f i c )。当大规模图呈流形式时，这限制了可用以挖掘结构信息以用于未来分析的算法的种类。举例而言，流约束仅允许在数据上执行一遍。此外，图的边可能在数据流中无序地到达。图的大规模尺寸也对有效提取与分类相关的...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：C·阿加瓦尔，
申请(专利权)人：国际商业机器公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人