数据分类系统与其分类树的建构方法技术方案

技术编号:3779179 阅读:293 留言:0更新日期:2012-04-11 18:40
一种数据分类系统,其包括撷取单元、分类树模块与数据存储库。撷取单元用以接收至少一数据,并撷取出上述数据中的数据信息。分类树模块用以依据数据信息,且以树状结构的方式对上述数据进行分类,并建立一分类树。数据存储库用以存储分类树与上述数据。藉此,可提供阶层式结构,以加快数据的搜寻速度。

【技术实现步骤摘要】

本专利技术涉及一种数据分类方法,且特别是涉及一种数据分类系统与其分 类树的建构方法。
技术介绍
随着宽带网络服务与数字相机产品的普及化,使得愈来愈多人乐于将数 字相片(数据)上传至因特网保存以及与他人分享,而在网站上分享数字相片 的行为与环境也愈来愈成熟。不过,在数字相片数量日渐成长的情况下,如 何有效率的管理、浏览与搜寻相片的工作,也变得愈来愈重要。另外,由于科技的发展,现有数字相片除了可以存储图像信息外,还可以结合全5求定位系统(Global Positioning System, GPS),以耳又得相片拍才聂 (数据建立时间)时的地理位置信息(坐标信息,例如经度与绵度)。就目前来 说,有一些相关的应用网站,如Google Earth与Yahoo map等,则是利用 相片的地理位置信息,将相片放置在地图的适当位置上,方便使用者在察看 地图时,也可观看特定地点所拍摄出来的相片。因此,如何有效的将相片依 其地理位置分类,提高使用相片地理位置信息的相关应用的相片存取效率, 是一个相当重要的关键。为了达到可依地理位置信息浏览相片的目的,在美国专利公告号 US7,046, 285专利案中,提出了为所有相片建立一个描述表格(table),如图 1所示。其中,表格内每一列表示一张相片的相关描述信息,亦即记录了相 片的经度、绵度、相片种类以及文件名称。在使用上述表格的状态下,应用 程序可将相片显示在地图上适当的位置上。虽然,使用表格方式存储相片信息相当简单,但是相片的存放与相片之 间的距离无关,因此上述方式并无法有效率的取得相邻位置的相片,并且当 相片数量成长时,搜寻时间也会跟着成长。
技术实现思路
7本专利技术提供一种,藉此可以提供一 阶层式结构,以便加快数据搜寻的速度,并且具备数据集成的能力。本专利技术提出一种数据分类系统,其包括撷取单元、分类树模块与数据存 储库。撷取单元用以接收至少一数据,并撷取出上述数据中的数据信息。分 类树模块用以依据数据信息,且以树状结构的方式对上述数据进行分类,并 建立一分类树。数据存储库用以存储分类树与上述数据。本专利技术提出一种分类树的建构方法,包括下列步骤取得至少一数据,其中,每一数据对应一坐标信息。将上述每一数据加入一节点。依据上述每 一数据对应的坐标信息,计算出节点的一中心位置。计算出每一数据的坐标 信息到中心位置的距离,以取得一距离最大值。判断上述距离最大值是否大 于一特定值。若判断结果为是,则将节点分为第一子节点与第二子节点,并 依照每一数据对应的坐标信息,将数据加入至第一子节点与第二子节点其中之一。本专利技术依据数据内所记录的坐标信息,并利用树状结构(二元树)的方式 进行分类,以建立一分类树。也就是说,节点内的数据可依数据的坐标信息 分成两群,并分别置在两个子节点内。同样的,每个子节点内的数据可依据 数据的坐标信息再分成两群,直到每个子节点内只包含一个数据或子节点内 的每个数据距节点中心位置的距离小于一特定值。如此一来,在分类树建构 完成之后,可以有效地提供阶层式结构,且对于依坐标信息提供数据浏览与 搜寻数据的应用,可提供较佳的存取效率,以及加快数据搜寻速度。另外, 本专利技术还可以通过数据的数据信息,提供搜寻特定条件的数据。为让本专利技术的上述特征和优点能更明显易懂,下文特举较佳实施例,并 配合附图,作详细说明如下。附图说明图1示出了现有技术的描述表格的示意图。图2示出了本专利技术一实施例的数据分类系统的示意图。图3A示出了数据的数据信息内容示意图。图3B示出了数据的种类内容示意图。图3C示出了节点内所包括的信息内容示意图。图4示出了节点与节点内数据配置关系的示意图。8图5示出了本专利技术一实施例的分类树的建构方法流程图。图6示出了判断数据中的距离的最大值大于特定值,将节点分为第一子节点与第二子节点的示意图图7示出了本专利技术另一实施例的分类树的建构方法流程图。图8示出了本专利技术一实施例的分类树的示意图。图9A-图9C为节点放入工作堆栈的示意图。图10示出了本专利技术又 一 实施例的分类树的建构方法流程图。图11示出了本专利技术一实施例的数据加入分类树的示意图。图12示出了本专利技术实施例的分类树应用的一实施范例。图13示出了配合图12实施范例的分类树的示意图。图14示出了本专利技术实施例的分类树应用的另一实施范例。图15示出了配合图14实施范例的分类树的示意图。图16示出了本专利技术实施例的分类树应用的又一实施范例。图17示出了本专利技术一实施例的节点内所包括的数据数量与种类的示意图。附图符号说明 200:数据分类系统 210:撷取单元 220:分类树模块 2 30:数据存储库 401、 601:中心位置 d:距离最大值420、 630、 640、 650、 660、 Dl-D4:凄丈据S5 02-S514:本专利技术实施例的分类树的建构方法各步骤Nl-N3、 N5-N30:节点610:离最大值d所包括的范围dl:特定值620:特定值dl的范围S702-S720:本专利技术另 一实施例的分类树的建构方法各步骤 S1002-S1030:本专利技术又一 实施例的分类树的建构方法各步骤 S1202-S1218:本专利技术实施例的分类树应用的实施范例各步骤S1402-S1410:本专利技术实施例的分类树应用的另 一实施范例各步骤 S1602-S1616:本专利技术实施例的分类树应用的又一实施范例各步骤。具体实施例方式图2示出了本专利技术一实施例的数据分类系统的示意图。请参照图2,数 据分类系统200包括撷取单元210、分类树模块220与数据存储库230。撷取 单元210用以接收至少一数据,并撷取出上述数据中的数据信息。其中,上 述数据可以为数字相片,但不限制其范围。分类树模块220用以依据数据信 息,且以树状结构的方式(例如为二元树)对上述数据进行分类,并建立一分 类树。数据存储库230用以存储分类树与上述数据。在本实施例中,上述数据除了可以在数据存储库230中取得,还可以经 由因特网(Internet)或是部落格(Blog)等方式取得。另外,上述数据信息可 以包括数据的坐标信息、数据的建立时间、数据的种类、数据的描述、数据 的重要性、数据的存储位置参考信息,如图3A所示。其中,数据的坐标信息 可以包括数据的经度与纟韦度,以便于作为分类树模块220进行相片分类的依 据。而上述数据的经、炜度可以通过全3求定位系统(Global Positioning System, GPS)取得。另外,数据重要性的项目例如可由管理者输入或由点阅率来决定。并且 数据的种类可以分成餐厅、旅游景点、商店、车站、机场、医院、学校、运 动场、公园、夜市等等,如图3B所示,但不限制其范围。在本实施例中,上述所建立的分类树包括多个节点,而每一节点内具有 数据距节点中心位置的距离最大值(Distance)、节点的中心位置(Center)、 节点内的数据数量(Count)、节点的重要性、节点内的数据清单、节点的描述 以及节点的子节点连结(子节点1、子节点2),如图3C所示。其中,数据距节点中心位置的距离最大值与节点的中心位置,可利用节 点内数据的坐标信息求得,如图4所示。由图4中可看出,中心位置401是 利用节点中各个数据的坐标信息(亦即经纬度)所计算出的几何中心位置。之 后,再利用所本文档来自技高网
...

【技术保护点】
一种数据分类系统,包括: 一撷取单元,用以接收至少一数据,并撷取出该数据中的数据信息; 一分类树模块,用以依据该数据信息,且以树状结构的方式对该数据进行分类,并建立一分类树;以及 一数据存储库,用以存储该分类树与该数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯世安黄崇仁廖怡钦张智堂
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1