基于无限分层和信息遗传实现多维分类集群的创建方法技术

技术编号:4082780 阅读:1702 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了互联网技术领域中的一种基于无限分层和信息遗传实现多维分类集群的创建方法,用于解决门户网站集群数据孤立、搜索复杂和缺乏扩展性的问题。该方法包括:创建多叉树;为每个网站进行编码;对网站集合进行多次划分并确定各个网站的上下级关系;每次进行网站集合划分时,设定每个网站的遗传信息设定值;保存每次进行网站集合划分后形成的多叉树结构,并将网站编码存入该多叉树结点;创建网站分类遗传信息表,存入网站编码、遗传信息设定值和网站名称;利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并存入网站基本信息表中。本发明专利技术在各个网站之间建立起数据关联性,灵活地动态增加和减少系统,为网站的扩展分层提供了保证。

【技术实现步骤摘要】

本专利技术属于互联网
,尤其涉及一种基于无限分层和信息遗传实现多维分 类集群的创建方法。
技术介绍
云计算是一种面向未来的网络应用模式。云计算是指服务的交付和使用模式,是 指通过网络以按需、易扩展的方式获得所需的服务,这种服务可以是IT和软件、互联网相 关的,也可以是任意其他的服务,它具有超大规模、巨复杂、虚拟化、可靠安全等独特功效。门户网站集群是互联网服务提供商将诸多不同用户、不同类型和不同行业的门户 网站集成在一起,统一提供软、硬件资源的服务形式,这种服务形式是用户自己可以独立地 创建和管理自己的网站。在使用本方法创建和管理门户网站集群之前,出现了如下一些问 题1、数据信息相互孤立。虽然各个网站的软、硬件资源(包括计算资源、存储资源 等)统一提供,但是每个网站独立运行,各个网站之间的数据信息相互独立,形成了网络信 息孤岛。2、数据搜索时间长、精度低。由于网站之间的信息相互孤立,缺乏相互关联,进一 步导致了数据信息搜索的时间增长和精度降低。在信息量小,网站集群规模很小时,这种缺 陷还不是很明显,但是随着信息量的不断增大以及网站集群规模的不断增加,这种缺陷就 会越来越明显。3、不能动态地增加和减少系统以实现数据信息的无限扩展。由于目前常用的门 户网站集群使用简单的超链接方式、数据链表或者简单的树状结构等组织结构组织数据信 息,这使得在数据增加到一定程度后,在这些组织结构中增加或者减少内容将变得十分困难。针对目前门户网站集群存在的不适合云计算的发展趋势的上述问题,本专利技术提供 了一种,通过构建多叉树来描述数 据结构,使数据信息具有无限扩展的能力;并建立带遗传信息的多维架构,使数据信息之间 相互关联,解决信息孤岛问题的同时,也使数据信息搜索的速度和精度得到了提高。
技术实现思路
本专利技术的目的在于,针对目前门户网站集群不适合云计算发展趋势,存储在各网 站之间数据信息相互孤立、数据搜索时间长且精度低、网站集群无法实现数据信息无限扩 展的问题,提出一种。技术方案是,一种,其特 征是所述方法包括下列步骤步骤1 创建多叉树,所述多叉树结点用于存储与网站对应的编码;步骤2 为网站集合中的每个网站进行编码;步骤3 对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站 的上下级关系;步骤4 每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值; 所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定 值;步骤5 每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一 棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树步骤6 创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传 信息设定值和网站的名称存入所述网站分类遗传信息表;步骤7 利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所 述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。所述多叉树为hm树,所述hm树的创建过程是步骤A 初始化,设置进化代数计数器t = 0,设置最大进化代数T,随机生成M个 个体作为初始群体P(0);步骤B 个体评价,计算群体P(t)中各个个体的适应度;步骤C 选择运算,将选择算子作用于群体。选择的目的是把优化的个体直接遗传 到下一代。选择操作是建立在群体中个体的适应度评估基础上的。群体P(t)经过选择运 算之后得到下一代群体P(tl);步骤D 终止条件判断,若t = T,则以进化过程中所得到的具有最大适应度个体作 为最优解输出,终止计算。所述为网站集合中的每个网站进行编码后,每个网站的编码各不相同。所述对网站集合进行多次划分的次数大于等于1次。所述网站集合在所述创建方法完成后,增加网站包括下列步骤步骤11 为待增加的网站进行编码;步骤12 确定待增加的网站在每次进行网站集合划分后的上级网站,并根据各个 上级网站的遗传信息设定值,设定待增加的网站的遗传信息设定值;步骤13 在每次网站集合划分后形成的多叉树结构中,找到待增加的网站的上 级网站对应的结点,并在该结点下增加结点,将待增加的网站编码存储到所述增加的结点 中;步骤14 将待增加的网站编码、待增加的网站的遗传信息设定值和待增加的网站 名称存入网站分类遗传信息表;步骤15 利用导入程序将待增加的网站的遗传信息设定值写入到入口地址中,并 将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。所述网站集合在所述创建方法完成后,删除网站包括下列步骤步骤21 判断待删除的网站在多叉树结构中是否是叶子结点,如果是,则执行步 骤22 ;否则,删除的网站在多叉树结构中是树枝结点,此时执行步骤23 ;步骤22 直接在多叉树结构中删除该叶子结点,并在网站分类遗传信息表中,删 除所述待删除的网站的编码、遗传信息设定值、入口地址;5步骤23 在多叉树结构中,将待删除的网站的下级网站所对应的结点连接到待删 除的网站的上级网站所对应的结点,然后删除待删除的网站对应的结点; 步骤24 在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设 定值和入口地址。本专利技术基于无限分层和信息遗传实现多维分类集群的创建,网站集合通过多次划 分,形成多维结构,便于网站的快速定位;带遗传信息的多叉树结构在各个网站之间的建立 起数据关联性,既便于数据的搜索,又为网站的扩展分层提供了保证。附图说明图1是本专利技术提供的方法流程图;图2是按地域对网站集合进行划分确立各个网站上下级关系后形成的多叉树树 型结构示意图;图3是按行业对网站集合进行划分确立各个网站上下级关系后形成的多叉树树 型结构示意图;图4是按栏目对网站集合进行划分确立各个网站上下级关系后形成的多叉树树 型结构示意图;图5是按地域对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关 系表;图6是按行业对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关 系表;图7是按栏目对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关 系表;图8是网站分类遗传信息表结构图;图9是存入了网站入口地址的网站分类遗传信息表结构图;图10是按本专利技术实施例提供的三种方式对网站集合划分后的三维空间定位示意 图;图11是网站集合无限分层可扩展示意图。 具体实施例方式下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性 的,而不是为了限制本专利技术的范围及其应用。目前的门户网站集群的数据信息组织结构主要以超链接方式和数据链表方式。超 链接方式数据之间没有任何关系,组织随意。数据链表方式只能体现数据之间的位置关系, 即提取相邻的数据没有问题,但是不相邻的数据提取就显得无能为力了。一些大型的门户 网站集群使用的树的结构进行数据组织,这种组织结构的一大进步在于,使所有数据能够 按照一定的规律排列,使所有数据呈现出“树”的相互关系,因此对不相邻的数据的提取通 过对树或者子树的遍历即可实现。但是,目前采用的这种树结构还有个问题,那就是树节点 存储的是网站对象,这种存储方式造成数据提取要遍历整个树形结构,并且在数据不断增 加时,遍历速度急剧下降。图1是本专利技术提供的方法流程图。图1中,本专利技术针对上述门户网站集群存在的 问题,本文档来自技高网
...

【技术保护点】
一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述方法包括下列步骤:步骤1:创建多叉树,所述多叉树结点用于存储与网站对应的编码;步骤2:为网站集合中的每个网站进行编码;步骤3:对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站的上下级关系;步骤4:每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值;所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定值;步骤5:每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树结点;步骤6:创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传信息设定值和网站的名称存入所述网站分类遗传信息表;步骤7:利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。

【技术特征摘要】
一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述方法包括下列步骤步骤1创建多叉树,所述多叉树结点用于存储与网站对应的编码;步骤2为网站集合中的每个网站进行编码;步骤3对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站的上下级关系;步骤4每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值;所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定值;步骤5每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树结点;步骤6创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传信息设定值和网站的名称存入所述网站分类遗传信息表;步骤7利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。2.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方 法,其特征是所述多叉树为hm树,所述hm树的创建过程是步骤A 初始化,设置进化代数计数器t = 0,设置最大进化代数T,随机生成M个个体 作为初始群体P(O);步骤B:个体评价,计算群体P (t)中各个个体的适应度;步骤C 选择运算,将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下 一代。选择操作是建立在群体中个体的适应度评估基础上的。群体P(t)经过选择运算之 后得到下一代群体P (tl);步骤D 终止条件判断,若t = T,则以进化过程中所得到的具有最大适应度个体作为最 优解输出,终止计算。3.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方 法,其特征是所述为网站集合中的每个网站进...

【专利技术属性】
技术研发人员:郑世宝
申请(专利权)人:北京鸿蒙网科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1