当前位置: 首页 > 专利查询>王纤巧专利>正文

动态分类目录制造技术

技术编号:2885286 阅读:194 留言:0更新日期:2012-04-11 18:40
动态分类目录,一种信息检索的方法。根据信息与对信息进行描述的关键字之间,关键字与关键字之间的相关性及相关比率,对信息进行动态分类。本发明专利技术开创地提出了动态分类目录这一技术,从检索用户的习惯出发,不主观的对信息进行分类。本发明专利技术结合了搜索引擎和分类目录的优点,与传统的层次型分类方法互为补充,必将成为一种重要的信息检索方法。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于信息检索的方法,具体地说,是通过动态分类目录在万维上检索信息的方法。21世纪,以电脑为工具,以网络为载体的信息技术得到了突飞猛进的发展。信息革命的重要组成部分——互联网更是爆炸式的发展。网站数以千万计,风页数以十亿、几十亿计,而各门各类的相关信息则是无以计数的。如何在浩如烟海的网站中,找到所需的信息,成为了首要解决的问题。目前在万维网上主要的信息检索方式有两种,搜索引挚和分类目录。搜索引挚是互联网上最重要的专利技术之一,然而目前的搜索技术不能实现精确查找。其中最主要的原因就是,无法确定搜索关键字的标准化。如同为生产电视机的两个厂家,一个登记的搜索关键字是“彩色电视机”,另一个登记的是“彩电”,当用户搜索“彩电”时,就会错过搜索关键字为“彩色电视机”的网站。为此生产电视机的厂家,不得不登记多个关键字,如“电视”、“电视机”等等,以保证能够被搜索到。使用分类目录技术,可以解决这一问题,所有生产电视机的厂家只需登记在生产厂家家用电器电视机目录下。搜索引挚存在的另一个问题是,搜索关键字的岐义性。如搜索“java”,搜索的结果就包括java语言、java群岛,以及java咖啡等不同信息。为解决这一问题,就不得不对搜索关键字使用限制条件,当然使用分类目录也能解决之一问题。为使搜索结果准确的包括所有符合查询条件的信息,各搜索引挚采用了许多先进的优化技术,应该承认,一种智能化的搜索引挚必将成为人们检索信息的重要途径之一。信息检索的另一个重要方式是分类目录。分类目录与搜索引挚互为补充,各有利弊。搜索引挚是动态的,对信息的描述是自由的、客观的,而分类目录是静态的,人为的对信息进行分类,是主观的。所以分类目录也面临着分类的标准化、客观化这一问题。各个分类目录没有形成统一规范的标准,在信息的检索上产生了一定的混乱。如雅虎将“休闲”与“运动”合并成一个大类,而搜狐则把“休闲”与“娱乐”分成一类。产生这一问题的根本原因就是目前所有的分类目录都是层次型的。层次型分类目录在很多领域都取得了成功,成为了标准,并有相应的法律法规、行业标准保证其规范性、专业性。如对图书的划分,对商品货物的划分等等。然而互联网上包含了各门各类、各行各业的信息,难以进行有效的规范划分。如“糖”在商店里仅仅表示一类食品,而在万维网的信息库中,就有可能是一本书。传统的层次型分类目录存在的另一个问题是,有时对信息进行描述的关键字并不存在严格的从属性,无法进行准确地划分,如北京的一家旅游公司,是分在北京公司旅游目录下,这是分在旅游公司北京目录下?为解决这一问题,本专利技术开创地提出了动态分类目录这一技术。本专利技术的目的在于,提供一种根据信息与对信息进行描述的关键字之间,关键字与关键字之间的相关性及相关比率,对信息进行动态分类的方法。为实现上述目的,具体说明如下一、相关性本专利技术认为信息对其进行描述的关键字之间是相关关系,不存在从属关系;对同一信息进行描述的关键字之间是相关关系,不存在从属关系。关键字与关键字之间相互独立,可任意改变其排列顺序和书写位置。这是与传统的层次型分类目录的根本区别。如传统的层次型分类目录将与猫有关的信息分在动物哺乳动物猫科动物猫目录下,而本专利技术认为“动物”、“哺乳动物”、“猫科动物”、“猫”之间并没有从属关系,她们都是对与猫有关的信息的描述。用户可直接检索“猫”,那么与“猫”相关的关键字就有可能有,“宠物”、“调制解调器”、“商标”、“哺乳动物”、“动物”等等。用户可再次检索“哺乳动物”,那么就可以排除不同时与“哺乳动物”相关的关键字“调制解调器”、“商标”等关键字和信息,从而缩小了检索范围,得到同时与“猫”和“哺乳动物”相关的关键字和信息。二、相关比率显然与猫有关的信息与“动物”的相关性大一些,而与“玩具”、“调制解调器”、“商标”等关键字的相关性就小一些。本专利技术是通过以下公式来确定,信息与对其进行描述的某关键字之间,关键字与关键字之间的相关比率的。信息与对其进行描述的某关键字之间的相关比率是指,所有用户通过该关键字检索到该信息的次数与通过该关键字检索到所有相关信息次数总和之间的相关比率。关键字与另一关键字之间的相关比率是指,所有用户通过另一关键字检索到该关键字的次数与通过另一关键字检索到所有与之相关的关键字次数总和之间的比率。假设与“猫”相关的关键字只有4个“玩具”、“调制解调器”、“商标”、“宠物”。共有100个用户检索“猫”这一关键字,其中有40个用户通过“猫”检索到“宠物”,30个用户检索到“调制解调器”,20个检索到“商标”,10个检索到“玩具”。那么“宠物”、“调制解调器”、“商标”、“玩具”、与“猫”的相关比率分别就是40%、30%、20%、10%。三、检索用户检索某一关键字时,动态分类目录将与该关键字相关的关键字和信息,按照与其的相关比率由高到低的顺序提供给检索用户。如两个同为提供搜索引挚和分类目录服务的网站。一个用户检索“搜索引挚”,时,所被链接到的次数比另一个网站多,那么她在“搜索引挚”目录下的排名就较靠前。另一个分类目录做的比较好,被通过“分类目录”所链接到的次数比另一个网站多,那么她在“分类目录”下的排名,就高于另一网站。当用户依次使用两个或两个以上关键字检索信息时,动态分类目录将与用户所使用的关键字同时相关的关键字和信息,按照与用户依次所用最后一个关键字之间的相关比率,按照由高到低的顺序提供给检索用户。如用户依次检索“电影”、“泰坦尼克号”,那么动态分类目录将与“电影”、“泰坦尼克号”同时相关的网页,按照与“泰坦尼克号”之间的相关比率,按照由高到低的顺序提供给检索用户。当用户同时使用两个或两个以上关键字检索信息时,动态分类目录将与用户所使用的关键字同时相关的关键字和信息,按照分别与用户同时所用的所有关键字之间的相关比率的平均值,按照由高到低的顺序提供给检索用户。如用户同时检索“流行音乐”和“排行榜”,那么动态分类目录将同时与“流行音乐”和“排行榜”相关的信息,按照分别与“流行音乐”和“排行榜”之间的相关比率的平均值,按照由高到低的顺序提供给检索用户。传统的分类目录和搜索引挚,采用层次型分类方法对信息进行划分,由提供分类目录或搜索引挚服务的服务方,制定层次结构,并将信息和对信息进行描述的关键字,编录在此结构下,这样大大地限制了用户检索数据的灵活性。虽然有相应的法律法规或行业标准,但各个分类目录和搜索引挚在定制信息的层次结构时,往往主观化,加之信息分类的复杂性,不能形成一套规范有效的标准,加大了信息检索的难度。本专利技术开创地提出了动态分类目录这一技术,从检索用户的习惯出发,不主观的对信息进行分类,根据信息与对信息进行描述的关键字之间,关键字与关键字之间的相关性和相关比率,对信息进行动态分类。本专利技术结合了搜索引挚和分类目录的优点,与传统的层次型分类方法互为补充,必将成为一种重要的信息检索方法。权利要求1.一种信息检索的方法,其特征在于,根据信息与对信息进行描述的关键字之间,关键字与关键之间的相关性及相关比率,对信息进行动态分类。2.如权利要求1所述的方法,其特征在于,对信息进行描述的关键字与其所描述的信息之间,是相关关系,不存在从属关系。3.如权利要求1所述的方法,其特征在于,对同一信息进行描述的关键本文档来自技高网...

【技术保护点】
一种信息检索的方法,其特征在于,根据信息与对信息进行描述的关键字之间,关键字与关键之间的相关性及相关比率,对信息进行动态分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:王纤巧
申请(专利权)人:王纤巧
类型:发明
国别省市:12[中国|天津]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1