当前位置: 首页 > 专利查询>刘二中专利>正文

对文件类别判定信息的便捷输入和处理方法技术

技术编号:4143420 阅读:212 留言:0更新日期:2012-04-11 18:40
本发明专利技术为一种计算机执行的关于网络终端用户对文件类别判定信息的输入和处理方法,包括:操作A:计算机检索系统向用户终端提供以多个网站来源的包含该查询词内容的多个文件形成的题录序列;在该序列所在页面或直接链接的页面,具有划类目录;操作B:计算机系统根据所述题录序列所在页面或题录链接文件所在页面所受的选择点击确定划类对象;根据划类目录中受到选择点击的类别条目确定划类对象的类别,接收用户判定信息。本发明专利技术可以进而形成精确的网页分类数据库或分类索引,进而形成更好的搜索引擎并且更为便捷地提供更为精炼的搜索结果。

【技术实现步骤摘要】

本技术属于计算机检索技术或搜索引擎技术。
技术介绍
数十年来,计算机数据库检索技术有了极大发展,特别是万维网等网络技术的 进展,使得人们可以共享的数据库的规模达到了天文数字。这也给人们查找所需信息带 来了很大困难。以关键词搜索为核心的搜索引擎技术为用户带来了便利。该系统可以通过客户 机上的交互界面以及通讯网络或通讯线路得到查询者的关键词查询请求,在文本索引库 或文本库中进行查询,并进行关键词请求与文本的相关性分析,得到相关结果并排序, 再经由通讯网络或线路提供到交互界面。这种搜索系统使用起来十分便利迅速,但返还 结果包含的索引总数仍然十分庞大,难于逐一查阅。 为了能将潜在的对查询者最有价值的查询结果尽量排在前面以方便查询者,第 6,285,999号美国专利提出了基于网页超级链接结构分析(佩奇链接)来进行搜索结果排序 的技术,超过了其他排序技术,被Google公司采用,获得空前成功。 然而,该技术以及其他各种排序技术,仅仅是在统计学意义上提高了关键词搜 索的效率,并不能保证每个人希望的查询结果都能排在庞大索引表的前面。例如,我们 利用谷歌中文网站搜索布林 一词,可以得到数十万条索引。我们仍然不能保 证可以无一遗漏地在靠前的位置上查阅到期望的内容,做到既严密又比较方便。同时, 我们在读到期望的信息之前,却无奈地读到种种主要内容一再重复的无关信息。 为了方便用户找到所需信息或文件,人们还求助于垂直分类技术和以该技术为 基础的目录检索系统。为了给海量信息分类,出现了各种计算机文本分类方法,例如第 6990628号美国专利有关测量电子文本相似性的技术,但效果十分有限。因为由机 器判断某一页面或文本属于某关键词的哪一条或哪几条的语义或类别是十分困难的,其 可靠性不高,其准确率不高,特别是在多级分类中,错误率高得令人无法忍受。因此, 计算机分类仅仅用于最简单的粗略分类,例如根据若干组词出现的频度或格式特征,判 定网上文件是网页还是地图或是MP3等等。 目前,准确率较高的垂直分类技术还离不开人工参与。例如20世纪90年代雅 虎等网站的人工信息分类系统,只能承担极少一部分网上信息的分类加工。其它如百 度百科、维基百科、淘宝网、阿里巴巴的各种数量十分有限的专业分类信 息,都是通过各自专门的数据库平台,由注册会员或注册用户或网站工作人员针对特定 范围的词条,按照特殊的编写规则汇集而成的,其中包含的附带分类内容也只能是针对 本数据库的词条或文本的。可以说,对于非特定网上数据库内容的用户来说,在搜索时 得到的帮助十分有限。 因此多年以来,国内外广大网民迫切需要一种新技术,使得计算机检索系统或 搜索引擎系统不仅能向查询者提供数万不同网站的亿万网页题录信息,还能确定众多不同网站来源网页的准确分类或多级准确分类,并按查询者的查询关键词要求和对网页多 级准确类别的要求,提供准确率和集中度大为改善的搜索结果。为此,急需一种便于汇 集和处理关于网页分类判断准确结果的便捷技术。
技术实现思路
本专利技术的目的在于提供一种适于计算机检索系统或搜索引擎系统使用的方法, 使其在向网上终端或用户提供关于查询词搜索结果的题录序列的同时,可以允许便捷地 输入用户或工作人员对任一网站来源的相关文件类别的判断或选择,并对输入信息进行 处理,以便产生便于用户利用的包含准确分类结果或检索工具,大大提高检索的效率。 本专利技术为一种计算机执行的关于网络终端用户对文件类别判定信息的输入和处 理方法,包括 操作A:计算机检索系统根据网络用户提出的查询词,向用户终端提供以多个网站来源的包含该查询词内容的多个文件形成的题录为全部或部分成员的序列; 在该序列至少部分所在页面,或者该序列所在页面直接链接的页面,具有划类目录或链接划类目录的标示(点击该标示将显示划类目录)。 其中,所述划类目录包含有多个供选择的类别条目。 所述该序列所在页面直接链接的页面,可以是指该序列所在页面上的内容或题录或字符或标示直接链接的页面。 本方法还包括 操作B :计算机系统根据所述题录序列所在页面或题录链接的文件所在页面所 受的选择点击,确定被选择作为划类对象的题录或文件,或者说确定哪个题录或文件为 划类对象;根据受到选择点击的类别条目确定划类对象被划归的类别。 其中,被确定为划类对象的可以是受到选择点击的题录或文件,也可以是受到 点击的划类操作标示附近的题录或文件,也可以是在受到点击的划类目录所在的页面上 唯一的或距离该划类目录最近的文件。 在操作B中,可以根据需要规定确定划类对象的点击与确定类别的点击的应该 遵循的先后次序。 所述的划类目录可以与划类操作标示链接,即划类目录可以在划类操作标示受 到点击后显示。所述划类操作标示用于提示或进行检索系统的划类功能或划类操作。 所述操作A所述链接划类目录的标示可以是划类操作标示,也可以是划类目录 的标题或链接标志。 在需要时可以认为,某个题录的划类或分类与该题录所属文件相同或相似。 显然,操作B确定的分类,就是终端点击操作者输入的对相关题录或文件的划 类信息。 操作B还可以包括相关计算机系统在其数据库里,可以接受或参考或处理或 拒绝所输入的划类判定意见。 在以上所述方法中,所述的计算机检索系统可以是搜索引擎系统。所述计算机 系统或检索系统可以为计算机检索系统的组成部分。 所述用户可以是网民或网页的作者或网页的提供者,或者网络或检索系统工作5人员。所述查询词可以是关键词。所述包含该查询词内容可以是指包含该关键词的全部内容或部分内容。 所述题录可以是文件的标题或摘要或标题加摘要。 所述文件可以是网页或者网页的部分内容或者是检索系统或其它计算机系统转存内容(如网页快照),可以是或包含文字内容,也可以是或包含图象内容或音频内容或视频内容。 所述具有划类目录可以是指划类目录预先位于所述页面上,或者可以是指在点击或链接操作后呈现于所述页面上。 所述划类目录可以分布于整幅页面或多幅页面或局部页面。 所述划类目录可以是一级目录或多级目录或树状目录。 可以安排在所述划类目录中,上一级类别条目受到点击之前或之后可自动显示其所属下一级类别条目。 在以上所述方法中,允许同一文件或其题录可以同时属于或被划归为不同的类别。 所述划类目录可以与原来题录序列附近的导航择类目录序列相互转化。例如在保留类别条目主要内容的情况下,改变目录标题。 本专利技术的输入和处理方法,还可以包括所述计算机系统在操作B中输入或确定任一题录或文件的类别时,需要遵循的原则可以至少考虑以下因素中的一个或多个 (l)作出点击选择的用户的名称或其网站的网址与该文件的提供者的名称或其网址或者文件链接网址的相似程度; (2)作出同样点击选择的用户的数量; (3)作出某种点击选择的时间早晚; (4)作出点击选择的用户或出自同一网址以往点击选择的准确率或评分; (5)该种类别选择与其它人工分类方法或计算机分类方法或分类系统结果的一致程度; (6)是否为检索系统操作人员或工作人员所作分类选择或与其相似。 (7)作出点击选择的用户或终端是否在相关分类网站或网页登记。 本专利技术的方法还可以包含操作d :检索系统全部或部分根据操作B对多个文件确定类别的结果生成包含多个文件类别内容的数据库。 本专利技术的方法还可本文档来自技高网
...

【技术保护点】
一种计算机执行的关于网络终端用户对文件类别判定信息的输入和处理方法,包括:  操作A:计算机检索系统根据网络用户提出的查询词,向用户终端提供以多个网站来源的包含该查询词内容的多个文件形成的题录为全部或部分成员的序列;  在该序列至少部分所在页面,或者该序列所在页面直接链接的页面,具有划类目录或链接划类目录的标示;  其中,所述划类目录包含有多个供选择的类别条目。  操作B:计算机系统根据所述题录序列所在页面或题录链接文件所在页面所受的选择点击,确定被选择作为划类对象的题录或文件;  根据受到选择点击的类别条目确定划类对象被划归的类别。

【技术特征摘要】
一种计算机执行的关于网络终端用户对文件类别判定信息的输入和处理方法,包括操作A计算机检索系统根据网络用户提出的查询词,向用户终端提供以多个网站来源的包含该查询词内容的多个文件形成的题录为全部或部分成员的序列;在该序列至少部分所在页面,或者该序列所在页面直接链接的页面,具有划类目录或链接划类目录的标示;其中,所述划类目录包含有多个供选择的类别条目。操作B计算机系统根据所述题录序列所在页面或题录链接文件所在页面所受的选择点击,确定被选择作为划类对象的题录或文件;根据受到选择点击的类别条目确定划类对象被划归的类别。2. 按照权利要求1所述的输入和处理方法,还包括所述计算机系统在操作B中确定任一题录或文件的类别时,需要遵循的原则至少考 虑以下因素中的一个或多个(1) 作出点击选择的用户的名称或其网站的网址与该文件的提供者的名称或其网址或 者文件链接网址的相似程度;(2) 作出同样点击选择的用户的数量;(3) 作出某种点击选择的时间早晚;(4) 作出点击选择的用户或出自同一网址以往点击选择的准确率或评分;(5) 该种类别选择与其它人工分类方法或计算机分类方法或分类系统结果的一致程度;(6) 是否为检索系统操作人员或工作人员所作分类选择或与其相似。(7) 作出点击选择的用户是否在相关分类网站或网页登记。3. 按照权利要求1或2所述的输入和处理方法,还包括操作C。检索系统全部或部 分根据权利要求1或2所述方法对多个文件确定类别的结果,生成包含多个文件类别内容 的数据库。4. 按照权利要求1或2所述的输入和处理方法,包括操作(^:检索系统全部或部分 根据操作B对多个文件确定类别的结果或操作&生成的包含多个文件类别内容的数据库 生成多个文...

【专利技术属性】
技术研发人员:刘二中
申请(专利权)人:刘二中
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1