当前位置: 首页 > 专利查询>王东专利>正文

基于关注度的同源信息搜索引擎聚合显示方法及相关系统技术方案

技术编号:2839171 阅读:200 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于关注度的同源信息搜索引擎聚合显示方法及系统。搜索引擎找到全部符合条件的目标站点作为原始搜索结果;依据内容质量、显示加权权力采购者的账户信息和服务质量等要素,将原始搜索结果聚合成一条标题搜索结果;只将标题搜索结果作为搜索结果展示给查询者,当其需要时才为其展开查看全部搜索结果。本系统采用统计服务器配合网络浏览器,将用户的全部操作行为换算成对该网页的关注程度评分值PageFocus,并发送回统计服务器来代表其内容质量,从而可以作为搜索引擎的选择“标题搜索结果”和进行结果显示排名的方法。本发明专利技术还涉及一种能够自动判断用户状态并提供恰当的网页风格与内容的方法。

【技术实现步骤摘要】

本专利技术涉及计算机网络技术,特别是利用计算机在互联网或企业内部网上提供搜索服务的搜索引擎技术。本专利技术还涉及一种获取网页用户关注度的系统及网站内容风格自适应装置与方法。
技术介绍
目前在Internet上存在着大量的“相同(或类似)来源的网页或网络服务”,例如1由同一个人或组织写作的被大量复制的文章、观点、信息网页;2由同一个人或组织采访(或发布)的被大量复制的新闻报道网页;3由同一个人或组织在BBS论坛发言帖子的转贴;5由同一个人或组织产生的不同数据格式、压缩比例的多媒体文件;6由同一个人或组织产生的可执行程序、数据、设计文件;7其他方式产生的并被广泛复制的信息内容。这些“相同(或类似)来源的网页或网络服务”在目前的搜索引擎搜索结果中被一一列举,占据大量篇幅,内容却雷同,不便查询者的浏览。目前各种搜索引擎和网页排行服务系统,均仅仅采用了点击流量和网页停留时间的方式来衡量网页的热门程度,而采取的方法主要1)搜索引擎类依靠查询者对搜索结果的点击来计算网页的热门程度,例如google、百度。2)ALEXA网站排行类依靠内嵌在浏览器上的工具条软件,把用户对超级链接的点击和网页停留时间发送回服务器(参数包括当前网页地址、页面打开时间),但是不包含其他评估方法。Alexa工作原理可参见http://www.singtaonet.com/it/it sp/t20051110 43674.html,http://www.people.com.cn/GB/it/8219/41552/41597/3109586.html。目前各种网站可以划分为如下类别类别一全部网站内容对任何用户在同一时刻均具有同样风格与内容(例如新闻网站)。类别二可以根据用户的设定显示不同的风格与内容(例如google的新闻网站)。但是这些网站,不能在实时根据用户的不同状态给出不同的显示风格与内容。
技术实现思路
为了改进上述问题的不足,本专利技术提供这样一种搜索方法,其能把因内容相同而对搜索者具有相同使用价值的搜索结果聚合成一条记录,即标题搜索结果,根据需要再展开查看其他结果的装置和方法,从而避免“标题搜索结果”由于频繁被点击而导致目标服务器访问量过大而瘫痪的,把“标题搜索结果”点击自动分散到其他搜索结果目标上的装置与方法。本专利技术还提供了这样一种系统,其利用能够和网络上的统计服务器配合的网络浏览器,将用户的全部操作行为换算成对该网页的评分,并发送回统计服务器,作为对网页的关注程度的评分,从而可以作为搜索引擎的排名方法和工具。本专利技术还提供这样一种方法利用各种可能获得的、有助于判断用户所处环境和状态的信息,在同一时刻、同一个网站内、甚至时同一个页面内,向不同状态的用户提供不同的显示风格和内容。为了实现上述目的,一种将同源信息站点搜索引擎聚合显示的搜索方法,其包括下列步骤(1)查询者通过Web浏览器或应用软件访问搜索引擎,并输入需要查询的关键词;(2)由搜索引擎找到全部符合条件的目标站点作为原始搜索结果;(3)由“同源信息处理模块”查询“成为标题搜索结果”的权力采购者的账户信息,并结合其他判断规则在原始搜索结果中选取用来作为“标题搜索结果”的对象;(4)由搜索引擎Web服务器或应用服务器只将选中的“标题搜索结果”作为搜索结果展示给查询者,并为其提供一个带有“展开查看细节或其他信息”含义的“按钮;(5)查询者还可按动与之对应的“按钮”,搜索引擎再向其展示在(2)中找到的原始搜索结果。“同源信息处理模块”有多个“(相应信息种类的)同源信息处理模块”组成,例如“同源网页处理模块”、“同源多媒体处理模块”、“同源图片处理模块”、“同源文档处理模块”、“同源软件处理模块”、“同源数据或数据库处理模块”、“同源GIS信息处理模块”、”同价值网络服务处理模块”、“同价值商业信息处理模块”等。所述“同源信息处理模块”包括如下步骤(1)首先由“信息种类判断模块”对网络搜索器收到的信息进行种类判断;(2)将相同种类的信息集中发送到“(相应信息种类的)同源信息处理模块”;(3)将由“(相应信息种类的)同源信息处理模块”处理后的搜索信息归档进入“非同源(相应信息种类的)结果信息库”或“同源(相应信息种类的)结果信息库”。(4)由系统把“非同源(相应信息种类的)结果信息库”和“同源(相应信息种类的)结果信息库”发布到Web服务器上,供查询者查询。作为另一中实现方法,也可以根据这两个数据库直接向查询者提供基于动态网页的查询服务。所述由“同源网页处理模块”处理网页信息的步骤如下所示(1)在“搜索引擎搜索部分”接收需要查询的关键词的时候,首先由“搜索结果已经发布在Web服务器上的判决器”判断该关键词是否近期已经被其他人查询过,如果被查询过,并且结果已经在“搜索引擎搜索结果Web服务器”上发布,则直接返回搜索结果,该结果中已经将具有相同来源的网页聚合成一条搜索结果,点击“同源网页”按钮后,可以在“搜索引擎搜索结果Web服务器”上看到另一个包括全部搜索结果的搜索结果网页,完成整个查询过程;(2)如果在“搜索引擎搜索部分”接收需要查询的关键词的时候,由“搜索结果已经发布在Web服务器上的判决器”判断该关键词近期没有被其他人查询过,并且也没有相应的查询结果在“搜索引擎搜索结果Web服务器”上发布则A.启动“网页搜索器”搜索“非同源网页结果数据库”和“同源网页结果数据库”找到符合搜索关键词的网页地址,并获取这些网页的内容;B.如果“网页搜索器”在“非同源网页结果数据库”和“同源网页结果数据库”中没有找到符合搜索关键词的网页地址,则返回查询者“没有符合条件网页”的结果,并且将该搜索关键词加入到下一轮更新“非同源网页结果数据库”和“同源网页结果数据库”的任务中,如果在更新过程中找到了符合条件的网页地址则根据其是否具有同源网页而选择入“非同源网页结果数据库”或“同源网页结果数据库”,这样如果再有人搜索同样的关键词是就可以找到结果; (3)由“网页内容分离器”将找到的网页内容及超级链接目标分解成多媒体、图片、文字、超级链接等种类;(4)分别由各种内容判决器产生判决结果A.由“多媒体内容判决器”产生目标网页所含“相同多媒体文件程度SMS(Same Media Score)”;B.由“图片内容判决器”产生目标网页所含“相同图片的程度SPS(Same Photo Score)”;C.由“文字内容判决器”产生目标网页所含“相同文字的程度STS(Same Text Score)”;D.由“链接内容判决器”产生目标网页所含“相同超级连接的程度SHS(Same Hyperlinks Score)”;(5)从“同源网页判决规则库”分别获取“多媒体判决权重SMP”、“图片判决权重SPP”、“文字判决权重STP”、“链接判决权重SHP”并分别与第(4)步生成的“相同多媒体文件程度SMS”、“相同图片的程度SPS”、“相同文字的程度STS”、“相同超级连接的程度SHS”做数学乘法;(6)将第(5)步获得的数学乘法结果做加法,获得网页的“同源程度SSS(SameSourc Score)”,同源程度SSS=(SMS*SMP)+(SPS*SPP)+(STS*STP)+(SHS*SHP);(7)判断该网页的“同源程度SSS”本文档来自技高网
...

【技术保护点】
一种同源信息站点搜索引擎聚合显示方法,其包括下列步骤:    (1)查询者通过Web浏览器或应用软件访问搜索引擎,并输入需要查询的关键词;    (2)由搜索引擎找到全部符合条件的目标站点作为原始搜索结果;    (3)由“同源信息处理模块”查询标题搜索结果权力采购者的账户信息,并结合其它判断规则在原始搜索结果中选取用来作为标题搜索结果的对象;    (4)由搜索引擎Web服务器或应用服务器只将选中的标题搜索结果作为搜索结果展示给查询者,并为其提供一个带有展开查看细节或其它信息含义的按钮;    (5)查询者还可按动与之对应的按钮,搜索引擎再向其展示在(2)中找到的原始搜索结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:王东
申请(专利权)人:王东
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1