当前位置: 首页 > 专利查询>王义东专利>正文

一种网页搜索与展示的方法技术

技术编号:8703807 阅读:168 留言:0更新日期:2013-05-16 17:23
本发明专利技术适用于网络资讯智能获取技术领域,提供了一种网页搜索与展示的方法。针对已知网站通过输入URL及关键词直接搜索,针对未知网站输入语义导向检索词,进行二次或三次复合搜索,并通过扩展查询、用户反馈来进一步提高资源获取效率和精度,通过网页摘要关键词提取和排序来进一步为用户直观展示检索词与网页主题之间的关联关系,提高了用户体验。

【技术实现步骤摘要】

本专利技术涉及数据搜索和数据分析领域,具体地,涉及。
技术介绍
由于当前谷歌、百度、有道、即刻等网络搜索引擎搜则有,不搜则无,网站、文本等一起海量出现、各种资讯网站的不断涌现和频繁更新,“信息大爆炸”时代到来等,致使网络目标资讯获取的时间成本逐渐增高,时效性严重滞后,资讯认知范围的片面性日益加剧。信息对称程度愈加低下导致了大量的机会损失和发展损失。同时,现有的各种搜索引擎并不能针对海量信息数据,以一种精简有效的搜索方式,来真正的针对用户的不同搜索需求,进行不同模式下的有效搜索;并且,用户在进行搜索时,也并没有真正的能够有效的参考之前的用户的搜索历史信息,对于一个用户来说,他通过搜索获得的网页列表在很多时候排在前面的并不一定是最符合他需要的网页;并且,用户在很多时候也很难从搜索获得的网页列表中一目了然的看出他使用的搜索词与网页列表之间的关联关系。
技术实现思路
本专利技术的专利技术目的在于解决上述搜索引擎的机械性、静态性、低效性和不直观性,以及用户对资讯认知范围的片面性所导致的目标资讯获取缺陷。具体技术方案如下:,其特征在于,所述方法包括下述步骤:用户终端判断待搜索的网页是否为可访问的已知网站,针对已知网站,通过输入其URL地址、一个或多个检索词,进行定时或实时匹配搜索,生成目标资讯标题列表;针对未知网站,通过输入一个或多个第一语义导向检索词,进行定时或实时穷尽式匹配搜索网络中的资讯信息,生成供浏览的资源化海量资讯标题列表,并通过输入一个或多个第二语义导向检索词,在资源化海量资讯标题列表对应的网页中进行二次复合搜索,生成目标资讯标题列表;将上述生成的目标资讯标题列表发送至用户终端,进行定时或实时展示。作为本专利技术的进一步改进,在针对已知网站生成目标资讯标题列表时,凡同时含有多个检索词其中一部分的资讯标题,视为目标资讯标题,直接生成目标资讯标题列表。作为本专利技术的进一步改进,在针对未知网站生成目标资讯标题列表时,所述第一语义导向检索词代表特定资讯领域或方向。作为本专利技术的进一步改进,在针对未知网站,输入一个或多个第一语义导向检索词,进行定时或实时穷尽式匹配搜索网络中的资讯信息时,对第一语义导向检索词进行检索词汇扩展,获取与第一语义导向检索词具有相似含义的关联词汇,并根据关联词汇进行扩展搜索查询。作为本专利技术的进一步改进,分别获得第一语义导向检索词对应的网页搜索集合和关联词汇扩展搜索获得的网页搜索集合,并计算两个集合的网页相似度,根据相似度进行两个集合的合并,并生成供浏览的资源化海量资讯标题列表。作为本专利技术的进一步改进,通过如下方式进行相似度的计算:I_(W1,W2).1 wl H w2权利要求1.,其特征在于,所述方法包括下述步骤: 用户终端判断待搜索的网页是否为可访问的已知网站, 针对已知网站,通过输入其URL地址、一个或多个检索词,进行定时或实时匹配搜索,生成目标资讯标题列表; 针对未知网站,通过输入一个或多个第一语义导向检索词,进行定时或实时穷尽式匹配搜索网络中的资讯信息,生成供浏览的资源化海量资讯标题列表,并通过输入一个或多个第二语义导向检索词,在资源化海量资讯标题列表对应的网页中进行二次复合搜索,生成目标资讯标题列表; 将上述生成的目标资讯标题列表发送至用户终端,进行定时或实时展示。2.如权利要求1所述的网页搜索与展示的方法,其特征在于,在针对已知网站生成目标资讯标题列表时,凡同时含有多个检索词其中一部分的资讯标题,视为目标资讯标题,直接生成目标资讯标题列表。3.如权利要求1所述的网页搜索与展示的方法,其特征在于,在针对未知网站生成目标资讯标题列表时,所述第一语义导向检索词代表特定资讯领域或方向。4.如权利要求1所述的网页搜索与展示的方法,其特征在于,在针对未知网站,输入一个或多个第一语义导向检索词,进行定时或实时穷尽式匹配搜索网络中的资讯信息时,对第一语义导向检索词进行检索词汇扩展,获取与第一语义导向检索词具有相似含义的关联词汇,并根据关联词汇进行扩展搜索查询。5.如权利要求4所述的网页搜索与展示的方法,其特征在于,其进一步包括:分别获得第一语义导向检索词对应的网页搜索集合和关联词汇扩展搜索获得的网页搜索集合,并计算两个集合的网页相似度,根据相似度进行两个集合的合并,并生成供浏览的资源化海量资讯标题列表。6.如权利要求5所述的网页搜索与展示的方法,其特征在于,通过如下方式进行相似 度的计算:7.如权利要求5所述的网页搜索与展示的方法,其特征在于,通过如下方式进行相似 度的计算:8.如权利要求6或7所述的网页搜索与展示的方法,其特征在于,将相似度的值和预定阈值进行比较,当相似度的值小于预定阈值时,将扩展查询结果调整到原始查询结果的后面;当相似度的值大于预定阈值时,对第一语义导向检索词对应的网页搜索集合和扩展对应的网页搜索集合进行合并。9.如权利要求1所述的网页搜索与展示的方法,其特征在于,接收终端通过接收目标资讯标题列表、资源化海量资讯标题列表来获得搜索结果的展示信息,用户针对接收到的目标资讯标题列表、资源化海量资讯标题列表相关的展示信息能够进行反馈,并由独立于网页之外的应用程序对相关网页的用户个性化反馈信息进行收集,基于该反馈信息来进一步调整和优化这两个列表中的网页顺序,并根据排序结果进行列表的进一步展现。10.如权利要求9所述的网页搜索与展示的方法,其特征在于,基于用户针对各网页的反馈信息数目,计算获得各网页的排序因子,当排序因子大于一预先设定的阈值时,认为该排序因子有效并进行排序因子更新,并根据最终更新后的排序因子来对各个网页进行排序。11.如权利要求10所述的网页搜索与展示的方法,其特征在于,基于以下方式计算获得各网页的排序因子:基于收集到用户针对各网页的反馈信息分别计算各网页的推荐数目,推荐数目高的对应网页的排序因子大;或,基于收集到用户针对各网页的反馈信息分别计算各网页的网页评分,通过进一步计算评分的平均值来根据评分确定排序因子。12.如权利要求9所述的网页搜索与展示的方法,其特征在于,用户在对展示信息进行反馈之前,需要先接收相应的验证信息,验证匹配通过之后才能有权限进行反馈。13.如权利要求12所述的网页搜索与展示的方法,其特征在于,用户提交反馈信息后,先由独立于网页之外的应用程序判断用户反馈是否符合规定,若用户反馈符合规定,则存储相应的反馈信息;若不符合规定,则向用户发送相应的提示信息。14.如权利要求13所述的网页搜索与展示的方法,其特征在于,对用户反馈中不符合规定的次数进行统计,若次数超过阈值,则发送警告信息。15.如权利要求14所述的网页搜索与展示的方法,其特征在于,仅仅存储用户最后一次提交的反馈信息。`16.如权利要求1所述的网页搜索与展示的方法,其特征在于,在根据已知网站或未知网站生成目标资讯标题列表后,进一步通过对目标资讯标题列表中的页面进行分析,抽取摘要关键词,得到与检索词对应的摘要关键词集合,并对集合中的各摘要关键词分别进行加权,根据权值对摘要关键词进行排序。17.如权利要求16所述的网页搜索与展示的方法,其特征在于,将加权排序后的前M个摘要关键词作为与检索词对应的检索结果属性信息,作为目标资讯标题列表中的网页的备注信息进行进一步展示。18.如权利要求16所述的网本文档来自技高网...

【技术保护点】
一种网页搜索与展示的方法,其特征在于,所述方法包括下述步骤:用户终端判断待搜索的网页是否为可访问的已知网站,针对已知网站,通过输入其URL地址、一个或多个检索词,进行定时或实时匹配搜索,生成目标资讯标题列表;针对未知网站,通过输入一个或多个第一语义导向检索词,进行定时或实时穷尽式匹配搜索网络中的资讯信息,生成供浏览的资源化海量资讯标题列表,并通过输入一个或多个第二语义导向检索词,在资源化海量资讯标题列表对应的网页中进行二次复合搜索,生成目标资讯标题列表;将上述生成的目标资讯标题列表发送至用户终端,进行定时或实时展示。

【技术特征摘要】

【专利技术属性】
技术研发人员:王义东
申请(专利权)人:王义东
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1