搜索网页的方法和建立数据库的方法技术

技术编号:4010491 阅读:267 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于搜索引擎领域,特别是涉及搜索网页的方法和建立数据库的方法及其在商品搜索中的应用。利用能够从互联网上自动收集网页的蜘蛛程序从互联网提取各个网站的信息,包括网页文字、图片、视频、音声等建立数据库。在完成根据用户搜索条件进行第一轮搜索后,从与用户搜索条件匹配最好或满足其他条件下的每个行数据中选择一个或多个新的信息数据作为新的搜索条件进行下一轮搜索。重复此过程直至搜索完成后按一定的排列顺序返回结果。也可以用上述方法在原来的索引数据库中加入分类重组索引数据库。这样有助于挖掘更深层的相关信息。本发明专利技术可以广泛应用于互联网搜索、移动终端搜索等领域,尤其适用于网上购物的商品搜索等领域。

【技术实现步骤摘要】

本专利技术属于搜索引擎领域,特别是涉及利用基于内容的多媒体搜索技术和基于关 键词的文本搜索技术以及它们的组合技术进行及其 在商品搜索中的应用。
技术介绍
单纯基于文本使用关键词从互联网中搜索网页信息、图片、视频、音乐等的著名搜 索引擎有百度、谷歌、必应和雅虎等。但是它们的索引数据库通常只包括网页地址(URL)、编 码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等。而且搜索条件一 般也只限于关键词。
技术实现思路
本专利技术所要解决的技术问题是更深层次的信息搜索。本专利技术为了解决上述技术问 题所采用的技术方案之一是建立包含网页基本信息、图片、视频、音声等信息的多维信息 索引数据库。其中网页基本信息包括网页地址(URL)、编码类型、关键词、关键词位置、生成 时间、大小和与其他网页的链接关系等。图片、视频、音声等信息则包括从网页中的图片、视 频、音声等信息中提取的特征值,譬如图像的颜色、形状、纹理、空间关系等特征值、以及生 成时间、大小、标注、格式等。搜索时,以计算机、手机等输入设备取得一个或多个搜索条件, 系统根据需要进行特征值抽取等处理后由搜索系统程序从上述多维信息索本文档来自技高网...

【技术保护点】
一种网页的搜索方法,其特征在于把网站的信息,网页基本信息、图片、视频、音声等信息,其中网页基本信息包括网页所在URL、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等,图片、视频、音声等信息则包括从图片、视频、音声等信息中提取的特征值,如图像的颜色、形状、纹理、空间关系等,建立多维信息索引数据库,然后在多维信息数据空间中由搜索系统程序从多维信息索引数据中找到完全符合用户搜索条件、或计算用户搜索条件与目标数据之间的相似程度,实现第一轮对多维数据的搜索,之后从上述搜索结果中指定一个或多个,譬如匹配度最高的一个多维行数据中选择一个或多个其他信息数据作为新的搜索条件进行下一轮搜索,...

【技术特征摘要】

【专利技术属性】
技术研发人员:唐堂正明
申请(专利权)人:苏州搜图网络技术有限公司
类型:发明
国别省市:32[中国|江苏]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1