一种网络数据信息的搜索方法技术

技术编号:9596820 阅读:126 留言:0更新日期:2014-01-23 02:19
本发明专利技术创造提供一种网络数据信息的搜索方法,包括初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;Sphinx和mysql整合;php和spider整合,PHP和MySQL整合,php技术为一种服务器端执行的嵌入html文档的脚本语言;设置Sphinx为php技术提供搜索API接口;为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供搜索功能;php和spider整合生成蜘蛛爬行程序。该方法准确抓取互联网上的企业网站以及准确的在搜索结果中展现出来,实现商业网站的抓取、收录、查询等功能。

【技术实现步骤摘要】
【专利摘要】本专利技术创造提供,包括初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;Sphinx和mysql整合;php和spider整合,PHP和MySQL整合,php技术为一种服务器端执行的嵌入html文档的脚本语言;设置Sphinx为php技术提供搜索API接口;为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供搜索功能;php和spider整合生成蜘蛛爬行程序。该方法准确抓取互联网上的企业网站以及准确的在搜索结果中展现出来,实现商业网站的抓取、收录、查询等功能。【专利说明】
本专利技术创造涉及网络检索
,尤其是。
技术介绍
目前,互联网上有很多种搜索引擎,其技术是根据用户提供的文字信息在网上找出相关的信息资料,并对这些信息进行归类,但这些搜索方式只能在用户有明确意向的情况下起到作用,当用户不明确自己的意向时,该所索引擎所提供的信息往往很有限,原因在于该搜索引擎不能抓取整个网页的信息而只抓取瓶颈,同时是其存储技术和技术处理达不到。
技术实现思路
本专利技术创造要解决的问题是提供网络数据信息的搜索方法,应用此搜索引擎能突破目前的搜索信息量少的问题,实现方便快捷的抓取互联网上的企业网站并且能够准确在搜索结果中显现出来。为解决上述技术问题,本专利技术创造采用的技术方案是:,其特征在于:包括如下步骤:A.提供一个初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;其中Sphinx和mysql整合;php和spider整合,PHP和MySQL整合提供一地电子商务平台;B.运行脚本语言,其中php技术为一种服务器端执行的嵌入html文档的脚本语言;C.设置Sphinx全文搜索引擎为php技术提供搜索API接口;D.进一步为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索;E.促使php和spider整合生成蜘蛛爬行程序,向搜索引擎提交网站后,Spider就会自动对整个网站进行索引。进一步,Sphinx全文搜索引擎支持高速建立索引,并且支持分布式检索。进一步,Sphinx全文搜索引擎支持基于短语和基于统计的复合结果排序机制、支持任意数量的文件字段(数值属性或全文检索属性)、支持“完全匹配”,“短语匹配”、“任一匹配”中任一种作为Mysql的存储引擎。进一步,Sphinx全文搜索引擎不负责文本字段的存储,sphinx全文搜索引擎只会将查询结果的ID号等非文本信息告知客户。再进一步,客户根据sphinx全文搜索引擎提供的ID号去查询MySQL数据库,或者从Memcachedb等其他的存储中取得。更进一步,创建一张Sphinx类型表,将MyISAM表的主键ID和Sphinx表的ID作一个JOIN联合查询。本专利技术创造具有的优点和积极效果是:准确的抓取到互联网上的企业网站以及准确的在搜索结果中展现出来,项目采用B/S架构,MVC模式开发。整合sphinx全文搜索引擎、spider蜘蛛爬行程序,实现商业网站的抓取、收录、查询等高级功能【具体实施方式】现对本专利技术做进一步的说明,,包括如下步骤:A.提供一个初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;其中Sphinx和mysql整合;php和spider整合,PHP和MySQL整合提供一地电子商务平台;B.运行脚本语言,其中php技术为一种服务器端执行的嵌入html文档的脚本语言;C.设置Sphinx全文搜索引擎为php技术提供搜索API接口;D.进一步为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索;E.促使php和spider整合生成蜘蛛爬行程序,向搜索引擎提交网站后,Spider就会自动对整个网站进行索引。Sphinx全文搜索引擎支持高速建立索引,并且支持分布式检索。Sphinx全文搜索引擎支持基于短语和基于统计的复合结果排序机制、支持任意数量的文件字段(数值属性或全文检索属性)、支持不同的搜索模式(“完全匹配”,“短语匹配”和“任一匹配”)支持作为Mysql的存储引擎。Sphinx全文搜索引擎不负责文本字段的存储,sphinx全文搜索引擎只会将查询结果的ID号等非文本信息告知客户。客户根据sphinx全文搜索引擎提供的ID号去查询MySQL数据库,或者从Memcachedb等其他的存储中取得。创建一张Sphinx类型表,将MyISAM表的主键ID和Sphinx表的ID作一个JOIN联合查询。网络数据信息的搜索方法应用于B2B平台,即电子商务平台,该平台基于PHP+MySQL,采用标准化开发,实现客户购物、求职、商务、视频,产品行情等搜索。以上对本专利技术创造的一个实施例进行了详细说明,但所述内容仅为本专利技术创造的较佳实施例,不能被认为用于限定本专利技术创造的实施范围。凡依本专利技术创造申请范围内所做的均等变化与改进等,均应属于本专利技术创造的专利涵盖范围内。【权利要求】1.,其特征在于:包括如下步骤: A.提供一个初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;其中Sphinx和mysql整合;php和spider整合,PHP和MySQL整合提供一地电子商务平台; B.运行脚本语言,其中php技术为一种服务器端执行的嵌入html文档的脚本语言; C.设置Sphinx全文搜索引擎为php技术提供搜索API接口; D.进一步为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索; E.促使php和spider整合生成蜘蛛爬行程序,向搜索引擎提交网站后,Spider就会自动对整个网站进行索弓I。2.根据权利要求1所述的网络数据信息的搜索方法,其特征在于=Sphinx全文搜索引擎支持高速建立索引,并且支持分布式检索。3.根据权利要求1所述的网络数据信息的搜索方法,其特征在于=Sphinx全文搜索引擎支持基于短语和基于统计的复合结果排序机制、支持任意数量的文件字段(数值属性或全文检索属性)、支持“完全匹配”、“短语匹配”、“任一匹配”中任一种作为Mysql的存储引擎。4.根据权利要求1所述的网络数据信息的搜索方法,其特征在于=Sphinx全文搜索引擎不负责文本字段的存储,sphinx全文搜索引擎只会将查询结果的ID号等非文本信息告知客户。5.根据权利要求4所述的网络数据信息的搜索方法,其特征在于:客户根据sphinx全文搜索引擎提供的ID号去查询MySQL数据库,或者从Memcachedb等其他的存储中取得。6.根据权利要求1所述的网络数据信息的搜索方法,其特征在于:创建一张Sphinx类型表,将MyISAM表的主键ID和Sphinx表的I本文档来自技高网...

【技术保护点】
一种网络数据信息的搜索方法,其特征在于:包括如下步骤:A.提供一个初始数据平台,该平台包括php技术、Sphinx全文搜索引擎、spider蜘蛛爬行程序、mysql数据库;采用B/S架构,MVC模式开发;其中Sphinx和mysql整合;php和spider整合,PHP和MySQL整合提供一地电子商务平台;B.运行脚本语言,其中php技术为一种服务器端执行的嵌入html文档的脚本语言;C.设置Sphinx全文搜索引擎为php技术提供搜索API接口;D.进一步为mysql数据库提供一存储引擎插件,Sphinx和mysql整合提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索;E.促使php和spider整合生成蜘蛛爬行程序,向搜索引擎提交网站后,Spider就会自动对整个网站进行索引。

【技术特征摘要】

【专利技术属性】
技术研发人员:于泉
申请(专利权)人:金铠川天津科技发展有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1